Lmod has detected the following error: The following module(s) are unknown:
"buildenv-gcccuda/12.1.1-gcc12.3.0"

Please check the spelling or version number. Also try "module spider ..."
It is also possible your cache file is out-of-date; it may help to try:
  $ module --ignore_cache load "buildenv-gcccuda/12.1.1-gcc12.3.0"

Also make sure that all modulefiles written in TCL start with the string
#%Module


Already on 'bimamba'
Your branch is up to date with 'origin/bimamba'.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/hydra/_internal/defaults_list.py:251: UserWarning: In 'training': Defaults list is missing `_self_`. See https://hydra.cc/docs/1.2/upgrades/1.0_to_1.1/default_composition_order for more information
  warnings.warn(msg, UserWarning)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/hydra/_internal/defaults_list.py:251: UserWarning: In 'training': Defaults list is missing `_self_`. See https://hydra.cc/docs/1.2/upgrades/1.0_to_1.1/default_composition_order for more information
  warnings.warn(msg, UserWarning)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/hydra/_internal/defaults_list.py:251: UserWarning: In 'training': Defaults list is missing `_self_`. See https://hydra.cc/docs/1.2/upgrades/1.0_to_1.1/default_composition_order for more information
  warnings.warn(msg, UserWarning)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/hydra/_internal/defaults_list.py:251: UserWarning: In 'training': Defaults list is missing `_self_`. See https://hydra.cc/docs/1.2/upgrades/1.0_to_1.1/default_composition_order for more information
  warnings.warn(msg, UserWarning)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/hydra/_internal/defaults_list.py:251: UserWarning: In 'training': Defaults list is missing `_self_`. See https://hydra.cc/docs/1.2/upgrades/1.0_to_1.1/default_composition_order for more information
  warnings.warn(msg, UserWarning)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/hydra/_internal/defaults_list.py:251: UserWarning: In 'training': Defaults list is missing `_self_`. See https://hydra.cc/docs/1.2/upgrades/1.0_to_1.1/default_composition_order for more information
  warnings.warn(msg, UserWarning)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/hydra/_internal/defaults_list.py:251: UserWarning: In 'training': Defaults list is missing `_self_`. See https://hydra.cc/docs/1.2/upgrades/1.0_to_1.1/default_composition_order for more information
  warnings.warn(msg, UserWarning)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/hydra/_internal/defaults_list.py:251: UserWarning: In 'training': Defaults list is missing `_self_`. See https://hydra.cc/docs/1.2/upgrades/1.0_to_1.1/default_composition_order for more information
  warnings.warn(msg, UserWarning)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/fabric/__init__.py:40: pkg_resources is deprecated as an API. See https://setuptools.pypa.io/en/latest/pkg_resources.html. The pkg_resources package is slated for removal as early as 2025-11-30. Refrain from using this package or pin to Setuptools<81.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/fabric/__init__.py:40: pkg_resources is deprecated as an API. See https://setuptools.pypa.io/en/latest/pkg_resources.html. The pkg_resources package is slated for removal as early as 2025-11-30. Refrain from using this package or pin to Setuptools<81.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/fabric/__init__.py:40: pkg_resources is deprecated as an API. See https://setuptools.pypa.io/en/latest/pkg_resources.html. The pkg_resources package is slated for removal as early as 2025-11-30. Refrain from using this package or pin to Setuptools<81.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/fabric/__init__.py:40: pkg_resources is deprecated as an API. See https://setuptools.pypa.io/en/latest/pkg_resources.html. The pkg_resources package is slated for removal as early as 2025-11-30. Refrain from using this package or pin to Setuptools<81.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/fabric/__init__.py:40: pkg_resources is deprecated as an API. See https://setuptools.pypa.io/en/latest/pkg_resources.html. The pkg_resources package is slated for removal as early as 2025-11-30. Refrain from using this package or pin to Setuptools<81.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/fabric/__init__.py:40: pkg_resources is deprecated as an API. See https://setuptools.pypa.io/en/latest/pkg_resources.html. The pkg_resources package is slated for removal as early as 2025-11-30. Refrain from using this package or pin to Setuptools<81.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/fabric/__init__.py:40: pkg_resources is deprecated as an API. See https://setuptools.pypa.io/en/latest/pkg_resources.html. The pkg_resources package is slated for removal as early as 2025-11-30. Refrain from using this package or pin to Setuptools<81.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/fabric/__init__.py:40: pkg_resources is deprecated as an API. See https://setuptools.pypa.io/en/latest/pkg_resources.html. The pkg_resources package is slated for removal as early as 2025-11-30. Refrain from using this package or pin to Setuptools<81.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/torchvision/models/_utils.py:208: UserWarning: The parameter 'pretrained' is deprecated since 0.13 and may be removed in the future, please use 'weights' instead.
  warnings.warn(
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/torchvision/models/_utils.py:223: UserWarning: Arguments other than a weight enum or `None` for 'weights' are deprecated since 0.13 and may be removed in the future. The current behavior is equivalent to passing `weights=AlexNet_Weights.IMAGENET1K_V1`. You can also use `weights=AlexNet_Weights.DEFAULT` to get the most up-to-date weights.
  warnings.warn(msg)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/torchvision/models/_utils.py:208: UserWarning: The parameter 'pretrained' is deprecated since 0.13 and may be removed in the future, please use 'weights' instead.
  warnings.warn(
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/torchvision/models/_utils.py:223: UserWarning: Arguments other than a weight enum or `None` for 'weights' are deprecated since 0.13 and may be removed in the future. The current behavior is equivalent to passing `weights=AlexNet_Weights.IMAGENET1K_V1`. You can also use `weights=AlexNet_Weights.DEFAULT` to get the most up-to-date weights.
  warnings.warn(msg)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/torchvision/models/_utils.py:208: UserWarning: The parameter 'pretrained' is deprecated since 0.13 and may be removed in the future, please use 'weights' instead.
  warnings.warn(
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/torchvision/models/_utils.py:223: UserWarning: Arguments other than a weight enum or `None` for 'weights' are deprecated since 0.13 and may be removed in the future. The current behavior is equivalent to passing `weights=AlexNet_Weights.IMAGENET1K_V1`. You can also use `weights=AlexNet_Weights.DEFAULT` to get the most up-to-date weights.
  warnings.warn(msg)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/torchvision/models/_utils.py:208: UserWarning: The parameter 'pretrained' is deprecated since 0.13 and may be removed in the future, please use 'weights' instead.
  warnings.warn(
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/torchvision/models/_utils.py:223: UserWarning: Arguments other than a weight enum or `None` for 'weights' are deprecated since 0.13 and may be removed in the future. The current behavior is equivalent to passing `weights=AlexNet_Weights.IMAGENET1K_V1`. You can also use `weights=AlexNet_Weights.DEFAULT` to get the most up-to-date weights.
  warnings.warn(msg)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/torchvision/models/_utils.py:208: UserWarning: The parameter 'pretrained' is deprecated since 0.13 and may be removed in the future, please use 'weights' instead.
  warnings.warn(
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/torchvision/models/_utils.py:223: UserWarning: Arguments other than a weight enum or `None` for 'weights' are deprecated since 0.13 and may be removed in the future. The current behavior is equivalent to passing `weights=AlexNet_Weights.IMAGENET1K_V1`. You can also use `weights=AlexNet_Weights.DEFAULT` to get the most up-to-date weights.
  warnings.warn(msg)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/torchvision/models/_utils.py:208: UserWarning: The parameter 'pretrained' is deprecated since 0.13 and may be removed in the future, please use 'weights' instead.
  warnings.warn(
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/torchvision/models/_utils.py:223: UserWarning: Arguments other than a weight enum or `None` for 'weights' are deprecated since 0.13 and may be removed in the future. The current behavior is equivalent to passing `weights=AlexNet_Weights.IMAGENET1K_V1`. You can also use `weights=AlexNet_Weights.DEFAULT` to get the most up-to-date weights.
  warnings.warn(msg)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lpips/lpips.py:107: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
  self.load_state_dict(torch.load(model_path, map_location='cpu'), strict=False)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lpips/lpips.py:107: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
  self.load_state_dict(torch.load(model_path, map_location='cpu'), strict=False)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lpips/lpips.py:107: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
  self.load_state_dict(torch.load(model_path, map_location='cpu'), strict=False)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lpips/lpips.py:107: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
  self.load_state_dict(torch.load(model_path, map_location='cpu'), strict=False)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lpips/lpips.py:107: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
  self.load_state_dict(torch.load(model_path, map_location='cpu'), strict=False)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lpips/lpips.py:107: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
  self.load_state_dict(torch.load(model_path, map_location='cpu'), strict=False)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/torchvision/models/_utils.py:208: UserWarning: The parameter 'pretrained' is deprecated since 0.13 and may be removed in the future, please use 'weights' instead.
  warnings.warn(
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/torchvision/models/_utils.py:223: UserWarning: Arguments other than a weight enum or `None` for 'weights' are deprecated since 0.13 and may be removed in the future. The current behavior is equivalent to passing `weights=AlexNet_Weights.IMAGENET1K_V1`. You can also use `weights=AlexNet_Weights.DEFAULT` to get the most up-to-date weights.
  warnings.warn(msg)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/torchvision/models/_utils.py:208: UserWarning: The parameter 'pretrained' is deprecated since 0.13 and may be removed in the future, please use 'weights' instead.
  warnings.warn(
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/torchvision/models/_utils.py:223: UserWarning: Arguments other than a weight enum or `None` for 'weights' are deprecated since 0.13 and may be removed in the future. The current behavior is equivalent to passing `weights=AlexNet_Weights.IMAGENET1K_V1`. You can also use `weights=AlexNet_Weights.DEFAULT` to get the most up-to-date weights.
  warnings.warn(msg)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lpips/lpips.py:107: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
  self.load_state_dict(torch.load(model_path, map_location='cpu'), strict=False)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lpips/lpips.py:107: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
  self.load_state_dict(torch.load(model_path, map_location='cpu'), strict=False)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/pytorch/plugins/precision/amp.py:54: `torch.cuda.amp.GradScaler(args...)` is deprecated. Please use `torch.amp.GradScaler('cuda', args...)` instead.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/pytorch/plugins/precision/amp.py:54: `torch.cuda.amp.GradScaler(args...)` is deprecated. Please use `torch.amp.GradScaler('cuda', args...)` instead.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/pytorch/plugins/precision/amp.py:54: `torch.cuda.amp.GradScaler(args...)` is deprecated. Please use `torch.amp.GradScaler('cuda', args...)` instead.
[36mOutputs will be saved to:[39m /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_b_joint_ckpt_40k_fixed
Will load checkpoint from /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_a_retrain_epoch3_step40000_oasis500m_ditreset_noxattn.ckpt
[36mExecuting task:[39m training out of ['training']
[2026-04-20 11:58:58,971][pytorch_lightning.utilities.rank_zero][INFO] - Using 16bit Automatic Mixed Precision (AMP)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/pytorch/plugins/precision/amp.py:54: `torch.cuda.amp.GradScaler(args...)` is deprecated. Please use `torch.amp.GradScaler('cuda', args...)` instead.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/pytorch/plugins/precision/amp.py:54: `torch.cuda.amp.GradScaler(args...)` is deprecated. Please use `torch.amp.GradScaler('cuda', args...)` instead.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/pytorch/plugins/precision/amp.py:54: `torch.cuda.amp.GradScaler(args...)` is deprecated. Please use `torch.amp.GradScaler('cuda', args...)` instead.
/proj/cvl/users/x_fahkh2/WorldMem_Repro/experiments/exp_base.py:74: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
  ckpt = torch.load(checkpoint_path, map_location=torch.device('cpu'))
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/pytorch/plugins/precision/amp.py:54: `torch.cuda.amp.GradScaler(args...)` is deprecated. Please use `torch.amp.GradScaler('cuda', args...)` instead.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/pytorch/plugins/precision/amp.py:54: `torch.cuda.amp.GradScaler(args...)` is deprecated. Please use `torch.amp.GradScaler('cuda', args...)` instead.
/proj/cvl/users/x_fahkh2/WorldMem_Repro/experiments/exp_base.py:74: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
  ckpt = torch.load(checkpoint_path, map_location=torch.device('cpu'))
/proj/cvl/users/x_fahkh2/WorldMem_Repro/experiments/exp_base.py:74: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
  ckpt = torch.load(checkpoint_path, map_location=torch.device('cpu'))
[2026-04-20 11:58:59,744][pytorch_lightning.utilities.rank_zero][INFO] - GPU available: True (cuda), used: True
[2026-04-20 11:58:59,744][pytorch_lightning.utilities.rank_zero][INFO] - TPU available: False, using: 0 TPU cores
[2026-04-20 11:58:59,744][pytorch_lightning.utilities.rank_zero][INFO] - IPU available: False, using: 0 IPUs
[2026-04-20 11:58:59,744][pytorch_lightning.utilities.rank_zero][INFO] - HPU available: False, using: 0 HPUs
[2026-04-20 11:58:59,745][pytorch_lightning.utilities.rank_zero][INFO] - `Trainer(limit_val_batches=1)` was configured so 1 batch will be used.
/proj/cvl/users/x_fahkh2/WorldMem_Repro/experiments/exp_base.py:74: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
  ckpt = torch.load(checkpoint_path, map_location=torch.device('cpu'))
/proj/cvl/users/x_fahkh2/WorldMem_Repro/experiments/exp_base.py:74: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
  ckpt = torch.load(checkpoint_path, map_location=torch.device('cpu'))
/proj/cvl/users/x_fahkh2/WorldMem_Repro/experiments/exp_base.py:74: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
  ckpt = torch.load(checkpoint_path, map_location=torch.device('cpu'))
/proj/cvl/users/x_fahkh2/WorldMem_Repro/experiments/exp_base.py:74: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
  ckpt = torch.load(checkpoint_path, map_location=torch.device('cpu'))
/proj/cvl/users/x_fahkh2/WorldMem_Repro/experiments/exp_base.py:74: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
  ckpt = torch.load(checkpoint_path, map_location=torch.device('cpu'))
[2026-04-20 11:59:14,620][pytorch_lightning.utilities.rank_zero][INFO] - Model weights loaded.
[36mOutputs will be saved to:[39m /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_b_joint_ckpt_40k_fixed
Will load checkpoint from /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_a_retrain_epoch3_step40000_oasis500m_ditreset_noxattn.ckpt
[36mExecuting task:[39m training out of ['training']
[2026-04-20 11:59:20,718][lightning.fabric.utilities.distributed][INFO] - Initializing distributed: GLOBAL_RANK: 6, MEMBER: 7/8
INFO: Initializing distributed: GLOBAL_RANK: 6, MEMBER: 7/8
INFO: Initializing distributed: GLOBAL_RANK: 0, MEMBER: 1/8
[2026-04-20 11:59:22,027][lightning.fabric.utilities.distributed][INFO] - Initializing distributed: GLOBAL_RANK: 0, MEMBER: 1/8
[36mOutputs will be saved to:[39m /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_b_joint_ckpt_40k_fixed
Will load checkpoint from /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_a_retrain_epoch3_step40000_oasis500m_ditreset_noxattn.ckpt
[36mExecuting task:[39m training out of ['training']
[2026-04-20 11:59:22,914][lightning.fabric.utilities.distributed][INFO] - Initializing distributed: GLOBAL_RANK: 5, MEMBER: 6/8
INFO: Initializing distributed: GLOBAL_RANK: 5, MEMBER: 6/8
INFO: Initializing distributed: GLOBAL_RANK: 4, MEMBER: 5/8
[36mOutputs will be saved to:[39m /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_b_joint_ckpt_40k_fixed
Will load checkpoint from /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_a_retrain_epoch3_step40000_oasis500m_ditreset_noxattn.ckpt
[36mExecuting task:[39m training out of ['training']
[2026-04-20 11:59:23,821][lightning.fabric.utilities.distributed][INFO] - Initializing distributed: GLOBAL_RANK: 4, MEMBER: 5/8
INFO: Initializing distributed: GLOBAL_RANK: 3, MEMBER: 4/8
[36mCreated output directory: /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_b_joint_ckpt_40k_fixed[39m
[36mOutputs will be saved to:[39m /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_b_joint_ckpt_40k_fixed
Will load checkpoint from /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_a_retrain_epoch3_step40000_oasis500m_ditreset_noxattn.ckpt
[36mExecuting task:[39m training out of ['training']
[2026-04-20 11:59:23,933][lightning.fabric.utilities.distributed][INFO] - Initializing distributed: GLOBAL_RANK: 3, MEMBER: 4/8
[36mOutputs will be saved to:[39m /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_b_joint_ckpt_40k_fixed
Will load checkpoint from /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_a_retrain_epoch3_step40000_oasis500m_ditreset_noxattn.ckpt
[36mExecuting task:[39m training out of ['training']
[2026-04-20 11:59:23,946][lightning.fabric.utilities.distributed][INFO] - Initializing distributed: GLOBAL_RANK: 1, MEMBER: 2/8
INFO: Initializing distributed: GLOBAL_RANK: 1, MEMBER: 2/8
INFO: Initializing distributed: GLOBAL_RANK: 7, MEMBER: 8/8
[36mOutputs will be saved to:[39m /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_b_joint_ckpt_40k_fixed
Will load checkpoint from /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_a_retrain_epoch3_step40000_oasis500m_ditreset_noxattn.ckpt
[36mExecuting task:[39m training out of ['training']
[2026-04-20 11:59:24,083][lightning.fabric.utilities.distributed][INFO] - Initializing distributed: GLOBAL_RANK: 7, MEMBER: 8/8
[36mOutputs will be saved to:[39m /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_b_joint_ckpt_40k_fixed
Will load checkpoint from /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_a_retrain_epoch3_step40000_oasis500m_ditreset_noxattn.ckpt
[36mExecuting task:[39m training out of ['training']
[2026-04-20 11:59:24,938][lightning.fabric.utilities.distributed][INFO] - Initializing distributed: GLOBAL_RANK: 2, MEMBER: 3/8
INFO: Initializing distributed: GLOBAL_RANK: 2, MEMBER: 3/8
[2026-04-20 11:59:28,758][pytorch_lightning.utilities.rank_zero][INFO] - ----------------------------------------------------------------------------------------------------
distributed_backend=nccl
All distributed processes registered. Starting with 8 processes
----------------------------------------------------------------------------------------------------

wandb: WARNING `resume` will be ignored since W&B syncing is set to `offline`. Starting a new run with run id yw7ct5e6.
wandb: Tracking run with wandb version 0.17.9
wandb: W&B syncing is set to `offline` in this directory.  
wandb: Run `wandb online` or set WANDB_MODE=online to enable cloud syncing.
INFO: LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
[2026-04-20 11:59:46,526][lightning.pytorch.accelerators.cuda][INFO] - LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
INFO: LOCAL_RANK: 6 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
INFO: LOCAL_RANK: 3 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
INFO: LOCAL_RANK: 4 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
[2026-04-20 11:59:46,527][lightning.pytorch.accelerators.cuda][INFO] - LOCAL_RANK: 1 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
INFO: LOCAL_RANK: 1 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
[2026-04-20 11:59:46,527][lightning.pytorch.accelerators.cuda][INFO] - LOCAL_RANK: 3 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
[2026-04-20 11:59:46,527][lightning.pytorch.accelerators.cuda][INFO] - LOCAL_RANK: 4 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
[2026-04-20 11:59:46,527][lightning.pytorch.accelerators.cuda][INFO] - LOCAL_RANK: 5 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
INFO: LOCAL_RANK: 5 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
[2026-04-20 11:59:46,527][lightning.pytorch.accelerators.cuda][INFO] - LOCAL_RANK: 6 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
[2026-04-20 11:59:46,527][lightning.pytorch.accelerators.cuda][INFO] - LOCAL_RANK: 7 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
INFO: LOCAL_RANK: 7 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
INFO: LOCAL_RANK: 2 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
[2026-04-20 11:59:46,527][lightning.pytorch.accelerators.cuda][INFO] - LOCAL_RANK: 2 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
INFO: 
  | Name                   | Type                                  | Params
---------------------------------------------------------------------------------
0 | diffusion_model        | DiffusionMamba                        | 609 M 
1 | validation_lpips_model | LearnedPerceptualImagePatchSimilarity | 2.5 M 
2 | vae                    | AutoencoderKL                         | 229 M 
3 | mamba_memory           | BiMambaMemory                         | 4.5 M 
---------------------------------------------------------------------------------
614 M     Trainable params
231 M     Non-trainable params
845 M     Total params
3,383.355 Total estimated model params size (MB)
[2026-04-20 11:59:48,791][lightning.pytorch.callbacks.model_summary][INFO] - 
  | Name                   | Type                                  | Params
---------------------------------------------------------------------------------
0 | diffusion_model        | DiffusionMamba                        | 609 M 
1 | validation_lpips_model | LearnedPerceptualImagePatchSimilarity | 2.5 M 
2 | vae                    | AutoencoderKL                         | 229 M 
3 | mamba_memory           | BiMambaMemory                         | 4.5 M 
---------------------------------------------------------------------------------
614 M     Trainable params
231 M     Non-trainable params
845 M     Total params
3,383.355 Total estimated model params size (MB)
[2026-04-20 11:59:49,946][lightning.pytorch.trainer.connectors.signal_connector][INFO] - SLURM auto-requeueing enabled. Setting signal handlers.
INFO: SLURM auto-requeueing enabled. Setting signal handlers.
INFO: SLURM auto-requeueing enabled. Setting signal handlers.
[2026-04-20 11:59:49,946][lightning.pytorch.trainer.connectors.signal_connector][INFO] - SLURM auto-requeueing enabled. Setting signal handlers.
INFO: SLURM auto-requeueing enabled. Setting signal handlers.
INFO: SLURM auto-requeueing enabled. Setting signal handlers.
[2026-04-20 11:59:49,946][lightning.pytorch.trainer.connectors.signal_connector][INFO] - SLURM auto-requeueing enabled. Setting signal handlers.
INFO: SLURM auto-requeueing enabled. Setting signal handlers.
[2026-04-20 11:59:49,946][lightning.pytorch.trainer.connectors.signal_connector][INFO] - SLURM auto-requeueing enabled. Setting signal handlers.
[2026-04-20 11:59:49,946][lightning.pytorch.trainer.connectors.signal_connector][INFO] - SLURM auto-requeueing enabled. Setting signal handlers.
[2026-04-20 11:59:49,946][lightning.pytorch.trainer.connectors.signal_connector][INFO] - SLURM auto-requeueing enabled. Setting signal handlers.
INFO: SLURM auto-requeueing enabled. Setting signal handlers.
[2026-04-20 11:59:49,946][lightning.pytorch.trainer.connectors.signal_connector][INFO] - SLURM auto-requeueing enabled. Setting signal handlers.
INFO: SLURM auto-requeueing enabled. Setting signal handlers.
[2026-04-20 11:59:49,947][lightning.pytorch.trainer.connectors.signal_connector][INFO] - SLURM auto-requeueing enabled. Setting signal handlers.
INFO: SLURM auto-requeueing enabled. Setting signal handlers.
/proj/cvl/users/x_fahkh2/WorldMem_Repro/algorithms/worldmem/models/mamba_memory.py:173: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(enabled=False):
/proj/cvl/users/x_fahkh2/WorldMem_Repro/algorithms/worldmem/models/mamba_memory.py:173: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(enabled=False):
/proj/cvl/users/x_fahkh2/WorldMem_Repro/algorithms/worldmem/models/mamba_memory.py:173: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(enabled=False):
/proj/cvl/users/x_fahkh2/WorldMem_Repro/algorithms/worldmem/models/mamba_memory.py:173: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(enabled=False):
/proj/cvl/users/x_fahkh2/WorldMem_Repro/algorithms/worldmem/models/mamba_memory.py:173: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(enabled=False):
/proj/cvl/users/x_fahkh2/WorldMem_Repro/algorithms/worldmem/models/mamba_memory.py:173: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(enabled=False):
/proj/cvl/users/x_fahkh2/WorldMem_Repro/algorithms/worldmem/models/mamba_memory.py:173: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(enabled=False):
/proj/cvl/users/x_fahkh2/WorldMem_Repro/algorithms/worldmem/models/mamba_memory.py:173: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(enabled=False):
Training: |          | 0/? [00:00<?, ?it/s]Training:   0%|          | 0/203307 [00:00<?, ?it/s]Epoch 0:   0%|          | 0/203307 [00:00<?, ?it/s] Epoch 0:   0%|          | 1/203307 [00:20<1132:51:52,  0.05it/s]Epoch 0:   0%|          | 1/203307 [00:20<1133:37:35,  0.05it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 2/203307 [00:23<676:42:28,  0.08it/s, v_num=t5e6, training/loss=0.209] Epoch 0:   0%|          | 2/203307 [00:23<677:03:42,  0.08it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 3/203307 [00:27<520:35:38,  0.11it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 3/203307 [00:27<520:49:33,  0.11it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 4/203307 [00:31<443:37:48,  0.13it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 4/203307 [00:31<443:50:21,  0.13it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 5/203307 [00:35<398:19:18,  0.14it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 5/203307 [00:35<398:21:24,  0.14it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 6/203307 [00:39<370:36:11,  0.15it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 6/203307 [00:39<370:36:57,  0.15it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 7/203307 [00:44<361:34:21,  0.16it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 7/203307 [00:44<361:34:43,  0.16it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 8/203307 [00:48<342:40:42,  0.16it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 8/203307 [00:48<342:43:37,  0.16it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 9/203307 [00:52<328:25:33,  0.17it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 9/203307 [00:52<328:25:52,  0.17it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 10/203307 [00:56<316:33:34,  0.18it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 10/203307 [00:56<316:34:06,  0.18it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 11/203307 [00:59<306:36:04,  0.18it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 11/203307 [00:59<306:36:24,  0.18it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 12/203307 [01:03<298:01:22,  0.19it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 12/203307 [01:03<298:01:38,  0.19it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 13/203307 [01:07<291:57:29,  0.19it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 13/203307 [01:07<291:57:49,  0.19it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 14/203307 [01:11<289:08:27,  0.20it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 14/203307 [01:11<289:08:42,  0.20it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 15/203307 [01:16<287:03:08,  0.20it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 15/203307 [01:16<287:03:19,  0.20it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 16/203307 [01:20<282:40:17,  0.20it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 16/203307 [01:20<282:40:27,  0.20it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 17/203307 [01:23<278:30:05,  0.20it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 17/203307 [01:23<278:30:14,  0.20it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 18/203307 [01:27<274:18:49,  0.21it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 18/203307 [01:27<274:18:58,  0.21it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 19/203307 [01:31<270:54:58,  0.21it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 19/203307 [01:31<270:55:08,  0.21it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 20/203307 [01:34<267:50:58,  0.21it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 20/203307 [01:34<267:51:08,  0.21it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 21/203307 [01:38<265:42:58,  0.21it/s, v_num=t5e6, training/loss=0.209]Epoch 0:   0%|          | 21/203307 [01:38<265:43:06,  0.21it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 22/203307 [01:42<263:03:27,  0.21it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 22/203307 [01:42<263:05:17,  0.21it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 23/203307 [01:47<265:02:07,  0.21it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 23/203307 [01:47<265:02:14,  0.21it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 24/203307 [01:51<261:44:57,  0.22it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 24/203307 [01:51<261:45:14,  0.22it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 25/203307 [01:55<260:04:51,  0.22it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 25/203307 [01:55<260:04:56,  0.22it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 26/203307 [01:58<258:02:41,  0.22it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 26/203307 [01:58<258:02:47,  0.22it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 27/203307 [02:02<256:13:04,  0.22it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 27/203307 [02:02<256:13:15,  0.22it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 28/203307 [02:06<254:46:56,  0.22it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 28/203307 [02:06<254:47:03,  0.22it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 29/203307 [02:10<253:44:15,  0.22it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 29/203307 [02:10<253:44:26,  0.22it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 30/203307 [02:14<252:19:49,  0.22it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 30/203307 [02:14<252:21:14,  0.22it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 31/203307 [02:18<252:29:10,  0.22it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 31/203307 [02:18<252:29:15,  0.22it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 32/203307 [02:22<251:02:30,  0.22it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 32/203307 [02:22<251:02:36,  0.22it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 33/203307 [02:26<250:13:50,  0.23it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 33/203307 [02:26<250:13:56,  0.23it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 34/203307 [02:29<248:56:45,  0.23it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 34/203307 [02:29<248:57:50,  0.23it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 35/203307 [02:33<247:59:23,  0.23it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 35/203307 [02:33<248:00:14,  0.23it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 36/203307 [02:37<247:01:31,  0.23it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 36/203307 [02:37<247:01:36,  0.23it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 37/203307 [02:41<246:20:02,  0.23it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 37/203307 [02:41<246:21:10,  0.23it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 38/203307 [02:45<245:29:11,  0.23it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 38/203307 [02:45<245:30:17,  0.23it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 39/203307 [02:49<244:43:44,  0.23it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 39/203307 [02:49<244:43:56,  0.23it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 40/203307 [02:53<245:07:33,  0.23it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 40/203307 [02:53<245:07:40,  0.23it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 41/203307 [02:57<244:59:40,  0.23it/s, v_num=t5e6, training/loss=0.195]Epoch 0:   0%|          | 41/203307 [02:57<245:00:37,  0.23it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 42/203307 [03:01<244:02:04,  0.23it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 42/203307 [03:01<244:03:04,  0.23it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 43/203307 [03:05<243:21:13,  0.23it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 43/203307 [03:05<243:22:08,  0.23it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 44/203307 [03:09<242:41:44,  0.23it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 44/203307 [03:09<242:41:50,  0.23it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 45/203307 [03:13<242:15:47,  0.23it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 45/203307 [03:13<242:16:05,  0.23it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 46/203307 [03:16<241:41:55,  0.23it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 46/203307 [03:16<241:41:59,  0.23it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 47/203307 [03:20<241:03:49,  0.23it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 47/203307 [03:20<241:04:40,  0.23it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 48/203307 [03:25<241:24:44,  0.23it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 48/203307 [03:25<241:25:33,  0.23it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 49/203307 [03:29<241:12:20,  0.23it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 49/203307 [03:29<241:12:22,  0.23it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 50/203307 [03:33<240:39:05,  0.23it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 50/203307 [03:33<240:39:08,  0.23it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 51/203307 [03:36<240:06:24,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 51/203307 [03:36<240:06:56,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 52/203307 [03:40<239:31:51,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 52/203307 [03:40<239:31:53,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 53/203307 [03:44<239:09:11,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 53/203307 [03:44<239:09:14,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 54/203307 [03:48<238:35:47,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 54/203307 [03:48<238:35:50,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 55/203307 [03:52<238:09:15,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 55/203307 [03:52<238:09:58,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 56/203307 [03:56<238:25:26,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 56/203307 [03:56<238:26:08,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 57/203307 [04:00<238:02:15,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 57/203307 [04:00<238:02:54,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 58/203307 [04:04<237:48:13,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 58/203307 [04:04<237:48:17,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 59/203307 [04:08<237:22:15,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 59/203307 [04:08<237:22:56,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 60/203307 [04:11<236:55:27,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 60/203307 [04:11<236:55:54,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 61/203307 [04:15<236:41:45,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 61/203307 [04:15<236:42:28,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 62/203307 [04:19<236:13:20,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 62/203307 [04:19<236:14:00,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 63/203307 [04:23<235:54:05,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 63/203307 [04:23<235:54:23,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 64/203307 [04:27<236:12:40,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 64/203307 [04:27<236:13:18,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 65/203307 [04:32<236:28:43,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 65/203307 [04:32<236:28:45,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 66/203307 [04:36<236:18:37,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 66/203307 [04:36<236:18:50,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 67/203307 [04:39<235:54:02,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 67/203307 [04:39<235:54:40,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 68/203307 [04:43<235:31:40,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 68/203307 [04:43<235:32:16,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 69/203307 [04:47<235:14:21,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 69/203307 [04:47<235:14:58,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 70/203307 [04:51<234:54:28,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 70/203307 [04:51<234:55:02,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 71/203307 [04:55<234:38:04,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 71/203307 [04:55<234:38:39,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 72/203307 [04:59<234:56:56,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 72/203307 [04:59<234:57:28,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 73/203307 [05:04<235:12:10,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 73/203307 [05:04<235:12:36,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 74/203307 [05:07<234:53:28,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 74/203307 [05:07<234:53:58,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 75/203307 [05:11<234:43:51,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 75/203307 [05:11<234:44:25,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 76/203307 [05:15<234:26:39,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 76/203307 [05:15<234:27:12,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 77/203307 [05:19<234:13:13,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 77/203307 [05:19<234:13:44,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 78/203307 [05:23<233:54:36,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 78/203307 [05:23<233:55:09,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 79/203307 [05:27<233:45:15,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 79/203307 [05:27<233:45:25,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 80/203307 [05:31<234:03:19,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 80/203307 [05:31<234:03:21,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 81/203307 [05:36<234:20:19,  0.24it/s, v_num=t5e6, training/loss=0.184]Epoch 0:   0%|          | 81/203307 [05:36<234:20:21,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 82/203307 [05:40<234:06:35,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 82/203307 [05:40<234:06:37,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 83/203307 [05:44<234:01:48,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 83/203307 [05:44<234:02:13,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 84/203307 [05:47<233:45:42,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 84/203307 [05:47<233:46:14,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 85/203307 [05:51<233:35:17,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 85/203307 [05:51<233:35:45,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 86/203307 [05:55<233:20:35,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 86/203307 [05:55<233:20:55,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 87/203307 [05:59<233:10:31,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 87/203307 [05:59<233:10:34,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 88/203307 [06:03<232:58:37,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 88/203307 [06:03<232:59:06,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 89/203307 [06:08<233:32:56,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 89/203307 [06:08<233:33:22,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 90/203307 [06:12<233:29:35,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 90/203307 [06:12<233:30:01,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 91/203307 [06:16<233:20:26,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 91/203307 [06:16<233:20:29,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 92/203307 [06:20<233:20:19,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 92/203307 [06:20<233:20:45,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 93/203307 [06:24<233:14:13,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 93/203307 [06:24<233:14:15,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 94/203307 [06:27<232:55:15,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 94/203307 [06:27<232:55:18,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 95/203307 [06:31<232:46:49,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 95/203307 [06:31<232:47:17,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 96/203307 [06:35<232:31:17,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 96/203307 [06:35<232:31:23,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 97/203307 [06:40<232:57:14,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 97/203307 [06:40<232:57:39,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 98/203307 [06:43<232:40:59,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 98/203307 [06:43<232:41:22,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 99/203307 [06:47<232:28:33,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 99/203307 [06:47<232:28:59,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 100/203307 [06:51<232:29:59,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 100/203307 [06:51<232:30:01,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 101/203307 [06:55<232:25:44,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 101/203307 [06:55<232:26:08,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 102/203307 [06:59<232:08:32,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 102/203307 [06:59<232:08:34,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 103/203307 [07:03<232:01:07,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 103/203307 [07:03<232:01:09,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 104/203307 [07:07<231:49:40,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 104/203307 [07:07<231:50:04,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 105/203307 [07:11<232:12:06,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 105/203307 [07:11<232:12:28,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 106/203307 [07:15<232:00:31,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 106/203307 [07:15<232:00:32,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 107/203307 [07:20<232:06:55,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 107/203307 [07:20<232:07:17,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 108/203307 [07:23<231:54:10,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 108/203307 [07:23<231:54:31,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 109/203307 [07:27<231:51:15,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 109/203307 [07:27<231:51:37,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 110/203307 [07:31<231:37:09,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 110/203307 [07:31<231:37:32,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 111/203307 [07:35<231:29:56,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 111/203307 [07:35<231:30:00,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 112/203307 [07:39<231:19:42,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 112/203307 [07:39<231:20:04,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 113/203307 [07:43<231:44:17,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 113/203307 [07:43<231:44:36,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 114/203307 [07:48<231:55:25,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 114/203307 [07:48<231:55:41,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 115/203307 [07:52<231:45:07,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 115/203307 [07:52<231:45:08,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 116/203307 [07:55<231:32:11,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 116/203307 [07:55<231:32:30,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 117/203307 [07:59<231:30:10,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 117/203307 [07:59<231:30:31,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 118/203307 [08:03<231:20:12,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 118/203307 [08:03<231:20:33,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 119/203307 [08:07<231:11:11,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 119/203307 [08:07<231:11:32,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 120/203307 [08:11<231:01:37,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 120/203307 [08:11<231:01:59,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 121/203307 [08:15<231:17:28,  0.24it/s, v_num=t5e6, training/loss=0.188]Epoch 0:   0%|          | 121/203307 [08:15<231:17:44,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 122/203307 [08:20<231:31:07,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 122/203307 [08:20<231:31:25,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 123/203307 [08:24<231:27:29,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 123/203307 [08:24<231:27:32,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 124/203307 [08:28<231:17:28,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 124/203307 [08:28<231:17:48,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 125/203307 [08:32<231:14:05,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 125/203307 [08:32<231:14:24,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 126/203307 [08:36<231:12:28,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 126/203307 [08:36<231:12:42,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 127/203307 [08:39<231:02:55,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 127/203307 [08:39<231:03:13,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 128/203307 [08:43<230:55:18,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 128/203307 [08:43<230:55:38,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 129/203307 [08:48<231:09:30,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 129/203307 [08:48<231:09:47,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 130/203307 [08:52<231:02:46,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 130/203307 [08:52<231:03:03,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 131/203307 [08:56<231:12:35,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 131/203307 [08:56<231:12:51,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 132/203307 [09:00<231:03:46,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 132/203307 [09:00<231:03:48,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 133/203307 [09:04<230:59:22,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 133/203307 [09:04<230:59:39,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 134/203307 [09:08<231:00:29,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 134/203307 [09:08<231:00:46,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 135/203307 [09:12<230:52:00,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 135/203307 [09:12<230:52:18,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 136/203307 [09:16<230:43:36,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 136/203307 [09:16<230:43:56,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 137/203307 [09:20<230:41:24,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 137/203307 [09:20<230:41:40,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 138/203307 [09:24<230:52:00,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 138/203307 [09:24<230:52:16,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 139/203307 [09:29<231:02:04,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 139/203307 [09:29<231:02:22,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 140/203307 [09:32<230:53:00,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 140/203307 [09:32<230:53:17,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 141/203307 [09:36<230:49:44,  0.24it/s, v_num=t5e6, training/loss=0.157]Epoch 0:   0%|          | 141/203307 [09:36<230:50:02,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 142/203307 [09:40<230:43:55,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 142/203307 [09:40<230:44:10,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 143/203307 [09:44<230:43:30,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 143/203307 [09:44<230:43:45,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 144/203307 [09:48<230:35:45,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 144/203307 [09:48<230:36:03,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 145/203307 [09:52<230:32:08,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 145/203307 [09:52<230:32:25,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 146/203307 [09:57<230:45:57,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 146/203307 [09:57<230:46:12,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 147/203307 [10:01<230:59:05,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 147/203307 [10:01<230:59:22,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 148/203307 [10:05<230:51:53,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 148/203307 [10:05<230:52:08,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 149/203307 [10:09<230:50:32,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 149/203307 [10:09<230:50:48,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 150/203307 [10:13<230:44:20,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 150/203307 [10:13<230:44:37,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 151/203307 [10:17<230:42:39,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 151/203307 [10:17<230:42:53,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 152/203307 [10:21<230:34:18,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 152/203307 [10:21<230:34:35,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 153/203307 [10:25<230:32:35,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 153/203307 [10:25<230:32:51,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 154/203307 [10:29<230:39:39,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 154/203307 [10:29<230:39:54,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 155/203307 [10:33<230:36:54,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 155/203307 [10:33<230:36:55,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 156/203307 [10:37<230:38:56,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 156/203307 [10:37<230:39:09,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 157/203307 [10:41<230:37:45,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 157/203307 [10:41<230:38:00,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 158/203307 [10:45<230:32:14,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 158/203307 [10:45<230:32:16,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 159/203307 [10:49<230:30:35,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 159/203307 [10:49<230:30:49,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 160/203307 [10:53<230:22:43,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 160/203307 [10:53<230:22:59,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 161/203307 [10:57<230:21:25,  0.24it/s, v_num=t5e6, training/loss=0.165]Epoch 0:   0%|          | 161/203307 [10:57<230:21:40,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 162/203307 [11:01<230:16:30,  0.25it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 162/203307 [11:01<230:16:40,  0.25it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 163/203307 [11:05<230:27:31,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 163/203307 [11:05<230:27:44,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 164/203307 [11:09<230:22:09,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 164/203307 [11:09<230:22:10,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 165/203307 [11:13<230:19:36,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 165/203307 [11:13<230:19:37,  0.24it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 166/203307 [11:17<230:16:01,  0.25it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 166/203307 [11:17<230:16:15,  0.25it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 167/203307 [11:21<230:16:26,  0.25it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 167/203307 [11:21<230:16:28,  0.25it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 168/203307 [11:25<230:10:10,  0.25it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 168/203307 [11:25<230:10:26,  0.25it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 169/203307 [11:29<230:08:08,  0.25it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 169/203307 [11:29<230:08:19,  0.25it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 170/203307 [11:33<230:02:11,  0.25it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 170/203307 [11:33<230:02:25,  0.25it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 171/203307 [11:37<230:13:29,  0.25it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 171/203307 [11:37<230:13:40,  0.25it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 172/203307 [11:41<230:08:38,  0.25it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 172/203307 [11:41<230:08:39,  0.25it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 173/203307 [11:45<230:13:03,  0.25it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 173/203307 [11:45<230:13:16,  0.25it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 174/203307 [11:49<230:09:26,  0.25it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 174/203307 [11:49<230:09:27,  0.25it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 175/203307 [11:53<230:10:10,  0.25it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 175/203307 [11:53<230:10:25,  0.25it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 176/203307 [11:57<230:03:48,  0.25it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 176/203307 [11:57<230:03:50,  0.25it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 177/203307 [12:01<230:02:58,  0.25it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 177/203307 [12:01<230:03:11,  0.25it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 178/203307 [12:05<229:58:09,  0.25it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 178/203307 [12:05<229:58:22,  0.25it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 179/203307 [12:09<229:56:00,  0.25it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 179/203307 [12:09<229:56:12,  0.25it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 180/203307 [12:14<230:06:56,  0.25it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 180/203307 [12:14<230:07:08,  0.25it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 181/203307 [12:18<230:04:35,  0.25it/s, v_num=t5e6, training/loss=0.172]Epoch 0:   0%|          | 181/203307 [12:18<230:04:47,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 182/203307 [12:21<229:59:38,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 182/203307 [12:21<229:59:52,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 183/203307 [12:25<229:56:18,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 183/203307 [12:25<229:56:19,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 184/203307 [12:30<230:01:01,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 184/203307 [12:30<230:01:14,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 185/203307 [12:34<229:58:20,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 185/203307 [12:34<229:58:32,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 186/203307 [12:37<229:53:31,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 186/203307 [12:37<229:53:45,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 187/203307 [12:41<229:49:45,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 187/203307 [12:41<229:49:59,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 188/203307 [12:46<229:58:19,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 188/203307 [12:46<229:58:31,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 189/203307 [12:50<229:55:13,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 189/203307 [12:50<229:55:25,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 190/203307 [12:54<229:51:17,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 190/203307 [12:54<229:51:29,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 191/203307 [12:58<229:50:37,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 191/203307 [12:58<229:50:46,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 192/203307 [13:02<229:51:10,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 192/203307 [13:02<229:51:21,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 193/203307 [13:06<229:48:31,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 193/203307 [13:06<229:48:42,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 194/203307 [13:09<229:44:48,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 194/203307 [13:09<229:45:00,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 195/203307 [13:13<229:42:20,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 195/203307 [13:13<229:42:33,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 196/203307 [13:17<229:38:11,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 196/203307 [13:17<229:38:24,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 197/203307 [13:22<229:52:11,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 197/203307 [13:22<229:52:23,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 198/203307 [13:26<229:48:04,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 198/203307 [13:26<229:48:15,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 199/203307 [13:30<229:45:43,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 199/203307 [13:30<229:45:52,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 200/203307 [13:34<229:45:42,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 200/203307 [13:34<229:45:52,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 201/203307 [13:38<229:45:14,  0.25it/s, v_num=t5e6, training/loss=0.168]Epoch 0:   0%|          | 201/203307 [13:38<229:45:24,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 202/203307 [13:42<229:42:18,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 202/203307 [13:42<229:42:19,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 203/203307 [13:46<229:40:21,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 203/203307 [13:46<229:40:27,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 204/203307 [13:50<229:37:41,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 204/203307 [13:50<229:37:52,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 205/203307 [13:55<229:48:58,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 205/203307 [13:55<229:49:10,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 206/203307 [13:58<229:46:13,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 206/203307 [13:58<229:46:15,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 207/203307 [14:02<229:43:06,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 207/203307 [14:02<229:43:18,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 208/203307 [14:07<229:52:05,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 208/203307 [14:07<229:52:18,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 209/203307 [14:10<229:39:59,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 209/203307 [14:10<229:40:10,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 210/203307 [14:14<229:37:37,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 210/203307 [14:14<229:37:48,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 211/203307 [14:18<229:35:10,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 211/203307 [14:18<229:35:21,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 212/203307 [14:22<229:31:50,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 212/203307 [14:22<229:32:01,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 213/203307 [14:27<229:42:26,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 213/203307 [14:27<229:42:37,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 214/203307 [14:31<229:50:54,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 214/203307 [14:31<229:51:05,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 215/203307 [14:35<229:46:39,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 215/203307 [14:35<229:46:51,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 216/203307 [14:39<229:47:20,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 216/203307 [14:39<229:47:31,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 217/203307 [14:43<229:46:47,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 217/203307 [14:43<229:46:57,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 218/203307 [14:47<229:42:37,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 218/203307 [14:47<229:42:48,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 219/203307 [14:51<229:40:57,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 219/203307 [14:51<229:40:57,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 220/203307 [14:55<229:36:50,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 220/203307 [14:55<229:37:02,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 221/203307 [14:59<229:32:07,  0.25it/s, v_num=t5e6, training/loss=0.155]Epoch 0:   0%|          | 221/203307 [14:59<229:32:18,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 222/203307 [15:04<229:45:00,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 222/203307 [15:04<229:45:10,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 223/203307 [15:08<229:42:04,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 223/203307 [15:08<229:42:14,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 224/203307 [15:11<229:38:26,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 224/203307 [15:11<229:38:37,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 225/203307 [15:15<229:38:23,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 225/203307 [15:15<229:38:32,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 226/203307 [15:19<229:34:19,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 226/203307 [15:19<229:34:30,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 227/203307 [15:23<229:30:28,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 227/203307 [15:23<229:30:40,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 228/203307 [15:27<229:28:42,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 228/203307 [15:27<229:28:57,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 229/203307 [15:32<229:36:35,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 229/203307 [15:32<229:36:45,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 230/203307 [15:35<229:32:25,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 230/203307 [15:35<229:32:34,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 231/203307 [15:40<229:40:41,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 231/203307 [15:40<229:40:51,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 232/203307 [15:44<229:36:24,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 232/203307 [15:44<229:36:35,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 233/203307 [15:48<229:36:05,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 233/203307 [15:48<229:36:14,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 234/203307 [15:52<229:33:13,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 234/203307 [15:52<229:33:22,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 235/203307 [15:56<229:30:57,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 235/203307 [15:56<229:31:07,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 236/203307 [16:00<229:28:00,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 236/203307 [16:00<229:28:11,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 237/203307 [16:04<229:27:49,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 237/203307 [16:04<229:27:58,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 238/203307 [16:07<229:25:23,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 238/203307 [16:08<229:25:34,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 239/203307 [16:12<229:34:52,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 239/203307 [16:12<229:35:02,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 240/203307 [16:16<229:33:20,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 240/203307 [16:16<229:33:30,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 241/203307 [16:20<229:33:12,  0.25it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 241/203307 [16:20<229:33:22,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 242/203307 [16:24<229:30:20,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 242/203307 [16:24<229:30:29,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 243/203307 [16:28<229:29:35,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 243/203307 [16:28<229:29:44,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 244/203307 [16:32<229:27:48,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 244/203307 [16:32<229:27:58,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 245/203307 [16:36<229:25:35,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 245/203307 [16:36<229:25:46,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 246/203307 [16:41<229:32:21,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 246/203307 [16:41<229:32:31,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 247/203307 [16:45<229:30:49,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 247/203307 [16:45<229:30:58,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 248/203307 [16:49<229:37:10,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 248/203307 [16:49<229:37:19,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 249/203307 [16:53<229:37:05,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 249/203307 [16:53<229:37:13,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 250/203307 [16:57<229:38:38,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 250/203307 [16:57<229:38:39,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 251/203307 [17:01<229:36:02,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 251/203307 [17:01<229:36:12,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 252/203307 [17:05<229:33:08,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 252/203307 [17:05<229:33:17,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 253/203307 [17:09<229:32:11,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 253/203307 [17:09<229:32:19,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 254/203307 [17:14<229:38:29,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 254/203307 [17:14<229:38:30,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 255/203307 [17:18<229:35:41,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 255/203307 [17:18<229:35:50,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 256/203307 [17:22<229:42:47,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 256/203307 [17:22<229:42:56,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 257/203307 [17:26<229:42:10,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 257/203307 [17:26<229:42:17,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 258/203307 [17:30<229:42:15,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 258/203307 [17:30<229:42:24,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 259/203307 [17:34<229:40:49,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 259/203307 [17:34<229:40:58,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 260/203307 [17:38<229:38:11,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 260/203307 [17:38<229:38:20,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 261/203307 [17:42<229:37:38,  0.25it/s, v_num=t5e6, training/loss=0.150]Epoch 0:   0%|          | 261/203307 [17:42<229:37:46,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 262/203307 [17:46<229:34:28,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 262/203307 [17:46<229:34:36,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 263/203307 [17:51<229:41:30,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 263/203307 [17:51<229:41:39,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 264/203307 [17:54<229:38:58,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 264/203307 [17:54<229:39:05,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 265/203307 [17:59<229:48:09,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 265/203307 [17:59<229:48:17,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 266/203307 [18:03<229:46:31,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 266/203307 [18:03<229:46:39,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 267/203307 [18:07<229:44:52,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 267/203307 [18:07<229:45:00,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 268/203307 [18:11<229:42:45,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 268/203307 [18:11<229:43:00,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 269/203307 [18:15<229:42:53,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 269/203307 [18:15<229:43:09,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 270/203307 [18:19<229:39:07,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 270/203307 [18:19<229:39:17,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 271/203307 [18:24<229:46:03,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 271/203307 [18:24<229:46:12,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 272/203307 [18:27<229:43:52,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 272/203307 [18:27<229:44:00,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 273/203307 [18:32<229:52:30,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 273/203307 [18:32<229:52:35,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 274/203307 [18:37<229:59:06,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 274/203307 [18:37<229:59:17,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 275/203307 [18:40<229:50:24,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 275/203307 [18:40<229:50:25,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 276/203307 [18:44<229:47:10,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 276/203307 [18:44<229:47:19,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 277/203307 [18:48<229:46:38,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 277/203307 [18:48<229:46:46,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 278/203307 [18:52<229:43:44,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 278/203307 [18:52<229:43:51,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 279/203307 [18:57<229:50:04,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 279/203307 [18:57<229:50:12,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 280/203307 [19:00<229:47:32,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 280/203307 [19:00<229:47:40,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 281/203307 [19:05<229:48:04,  0.25it/s, v_num=t5e6, training/loss=0.159]Epoch 0:   0%|          | 281/203307 [19:05<229:48:12,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 282/203307 [19:09<229:55:01,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 282/203307 [19:09<229:55:09,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 283/203307 [19:13<229:52:37,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 283/203307 [19:13<229:52:39,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 284/203307 [19:17<229:50:09,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 284/203307 [19:17<229:50:17,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 285/203307 [19:21<229:49:53,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 285/203307 [19:21<229:49:54,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 286/203307 [19:25<229:46:51,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 286/203307 [19:25<229:46:59,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 287/203307 [19:29<229:53:20,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 287/203307 [19:29<229:53:23,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 288/203307 [19:33<229:50:46,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 288/203307 [19:33<229:50:54,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 289/203307 [19:37<229:50:03,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 289/203307 [19:37<229:50:09,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 290/203307 [19:42<229:55:55,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 290/203307 [19:42<229:56:03,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 291/203307 [19:46<229:54:37,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 291/203307 [19:46<229:54:43,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 292/203307 [19:50<229:54:38,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 292/203307 [19:50<229:54:46,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 293/203307 [19:54<229:54:49,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 293/203307 [19:54<229:54:56,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 294/203307 [19:58<229:52:15,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 294/203307 [19:58<229:52:21,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 295/203307 [20:03<229:58:10,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 295/203307 [20:03<229:58:18,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 296/203307 [20:06<229:55:43,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 296/203307 [20:06<229:55:51,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 297/203307 [20:10<229:55:35,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 297/203307 [20:10<229:55:42,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 298/203307 [20:14<229:53:04,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 298/203307 [20:14<229:53:10,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 299/203307 [20:19<230:00:10,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 299/203307 [20:19<230:00:18,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 300/203307 [20:23<230:01:25,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 300/203307 [20:23<230:01:32,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 301/203307 [20:27<230:00:56,  0.25it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 301/203307 [20:27<230:01:04,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 302/203307 [20:31<229:58:37,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 302/203307 [20:31<229:58:44,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 303/203307 [20:35<229:56:36,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 303/203307 [20:35<229:56:44,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 304/203307 [20:40<230:00:57,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 304/203307 [20:40<230:01:04,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 305/203307 [20:44<230:00:25,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 305/203307 [20:44<230:00:32,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 306/203307 [20:47<229:57:57,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 306/203307 [20:47<229:58:01,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 307/203307 [20:52<230:03:30,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 307/203307 [20:52<230:03:35,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 308/203307 [20:56<229:58:55,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 308/203307 [20:56<229:59:03,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 309/203307 [21:00<229:57:54,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 309/203307 [21:00<229:58:01,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 310/203307 [21:04<229:55:54,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 310/203307 [21:04<229:56:01,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 311/203307 [21:07<229:53:38,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 311/203307 [21:07<229:53:46,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 312/203307 [21:12<229:57:51,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 312/203307 [21:12<229:57:58,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 313/203307 [21:16<229:56:54,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 313/203307 [21:16<229:57:00,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 314/203307 [21:20<229:54:59,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 314/203307 [21:20<229:55:06,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 315/203307 [21:24<229:53:25,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 315/203307 [21:24<229:53:32,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 316/203307 [21:28<229:59:00,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 316/203307 [21:28<229:59:07,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 317/203307 [21:32<229:59:26,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 317/203307 [21:32<229:59:26,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 318/203307 [21:36<229:57:52,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 318/203307 [21:36<229:57:59,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 319/203307 [21:40<229:56:31,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 319/203307 [21:40<229:56:33,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 320/203307 [21:45<230:02:31,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 320/203307 [21:45<230:02:38,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 321/203307 [21:49<230:01:52,  0.25it/s, v_num=t5e6, training/loss=0.169]Epoch 0:   0%|          | 321/203307 [21:49<230:01:52,  0.25it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 322/203307 [21:53<230:00:30,  0.25it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 322/203307 [21:53<230:00:35,  0.25it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 323/203307 [21:57<229:58:58,  0.25it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 323/203307 [21:57<229:59:04,  0.25it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 324/203307 [22:02<230:04:09,  0.25it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 324/203307 [22:02<230:04:16,  0.25it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 325/203307 [22:06<230:03:26,  0.25it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 325/203307 [22:06<230:03:32,  0.25it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 326/203307 [22:10<230:04:30,  0.25it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 326/203307 [22:10<230:04:36,  0.25it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 327/203307 [22:14<230:02:57,  0.25it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 327/203307 [22:14<230:03:04,  0.25it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 328/203307 [22:18<230:01:11,  0.25it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 328/203307 [22:18<230:01:18,  0.25it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 329/203307 [22:22<230:08:36,  0.24it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 329/203307 [22:22<230:08:43,  0.24it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 330/203307 [22:26<230:07:02,  0.25it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 330/203307 [22:26<230:07:09,  0.25it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 331/203307 [22:30<230:05:06,  0.25it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 331/203307 [22:30<230:05:14,  0.25it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 332/203307 [22:34<230:03:03,  0.25it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 332/203307 [22:34<230:03:10,  0.25it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 333/203307 [22:39<230:09:53,  0.24it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 333/203307 [22:39<230:10:00,  0.24it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 334/203307 [22:43<230:10:28,  0.24it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 334/203307 [22:43<230:10:34,  0.24it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 335/203307 [22:47<230:09:14,  0.24it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 335/203307 [22:47<230:09:20,  0.24it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 336/203307 [22:51<230:06:52,  0.25it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 336/203307 [22:51<230:07:00,  0.25it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 337/203307 [22:55<230:12:10,  0.24it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 337/203307 [22:55<230:12:17,  0.24it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 338/203307 [22:59<230:10:34,  0.24it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 338/203307 [22:59<230:10:41,  0.24it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 339/203307 [23:03<230:09:10,  0.24it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 339/203307 [23:03<230:09:11,  0.24it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 340/203307 [23:07<230:07:32,  0.24it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 340/203307 [23:07<230:07:33,  0.24it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 341/203307 [23:12<230:13:33,  0.24it/s, v_num=t5e6, training/loss=0.154]Epoch 0:   0%|          | 341/203307 [23:12<230:13:40,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 342/203307 [23:16<230:11:48,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 342/203307 [23:16<230:11:55,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 343/203307 [23:20<230:13:04,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 343/203307 [23:20<230:13:11,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 344/203307 [23:24<230:11:19,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 344/203307 [23:24<230:11:25,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 345/203307 [23:28<230:11:20,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 345/203307 [23:28<230:11:26,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 346/203307 [23:33<230:16:43,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 346/203307 [23:33<230:16:49,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 347/203307 [23:37<230:16:16,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 347/203307 [23:37<230:16:22,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 348/203307 [23:41<230:14:40,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 348/203307 [23:41<230:14:46,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 349/203307 [23:45<230:14:54,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 349/203307 [23:45<230:14:59,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 350/203307 [23:50<230:21:23,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 350/203307 [23:50<230:21:24,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 351/203307 [23:54<230:20:54,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 351/203307 [23:54<230:20:56,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 352/203307 [23:58<230:18:50,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 352/203307 [23:58<230:18:57,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 353/203307 [24:02<230:18:00,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 353/203307 [24:02<230:18:06,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 354/203307 [24:06<230:17:18,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 354/203307 [24:06<230:17:21,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 355/203307 [24:10<230:23:37,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 355/203307 [24:10<230:23:44,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 356/203307 [24:14<230:22:02,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 356/203307 [24:14<230:22:09,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 357/203307 [24:18<230:20:43,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 357/203307 [24:18<230:20:48,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 358/203307 [24:23<230:27:01,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 358/203307 [24:23<230:27:06,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 359/203307 [24:27<230:26:53,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 359/203307 [24:27<230:26:59,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 360/203307 [24:31<230:24:49,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 360/203307 [24:31<230:24:55,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 361/203307 [24:35<230:25:35,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 361/203307 [24:35<230:25:40,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 362/203307 [24:40<230:28:55,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 362/203307 [24:40<230:28:56,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 363/203307 [24:43<230:27:16,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 363/203307 [24:43<230:27:23,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 364/203307 [24:47<230:24:32,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 364/203307 [24:47<230:24:39,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 365/203307 [24:51<230:23:31,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 365/203307 [24:51<230:23:37,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 366/203307 [24:55<230:22:38,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 366/203307 [24:55<230:22:44,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 367/203307 [25:00<230:28:54,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 367/203307 [25:00<230:29:01,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 368/203307 [25:04<230:27:14,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 368/203307 [25:04<230:27:20,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 369/203307 [25:08<230:26:48,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 369/203307 [25:08<230:26:49,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 370/203307 [25:13<230:31:15,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 370/203307 [25:13<230:31:21,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 371/203307 [25:16<230:29:30,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 371/203307 [25:16<230:29:37,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 372/203307 [25:20<230:27:56,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 372/203307 [25:20<230:28:03,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 373/203307 [25:25<230:28:26,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 373/203307 [25:25<230:28:31,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 374/203307 [25:28<230:26:44,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 374/203307 [25:28<230:26:50,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 375/203307 [25:33<230:32:53,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 375/203307 [25:33<230:32:59,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 376/203307 [25:37<230:31:22,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 376/203307 [25:37<230:31:27,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 377/203307 [25:41<230:31:09,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 377/203307 [25:41<230:31:11,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 378/203307 [25:46<230:35:48,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 378/203307 [25:46<230:35:50,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 379/203307 [25:50<230:34:12,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 379/203307 [25:50<230:34:13,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 380/203307 [25:54<230:32:15,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 380/203307 [25:54<230:32:16,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 381/203307 [25:58<230:32:08,  0.24it/s, v_num=t5e6, training/loss=0.142]Epoch 0:   0%|          | 381/203307 [25:58<230:32:13,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 382/203307 [26:02<230:30:27,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 382/203307 [26:02<230:30:33,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 383/203307 [26:06<230:29:32,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 383/203307 [26:06<230:29:38,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 384/203307 [26:10<230:34:06,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 384/203307 [26:10<230:34:07,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 385/203307 [26:14<230:33:59,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 385/203307 [26:14<230:33:59,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 386/203307 [26:18<230:32:46,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 386/203307 [26:18<230:32:52,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 387/203307 [26:23<230:36:14,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 387/203307 [26:23<230:36:20,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 388/203307 [26:27<230:33:42,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 388/203307 [26:27<230:33:48,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 389/203307 [26:31<230:33:46,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 389/203307 [26:31<230:33:52,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 390/203307 [26:35<230:32:29,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 390/203307 [26:35<230:32:35,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 391/203307 [26:39<230:31:30,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 391/203307 [26:39<230:31:36,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 392/203307 [26:43<230:35:48,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 392/203307 [26:43<230:35:54,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 393/203307 [26:47<230:36:02,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 393/203307 [26:47<230:36:08,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 394/203307 [26:51<230:34:43,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 394/203307 [26:51<230:34:44,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 395/203307 [26:56<230:40:17,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 395/203307 [26:56<230:40:17,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 396/203307 [27:00<230:38:16,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 396/203307 [27:00<230:38:16,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 397/203307 [27:04<230:37:32,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 397/203307 [27:04<230:37:37,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 398/203307 [27:08<230:36:12,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 398/203307 [27:08<230:36:17,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 399/203307 [27:12<230:34:35,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 399/203307 [27:12<230:34:35,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 400/203307 [27:16<230:34:27,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 400/203307 [27:16<230:34:33,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 401/203307 [27:21<230:41:39,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 401/203307 [27:21<230:41:51,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 402/203307 [27:25<230:39:17,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 402/203307 [27:25<230:39:18,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 403/203307 [27:29<230:43:26,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 403/203307 [27:29<230:43:31,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 404/203307 [27:33<230:41:51,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 404/203307 [27:33<230:41:56,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 405/203307 [27:37<230:41:05,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 405/203307 [27:37<230:41:10,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 406/203307 [27:41<230:38:52,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 406/203307 [27:41<230:38:58,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 407/203307 [27:45<230:37:39,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 407/203307 [27:45<230:37:41,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 408/203307 [27:49<230:41:33,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 408/203307 [27:50<230:41:36,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 409/203307 [27:54<230:42:26,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 409/203307 [27:54<230:42:31,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 410/203307 [27:58<230:41:04,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 410/203307 [27:58<230:41:10,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 411/203307 [28:02<230:44:10,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 411/203307 [28:02<230:44:15,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 412/203307 [28:06<230:42:33,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 412/203307 [28:06<230:42:34,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 413/203307 [28:10<230:43:42,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 413/203307 [28:10<230:43:42,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 414/203307 [28:14<230:41:44,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 414/203307 [28:14<230:41:50,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 415/203307 [28:18<230:40:37,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 415/203307 [28:18<230:40:38,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 416/203307 [28:22<230:40:01,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 416/203307 [28:22<230:40:06,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 417/203307 [28:26<230:39:19,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 417/203307 [28:26<230:39:24,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 418/203307 [28:31<230:42:14,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 418/203307 [28:31<230:42:20,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 419/203307 [28:35<230:45:50,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 419/203307 [28:35<230:45:56,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 420/203307 [28:39<230:44:00,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 420/203307 [28:39<230:44:00,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 421/203307 [28:43<230:44:45,  0.24it/s, v_num=t5e6, training/loss=0.151]Epoch 0:   0%|          | 421/203307 [28:43<230:44:45,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 422/203307 [28:47<230:42:59,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 422/203307 [28:47<230:43:04,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 423/203307 [28:51<230:42:07,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 423/203307 [28:51<230:42:12,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 424/203307 [28:55<230:40:31,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 424/203307 [28:55<230:40:34,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 425/203307 [29:00<230:47:19,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 425/203307 [29:00<230:47:23,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 426/203307 [29:04<230:46:00,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 426/203307 [29:04<230:46:00,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 427/203307 [29:08<230:44:39,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 427/203307 [29:08<230:44:39,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 428/203307 [29:13<230:50:14,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 428/203307 [29:13<230:50:19,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 429/203307 [29:17<230:50:18,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 429/203307 [29:17<230:50:23,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 430/203307 [29:21<230:49:12,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 430/203307 [29:21<230:49:12,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 431/203307 [29:25<230:48:35,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 431/203307 [29:25<230:48:40,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 432/203307 [29:29<230:47:16,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 432/203307 [29:29<230:47:21,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 433/203307 [29:33<230:48:27,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 433/203307 [29:33<230:48:32,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 434/203307 [29:37<230:47:32,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 434/203307 [29:37<230:47:37,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 435/203307 [29:41<230:50:07,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 435/203307 [29:41<230:50:07,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 436/203307 [29:46<230:54:35,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 436/203307 [29:46<230:54:40,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 437/203307 [29:50<230:54:06,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 437/203307 [29:50<230:54:11,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 438/203307 [29:54<230:52:23,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 438/203307 [29:54<230:52:25,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 439/203307 [29:58<230:51:38,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 439/203307 [29:58<230:51:43,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 440/203307 [30:02<230:50:07,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 440/203307 [30:02<230:50:13,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 441/203307 [30:06<230:50:30,  0.24it/s, v_num=t5e6, training/loss=0.148]Epoch 0:   0%|          | 441/203307 [30:06<230:50:30,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 442/203307 [30:10<230:53:13,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 442/203307 [30:11<230:53:18,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 443/203307 [30:14<230:50:52,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 443/203307 [30:14<230:50:57,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 444/203307 [30:19<230:55:07,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 444/203307 [30:19<230:55:11,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 445/203307 [30:23<230:54:48,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 445/203307 [30:23<230:54:52,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 446/203307 [30:27<230:52:53,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 446/203307 [30:27<230:52:57,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 447/203307 [30:31<230:52:16,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 447/203307 [30:31<230:52:18,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 448/203307 [30:35<230:51:08,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 448/203307 [30:35<230:51:12,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 449/203307 [30:39<230:50:52,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 449/203307 [30:39<230:50:58,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 450/203307 [30:44<230:55:51,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 450/203307 [30:44<230:55:56,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 451/203307 [30:48<230:54:55,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 451/203307 [30:48<230:54:59,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 452/203307 [30:52<230:59:15,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 452/203307 [30:52<230:59:21,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 453/203307 [30:57<230:59:27,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 453/203307 [30:57<230:59:31,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 454/203307 [31:01<230:59:00,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 454/203307 [31:01<230:59:05,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 455/203307 [31:05<230:58:20,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 455/203307 [31:05<230:58:24,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 456/203307 [31:09<230:57:04,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 456/203307 [31:09<230:57:09,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 457/203307 [31:13<230:56:45,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 457/203307 [31:13<230:56:50,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 458/203307 [31:17<230:57:08,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 458/203307 [31:17<230:57:12,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 459/203307 [31:21<231:01:07,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 459/203307 [31:21<231:01:08,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 460/203307 [31:26<231:04:33,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 460/203307 [31:26<231:04:35,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 461/203307 [31:30<231:04:03,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 461/203307 [31:30<231:04:07,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 462/203307 [31:34<231:02:55,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 462/203307 [31:34<231:02:55,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 463/203307 [31:38<231:01:54,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 463/203307 [31:38<231:01:58,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 464/203307 [31:42<231:00:47,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 464/203307 [31:42<231:00:51,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 465/203307 [31:46<231:01:21,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 465/203307 [31:46<231:01:26,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 466/203307 [31:50<231:01:20,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 466/203307 [31:50<231:01:24,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 467/203307 [31:55<231:05:35,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 467/203307 [31:55<231:05:42,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 468/203307 [31:59<231:04:21,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 468/203307 [31:59<231:04:25,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 469/203307 [32:03<231:04:34,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 469/203307 [32:03<231:04:39,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 470/203307 [32:07<231:05:35,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 470/203307 [32:07<231:05:36,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 471/203307 [32:11<231:04:13,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 471/203307 [32:11<231:04:18,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 472/203307 [32:15<231:02:44,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 472/203307 [32:15<231:02:45,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 473/203307 [32:19<231:02:10,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 473/203307 [32:19<231:02:15,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 474/203307 [32:24<231:05:52,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 474/203307 [32:24<231:05:53,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 475/203307 [32:28<231:05:57,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 475/203307 [32:28<231:06:00,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 476/203307 [32:32<231:04:33,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 476/203307 [32:32<231:04:37,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 477/203307 [32:36<231:08:50,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 477/203307 [32:36<231:08:55,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 478/203307 [32:40<231:07:57,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 478/203307 [32:40<231:08:02,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 479/203307 [32:44<231:07:01,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 479/203307 [32:44<231:07:06,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 480/203307 [32:48<231:05:28,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 480/203307 [32:48<231:05:28,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 481/203307 [32:52<231:05:39,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 481/203307 [32:52<231:05:44,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 482/203307 [32:57<231:06:15,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 482/203307 [32:57<231:06:16,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 483/203307 [33:01<231:05:36,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 483/203307 [33:01<231:05:40,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 484/203307 [33:05<231:09:43,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 484/203307 [33:05<231:09:47,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 485/203307 [33:10<231:14:05,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 485/203307 [33:10<231:14:10,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 486/203307 [33:14<231:12:55,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 486/203307 [33:14<231:12:56,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 487/203307 [33:18<231:12:27,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 487/203307 [33:18<231:12:31,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 488/203307 [33:22<231:11:06,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 488/203307 [33:22<231:11:11,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 489/203307 [33:26<231:11:19,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 489/203307 [33:26<231:11:24,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 490/203307 [33:30<231:09:53,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 490/203307 [33:30<231:09:58,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 491/203307 [33:35<231:14:08,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 491/203307 [33:35<231:14:13,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 492/203307 [33:39<231:12:40,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 492/203307 [33:39<231:12:44,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 493/203307 [33:43<231:13:20,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 493/203307 [33:43<231:13:24,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 494/203307 [33:48<231:17:43,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 494/203307 [33:48<231:17:47,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 495/203307 [33:52<231:16:42,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 495/203307 [33:52<231:16:47,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 496/203307 [33:56<231:15:52,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 496/203307 [33:56<231:15:57,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 497/203307 [34:00<231:15:53,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 497/203307 [34:00<231:15:58,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 498/203307 [34:04<231:14:46,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 498/203307 [34:04<231:14:51,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 499/203307 [34:08<231:14:24,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 499/203307 [34:08<231:14:25,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 500/203307 [34:12<231:13:38,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 500/203307 [34:12<231:13:43,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 501/203307 [34:17<231:18:10,  0.24it/s, v_num=t5e6, training/loss=0.146]Epoch 0:   0%|          | 501/203307 [34:17<231:18:15,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 502/203307 [34:21<231:21:17,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 502/203307 [34:21<231:21:17,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 503/203307 [34:25<231:19:58,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 503/203307 [34:25<231:19:58,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 504/203307 [34:29<231:18:36,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 504/203307 [34:29<231:18:41,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 505/203307 [34:33<231:18:23,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 505/203307 [34:33<231:18:27,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 506/203307 [34:37<231:17:28,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 506/203307 [34:37<231:17:33,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 507/203307 [34:41<231:17:52,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 507/203307 [34:41<231:17:56,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 508/203307 [34:46<231:21:23,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 508/203307 [34:46<231:21:27,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 509/203307 [34:50<231:20:44,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 509/203307 [34:50<231:20:48,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 510/203307 [34:54<231:23:45,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 510/203307 [34:54<231:23:45,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 511/203307 [34:58<231:22:38,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 511/203307 [34:58<231:22:43,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 512/203307 [35:02<231:21:54,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 512/203307 [35:02<231:22:00,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 513/203307 [35:06<231:21:47,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 513/203307 [35:06<231:21:48,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 514/203307 [35:10<231:20:04,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 514/203307 [35:10<231:20:08,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 515/203307 [35:14<231:18:24,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 515/203307 [35:14<231:18:29,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 516/203307 [35:18<231:19:36,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 516/203307 [35:19<231:19:41,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 517/203307 [35:23<231:20:10,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 517/203307 [35:23<231:20:10,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 518/203307 [35:27<231:22:56,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 518/203307 [35:27<231:23:01,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 519/203307 [35:31<231:21:36,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 519/203307 [35:31<231:21:40,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 520/203307 [35:35<231:21:26,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 520/203307 [35:35<231:21:29,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 521/203307 [35:39<231:21:24,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 521/203307 [35:39<231:21:28,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 522/203307 [35:43<231:21:29,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 522/203307 [35:43<231:21:30,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 523/203307 [35:47<231:20:02,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 523/203307 [35:47<231:20:06,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 524/203307 [35:51<231:19:39,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 524/203307 [35:51<231:19:44,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 525/203307 [35:56<231:24:42,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 525/203307 [35:56<231:24:45,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 526/203307 [36:01<231:27:08,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 526/203307 [36:01<231:27:13,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 527/203307 [36:05<231:26:18,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 527/203307 [36:05<231:26:22,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 528/203307 [36:09<231:25:09,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 528/203307 [36:09<231:25:13,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 529/203307 [36:13<231:25:20,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 529/203307 [36:13<231:25:23,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 530/203307 [36:17<231:25:12,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 530/203307 [36:17<231:25:16,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 531/203307 [36:21<231:25:03,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 531/203307 [36:21<231:25:07,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 532/203307 [36:25<231:24:01,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 532/203307 [36:25<231:24:05,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 533/203307 [36:30<231:28:29,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 533/203307 [36:30<231:28:29,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 534/203307 [36:34<231:27:59,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 534/203307 [36:34<231:28:03,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 535/203307 [36:39<231:31:38,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 535/203307 [36:39<231:31:38,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 536/203307 [36:43<231:30:22,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 536/203307 [36:43<231:30:26,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 537/203307 [36:47<231:30:54,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 537/203307 [36:47<231:30:54,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 538/203307 [36:51<231:30:00,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 538/203307 [36:51<231:30:04,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 539/203307 [36:55<231:29:13,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 539/203307 [36:55<231:29:17,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 540/203307 [36:59<231:28:33,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 540/203307 [36:59<231:28:37,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 541/203307 [37:03<231:28:59,  0.24it/s, v_num=t5e6, training/loss=0.147]Epoch 0:   0%|          | 541/203307 [37:03<231:29:03,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 542/203307 [37:08<231:31:49,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 542/203307 [37:08<231:31:53,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 543/203307 [37:12<231:34:20,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 543/203307 [37:12<231:34:24,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 544/203307 [37:16<231:33:23,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 544/203307 [37:16<231:33:28,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 545/203307 [37:20<231:33:27,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 545/203307 [37:20<231:33:29,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 546/203307 [37:24<231:32:30,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 546/203307 [37:24<231:32:34,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 547/203307 [37:28<231:31:52,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 547/203307 [37:28<231:31:56,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 548/203307 [37:32<231:31:02,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 548/203307 [37:32<231:31:06,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 549/203307 [37:36<231:30:36,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 549/203307 [37:36<231:30:39,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 550/203307 [37:41<231:33:57,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 550/203307 [37:41<231:34:01,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 551/203307 [37:45<231:36:58,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 551/203307 [37:45<231:37:02,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 552/203307 [37:49<231:36:09,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 552/203307 [37:49<231:36:10,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 553/203307 [37:53<231:35:34,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 553/203307 [37:53<231:35:38,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 554/203307 [37:57<231:34:48,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 554/203307 [37:57<231:34:48,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 555/203307 [38:01<231:33:49,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 555/203307 [38:01<231:33:53,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 556/203307 [38:05<231:33:22,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 556/203307 [38:05<231:33:26,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 557/203307 [38:10<231:33:12,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 557/203307 [38:10<231:33:17,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 558/203307 [38:14<231:37:16,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 558/203307 [38:14<231:37:20,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 559/203307 [38:18<231:36:34,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 559/203307 [38:18<231:36:38,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 560/203307 [38:23<231:39:17,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 560/203307 [38:23<231:39:21,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 561/203307 [38:27<231:39:27,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 561/203307 [38:27<231:39:28,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 562/203307 [38:31<231:38:25,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 562/203307 [38:31<231:38:26,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 563/203307 [38:35<231:37:28,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 563/203307 [38:35<231:37:28,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 564/203307 [38:39<231:36:52,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 564/203307 [38:39<231:36:56,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 565/203307 [38:43<231:36:36,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 565/203307 [38:43<231:36:40,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 566/203307 [38:47<231:36:34,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 566/203307 [38:47<231:36:37,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 567/203307 [38:52<231:39:47,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 567/203307 [38:52<231:39:50,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 568/203307 [38:56<231:42:17,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 568/203307 [38:56<231:42:21,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 569/203307 [39:01<231:42:04,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 569/203307 [39:01<231:42:04,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 570/203307 [39:05<231:41:45,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 570/203307 [39:05<231:41:48,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 571/203307 [39:09<231:41:21,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 571/203307 [39:09<231:41:25,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 572/203307 [39:13<231:40:47,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 572/203307 [39:13<231:40:51,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 573/203307 [39:17<231:40:56,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 573/203307 [39:17<231:41:00,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 574/203307 [39:21<231:43:48,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 574/203307 [39:21<231:43:52,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 575/203307 [39:25<231:43:10,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 575/203307 [39:25<231:43:14,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 576/203307 [39:29<231:42:17,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 576/203307 [39:29<231:42:20,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 577/203307 [39:34<231:46:10,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 577/203307 [39:34<231:46:13,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 578/203307 [39:38<231:45:28,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 578/203307 [39:38<231:45:31,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 579/203307 [39:42<231:44:57,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 579/203307 [39:42<231:45:01,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 580/203307 [39:46<231:44:10,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 580/203307 [39:46<231:44:13,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 581/203307 [39:50<231:44:07,  0.24it/s, v_num=t5e6, training/loss=0.160]Epoch 0:   0%|          | 581/203307 [39:50<231:44:10,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 582/203307 [39:54<231:43:06,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 582/203307 [39:54<231:43:09,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 583/203307 [39:58<231:43:03,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 583/203307 [39:58<231:43:03,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 584/203307 [40:03<231:44:59,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 584/203307 [40:03<231:44:59,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 585/203307 [40:08<231:48:10,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 585/203307 [40:08<231:48:14,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 586/203307 [40:12<231:47:00,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 586/203307 [40:12<231:47:03,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 587/203307 [40:16<231:46:15,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 587/203307 [40:16<231:46:19,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 588/203307 [40:19<231:45:13,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 588/203307 [40:19<231:45:16,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 589/203307 [40:24<231:45:12,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 589/203307 [40:24<231:45:12,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 590/203307 [40:28<231:44:33,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 590/203307 [40:28<231:44:34,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 591/203307 [40:32<231:47:58,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 591/203307 [40:32<231:48:02,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 592/203307 [40:36<231:46:26,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 592/203307 [40:36<231:46:30,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 593/203307 [40:40<231:46:30,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 593/203307 [40:40<231:46:34,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 594/203307 [40:45<231:49:29,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 594/203307 [40:45<231:49:32,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 595/203307 [40:49<231:48:46,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 595/203307 [40:49<231:48:46,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 596/203307 [40:53<231:47:09,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 596/203307 [40:53<231:47:13,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 597/203307 [40:57<231:47:27,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 597/203307 [40:57<231:47:30,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 598/203307 [41:01<231:46:34,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 598/203307 [41:01<231:46:37,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 599/203307 [41:06<231:50:54,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 599/203307 [41:06<231:50:58,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 600/203307 [41:10<231:50:51,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 600/203307 [41:10<231:50:54,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 601/203307 [41:14<231:50:48,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 601/203307 [41:14<231:50:51,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 602/203307 [41:19<231:53:25,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 602/203307 [41:19<231:53:30,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 603/203307 [41:23<231:52:46,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 603/203307 [41:23<231:52:50,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 604/203307 [41:27<231:51:41,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 604/203307 [41:27<231:51:42,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 605/203307 [41:31<231:51:43,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 605/203307 [41:31<231:51:43,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 606/203307 [41:35<231:49:55,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 606/203307 [41:35<231:49:57,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 607/203307 [41:39<231:49:11,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 607/203307 [41:39<231:49:11,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 608/203307 [41:43<231:53:11,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 608/203307 [41:43<231:53:15,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 609/203307 [41:48<231:52:57,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 609/203307 [41:48<231:53:00,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 610/203307 [41:52<231:55:35,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 610/203307 [41:52<231:55:38,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 611/203307 [41:56<231:54:42,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 611/203307 [41:56<231:54:45,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 612/203307 [42:00<231:53:40,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 612/203307 [42:00<231:53:44,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 613/203307 [42:04<231:53:17,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 613/203307 [42:04<231:53:18,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 614/203307 [42:08<231:52:33,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 614/203307 [42:08<231:52:35,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 615/203307 [42:12<231:51:31,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 615/203307 [42:12<231:51:32,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 616/203307 [42:17<231:55:13,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 616/203307 [42:17<231:55:14,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 617/203307 [42:21<231:54:59,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 617/203307 [42:21<231:55:02,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 618/203307 [42:26<231:57:48,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 618/203307 [42:26<231:57:49,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 619/203307 [42:30<231:57:10,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 619/203307 [42:30<231:57:10,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 620/203307 [42:34<231:56:26,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 620/203307 [42:34<231:56:26,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 621/203307 [42:38<231:56:22,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 621/203307 [42:38<231:56:25,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 622/203307 [42:42<231:55:53,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 622/203307 [42:42<231:55:57,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 623/203307 [42:46<231:55:00,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 623/203307 [42:46<231:55:03,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 624/203307 [42:51<231:58:48,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 624/203307 [42:51<231:58:52,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 625/203307 [42:55<231:59:17,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 625/203307 [42:55<231:59:17,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 626/203307 [42:59<232:02:05,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 626/203307 [42:59<232:02:09,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 627/203307 [43:04<232:01:29,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 627/203307 [43:04<232:01:30,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 628/203307 [43:07<232:00:28,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 628/203307 [43:07<232:00:32,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 629/203307 [43:12<232:00:18,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 629/203307 [43:12<232:00:21,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 630/203307 [43:15<231:59:14,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 630/203307 [43:15<231:59:14,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 631/203307 [43:19<231:58:25,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 631/203307 [43:19<231:58:29,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 632/203307 [43:23<231:57:24,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 632/203307 [43:23<231:57:27,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 633/203307 [43:28<232:00:37,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 633/203307 [43:28<232:00:40,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 634/203307 [43:32<232:00:35,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 634/203307 [43:32<232:00:39,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 635/203307 [43:37<232:03:24,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 635/203307 [43:37<232:03:24,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 636/203307 [43:41<232:02:28,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 636/203307 [43:41<232:02:32,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 637/203307 [43:45<232:02:27,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 637/203307 [43:45<232:02:29,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 638/203307 [43:49<232:01:26,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 638/203307 [43:49<232:01:29,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 639/203307 [43:53<232:01:43,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 639/203307 [43:53<232:01:44,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 640/203307 [43:58<232:04:26,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 640/203307 [43:58<232:04:30,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 641/203307 [44:02<232:04:27,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 641/203307 [44:02<232:04:28,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 642/203307 [44:06<232:04:36,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 642/203307 [44:06<232:04:37,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 643/203307 [44:11<232:06:29,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 643/203307 [44:11<232:06:33,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 644/203307 [44:15<232:05:30,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 644/203307 [44:15<232:05:33,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 645/203307 [44:19<232:05:20,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 645/203307 [44:19<232:05:21,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 646/203307 [44:23<232:04:10,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 646/203307 [44:23<232:04:13,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 647/203307 [44:27<232:03:21,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 647/203307 [44:27<232:03:24,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 648/203307 [44:31<232:02:55,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 648/203307 [44:31<232:02:55,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 649/203307 [44:35<232:02:45,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 649/203307 [44:35<232:02:47,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 650/203307 [44:39<232:03:34,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 650/203307 [44:39<232:03:36,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 651/203307 [44:44<232:06:33,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 651/203307 [44:44<232:06:33,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 652/203307 [44:48<232:05:32,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 652/203307 [44:48<232:05:35,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 653/203307 [44:52<232:05:17,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 653/203307 [44:52<232:05:20,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 654/203307 [44:56<232:04:26,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 654/203307 [44:56<232:04:28,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 655/203307 [45:00<232:03:31,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 655/203307 [45:00<232:03:35,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 656/203307 [45:04<232:02:45,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 656/203307 [45:04<232:02:48,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 657/203307 [45:09<232:06:40,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 657/203307 [45:09<232:06:43,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 658/203307 [45:12<232:05:02,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 658/203307 [45:12<232:05:06,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 659/203307 [45:17<232:07:27,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 659/203307 [45:17<232:07:28,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 660/203307 [45:21<232:06:21,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 660/203307 [45:21<232:06:22,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 661/203307 [45:25<232:06:28,  0.24it/s, v_num=t5e6, training/loss=0.141]Epoch 0:   0%|          | 661/203307 [45:25<232:06:29,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 662/203307 [45:29<232:05:45,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 662/203307 [45:29<232:05:49,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 663/203307 [45:33<232:05:02,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 663/203307 [45:33<232:05:05,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 664/203307 [45:37<232:04:11,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 664/203307 [45:37<232:04:15,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 665/203307 [45:42<232:07:37,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 665/203307 [45:42<232:07:39,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 666/203307 [45:46<232:07:07,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 666/203307 [45:46<232:07:10,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 667/203307 [45:50<232:09:06,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 667/203307 [45:50<232:09:10,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 668/203307 [45:54<232:08:16,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 668/203307 [45:54<232:08:19,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 669/203307 [45:59<232:08:35,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 669/203307 [45:59<232:08:39,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 670/203307 [46:03<232:07:43,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 670/203307 [46:03<232:07:47,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 671/203307 [46:07<232:06:53,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 671/203307 [46:07<232:06:54,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 672/203307 [46:10<232:05:53,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 672/203307 [46:10<232:05:57,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 673/203307 [46:15<232:05:38,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 673/203307 [46:15<232:05:41,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 674/203307 [46:19<232:08:14,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 674/203307 [46:19<232:08:17,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 675/203307 [46:23<232:07:17,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 675/203307 [46:23<232:07:20,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 676/203307 [46:28<232:09:29,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 676/203307 [46:28<232:09:29,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 677/203307 [46:32<232:09:11,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 677/203307 [46:32<232:09:12,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 678/203307 [46:36<232:08:00,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 678/203307 [46:36<232:08:04,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 679/203307 [46:40<232:07:16,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 679/203307 [46:40<232:07:19,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 680/203307 [46:44<232:06:52,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 680/203307 [46:44<232:06:56,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 681/203307 [46:48<232:06:45,  0.24it/s, v_num=t5e6, training/loss=0.144]Epoch 0:   0%|          | 681/203307 [46:48<232:06:46,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 682/203307 [46:53<232:09:25,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 682/203307 [46:53<232:09:28,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 683/203307 [46:57<232:09:00,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 683/203307 [46:57<232:09:03,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 684/203307 [47:01<232:11:14,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 684/203307 [47:01<232:11:18,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 685/203307 [47:05<232:11:02,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 685/203307 [47:05<232:11:05,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 686/203307 [47:09<232:10:12,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 686/203307 [47:09<232:10:16,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 687/203307 [47:13<232:09:45,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 687/203307 [47:13<232:09:47,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 688/203307 [47:17<232:09:28,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 688/203307 [47:17<232:09:31,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 689/203307 [47:22<232:09:49,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 689/203307 [47:22<232:09:52,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 690/203307 [47:26<232:12:13,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 690/203307 [47:26<232:12:14,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 691/203307 [47:30<232:11:39,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 691/203307 [47:30<232:11:42,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 692/203307 [47:35<232:13:48,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 692/203307 [47:35<232:13:51,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 693/203307 [47:39<232:13:48,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 693/203307 [47:39<232:13:51,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 694/203307 [47:43<232:13:01,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 694/203307 [47:43<232:13:03,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 695/203307 [47:47<232:12:18,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 695/203307 [47:47<232:12:21,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 696/203307 [47:51<232:11:47,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 696/203307 [47:51<232:11:47,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 697/203307 [47:55<232:11:36,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 697/203307 [47:55<232:11:39,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 698/203307 [47:59<232:10:45,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 698/203307 [47:59<232:10:48,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 699/203307 [48:04<232:12:46,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 699/203307 [48:04<232:12:50,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 700/203307 [48:08<232:14:48,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 700/203307 [48:08<232:14:49,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 701/203307 [48:12<232:14:57,  0.24it/s, v_num=t5e6, training/loss=0.143]Epoch 0:   0%|          | 701/203307 [48:12<232:15:00,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 702/203307 [48:16<232:14:15,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 702/203307 [48:16<232:14:18,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 703/203307 [48:20<232:13:59,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 703/203307 [48:20<232:14:01,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 704/203307 [48:24<232:13:00,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 704/203307 [48:24<232:13:03,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 705/203307 [48:28<232:12:47,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 705/203307 [48:28<232:12:48,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 706/203307 [48:33<232:15:59,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 706/203307 [48:33<232:16:02,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 707/203307 [48:37<232:14:50,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 707/203307 [48:37<232:14:51,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 708/203307 [48:42<232:16:51,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 708/203307 [48:42<232:16:54,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 709/203307 [48:46<232:17:01,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 709/203307 [48:46<232:17:03,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 710/203307 [48:50<232:15:42,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 710/203307 [48:50<232:15:45,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 711/203307 [48:54<232:15:16,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 711/203307 [48:54<232:15:20,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 712/203307 [48:58<232:14:50,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 712/203307 [48:58<232:14:51,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 713/203307 [49:02<232:14:30,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 713/203307 [49:02<232:14:32,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 714/203307 [49:06<232:13:14,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 714/203307 [49:06<232:13:15,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 715/203307 [49:10<232:12:36,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 715/203307 [49:10<232:12:39,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 716/203307 [49:14<232:14:45,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 716/203307 [49:14<232:14:48,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 717/203307 [49:19<232:14:56,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 717/203307 [49:19<232:14:59,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 718/203307 [49:23<232:13:58,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 718/203307 [49:23<232:14:01,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 719/203307 [49:27<232:13:12,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 719/203307 [49:27<232:13:12,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 720/203307 [49:30<232:12:12,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 720/203307 [49:30<232:12:15,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 721/203307 [49:35<232:12:26,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   0%|          | 721/203307 [49:35<232:12:29,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 722/203307 [49:39<232:11:41,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 722/203307 [49:39<232:11:45,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 723/203307 [49:43<232:14:39,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 723/203307 [49:43<232:14:40,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 724/203307 [49:47<232:13:50,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 724/203307 [49:47<232:13:52,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 725/203307 [49:52<232:16:09,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 725/203307 [49:52<232:16:10,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 726/203307 [49:56<232:16:47,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 726/203307 [49:56<232:16:47,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 727/203307 [50:00<232:16:12,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 727/203307 [50:00<232:16:15,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 728/203307 [50:04<232:15:47,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 728/203307 [50:04<232:15:48,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 729/203307 [50:09<232:16:24,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 729/203307 [50:09<232:16:25,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 730/203307 [50:13<232:15:39,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 730/203307 [50:13<232:15:41,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 731/203307 [50:17<232:18:45,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 731/203307 [50:17<232:18:49,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 732/203307 [50:21<232:17:53,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 732/203307 [50:21<232:17:56,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 733/203307 [50:26<232:20:36,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 733/203307 [50:26<232:20:39,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 734/203307 [50:30<232:20:25,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 734/203307 [50:30<232:20:26,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 735/203307 [50:34<232:19:51,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 735/203307 [50:34<232:19:54,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 736/203307 [50:38<232:19:14,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 736/203307 [50:38<232:19:17,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 737/203307 [50:42<232:18:52,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 737/203307 [50:42<232:18:55,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 738/203307 [50:46<232:17:56,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 738/203307 [50:46<232:17:57,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 739/203307 [50:50<232:17:23,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 739/203307 [50:50<232:17:23,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 740/203307 [50:55<232:21:37,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 740/203307 [50:55<232:21:40,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 741/203307 [51:00<232:24:22,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   0%|          | 741/203307 [51:00<232:24:24,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 742/203307 [51:04<232:23:33,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 742/203307 [51:04<232:23:35,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 743/203307 [51:08<232:23:24,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 743/203307 [51:08<232:23:26,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 744/203307 [51:12<232:22:19,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 744/203307 [51:12<232:22:22,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 745/203307 [51:16<232:22:13,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 745/203307 [51:16<232:22:13,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 746/203307 [51:20<232:21:24,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 746/203307 [51:20<232:21:27,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 747/203307 [51:24<232:20:28,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 747/203307 [51:24<232:20:32,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 748/203307 [51:29<232:22:57,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 748/203307 [51:29<232:23:00,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 749/203307 [51:34<232:26:06,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 749/203307 [51:34<232:26:09,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 750/203307 [51:38<232:25:03,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 750/203307 [51:38<232:25:05,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 751/203307 [51:42<232:25:02,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 751/203307 [51:42<232:25:05,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 752/203307 [51:46<232:23:40,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 752/203307 [51:46<232:23:43,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 753/203307 [51:50<232:23:39,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 753/203307 [51:50<232:23:42,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 754/203307 [51:54<232:22:40,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 754/203307 [51:54<232:22:43,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 755/203307 [51:58<232:22:12,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 755/203307 [51:58<232:22:15,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 756/203307 [52:02<232:24:39,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 756/203307 [52:02<232:24:42,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 757/203307 [52:07<232:27:38,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 757/203307 [52:07<232:27:41,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 758/203307 [52:11<232:26:53,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 758/203307 [52:11<232:26:53,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 759/203307 [52:15<232:26:03,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 759/203307 [52:15<232:26:05,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 760/203307 [52:19<232:25:24,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 760/203307 [52:19<232:25:27,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 761/203307 [52:23<232:25:30,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 761/203307 [52:23<232:25:33,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 762/203307 [52:27<232:24:38,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 762/203307 [52:27<232:24:41,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 763/203307 [52:31<232:22:44,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 763/203307 [52:31<232:22:45,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 764/203307 [52:35<232:22:08,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 764/203307 [52:35<232:22:10,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 765/203307 [52:40<232:27:53,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 765/203307 [52:40<232:27:54,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 766/203307 [52:44<232:26:56,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 766/203307 [52:44<232:26:56,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 767/203307 [52:48<232:26:31,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 767/203307 [52:48<232:26:31,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 768/203307 [52:52<232:26:28,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 768/203307 [52:52<232:26:31,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 769/203307 [52:57<232:26:15,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 769/203307 [52:57<232:26:15,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 770/203307 [53:01<232:25:35,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 770/203307 [53:01<232:25:38,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 771/203307 [53:05<232:25:26,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 771/203307 [53:05<232:25:28,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 772/203307 [53:09<232:27:33,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 772/203307 [53:09<232:27:34,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 773/203307 [53:14<232:27:50,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 773/203307 [53:14<232:27:53,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 774/203307 [53:18<232:30:03,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 774/203307 [53:18<232:30:05,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 775/203307 [53:22<232:29:16,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 775/203307 [53:22<232:29:18,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 776/203307 [53:26<232:29:00,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 776/203307 [53:26<232:29:03,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 777/203307 [53:30<232:29:24,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 777/203307 [53:30<232:29:24,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 778/203307 [53:34<232:28:46,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 778/203307 [53:34<232:28:48,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 779/203307 [53:38<232:27:50,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 779/203307 [53:38<232:27:53,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 780/203307 [53:43<232:28:09,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 780/203307 [53:43<232:28:12,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 781/203307 [53:47<232:28:15,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   0%|          | 781/203307 [53:47<232:28:15,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 782/203307 [53:51<232:29:43,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 782/203307 [53:51<232:29:46,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 783/203307 [53:55<232:29:18,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 783/203307 [53:55<232:29:19,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 784/203307 [53:59<232:29:02,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 784/203307 [53:59<232:29:05,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 785/203307 [54:04<232:28:50,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 785/203307 [54:04<232:28:50,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 786/203307 [54:08<232:28:13,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 786/203307 [54:08<232:28:16,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 787/203307 [54:12<232:27:38,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 787/203307 [54:12<232:27:41,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 788/203307 [54:16<232:27:37,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 788/203307 [54:16<232:27:39,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 789/203307 [54:20<232:30:20,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 789/203307 [54:20<232:30:21,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 790/203307 [54:25<232:31:32,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 790/203307 [54:25<232:31:35,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 791/203307 [54:29<232:30:39,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 791/203307 [54:29<232:30:42,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 792/203307 [54:33<232:30:34,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 792/203307 [54:33<232:30:34,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 793/203307 [54:37<232:30:16,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 793/203307 [54:37<232:30:16,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 794/203307 [54:41<232:29:50,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 794/203307 [54:41<232:29:53,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 795/203307 [54:45<232:29:02,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 795/203307 [54:45<232:29:05,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 796/203307 [54:49<232:28:48,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 796/203307 [54:49<232:28:51,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 797/203307 [54:54<232:30:27,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 797/203307 [54:54<232:30:30,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 798/203307 [54:58<232:32:27,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 798/203307 [54:58<232:32:30,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 799/203307 [55:02<232:31:35,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 799/203307 [55:02<232:31:38,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 800/203307 [55:06<232:31:16,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 800/203307 [55:06<232:31:18,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 801/203307 [55:11<232:31:20,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 801/203307 [55:11<232:31:20,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 802/203307 [55:15<232:30:40,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 802/203307 [55:15<232:30:42,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 803/203307 [55:18<232:29:41,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 803/203307 [55:18<232:29:46,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 804/203307 [55:22<232:29:11,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 804/203307 [55:22<232:29:14,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 805/203307 [55:26<232:28:34,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 805/203307 [55:26<232:28:39,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 806/203307 [55:31<232:30:44,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 806/203307 [55:31<232:30:47,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 807/203307 [55:35<232:30:27,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 807/203307 [55:35<232:30:30,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 808/203307 [55:39<232:30:18,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 808/203307 [55:39<232:30:19,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 809/203307 [55:43<232:30:22,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 809/203307 [55:44<232:30:25,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 810/203307 [55:47<232:29:42,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 810/203307 [55:47<232:29:45,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 811/203307 [55:51<232:28:54,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 811/203307 [55:51<232:28:56,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 812/203307 [55:56<232:28:44,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 812/203307 [55:56<232:28:45,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 813/203307 [56:00<232:28:17,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 813/203307 [56:00<232:28:19,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 814/203307 [56:04<232:30:51,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 814/203307 [56:04<232:30:54,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 815/203307 [56:08<232:29:59,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 815/203307 [56:08<232:29:59,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 816/203307 [56:12<232:30:06,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 816/203307 [56:12<232:30:09,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 817/203307 [56:17<232:29:41,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 817/203307 [56:17<232:29:43,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 818/203307 [56:21<232:30:00,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 818/203307 [56:21<232:30:05,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 819/203307 [56:25<232:29:06,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 819/203307 [56:25<232:29:09,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 820/203307 [56:29<232:28:55,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 820/203307 [56:29<232:28:57,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 821/203307 [56:33<232:28:28,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   0%|          | 821/203307 [56:33<232:28:31,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 822/203307 [56:38<232:30:42,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 822/203307 [56:38<232:30:45,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 823/203307 [56:42<232:32:04,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 823/203307 [56:42<232:32:07,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 824/203307 [56:46<232:31:49,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 824/203307 [56:46<232:31:49,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 825/203307 [56:50<232:31:38,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 825/203307 [56:50<232:31:40,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 826/203307 [56:54<232:31:39,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 826/203307 [56:54<232:31:42,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 827/203307 [56:58<232:30:45,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 827/203307 [56:58<232:30:46,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 828/203307 [57:02<232:30:36,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 828/203307 [57:02<232:30:37,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 829/203307 [57:06<232:29:42,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 829/203307 [57:06<232:29:44,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 830/203307 [57:10<232:28:51,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 830/203307 [57:10<232:28:51,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 831/203307 [57:15<232:33:11,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 831/203307 [57:16<232:33:14,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 832/203307 [57:20<232:33:09,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 832/203307 [57:20<232:33:09,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 833/203307 [57:24<232:32:23,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 833/203307 [57:24<232:32:25,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 834/203307 [57:28<232:31:59,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 834/203307 [57:28<232:32:02,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 835/203307 [57:32<232:32:16,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 835/203307 [57:32<232:32:19,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 836/203307 [57:36<232:31:57,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 836/203307 [57:36<232:31:58,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 837/203307 [57:40<232:31:46,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 837/203307 [57:40<232:31:48,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 838/203307 [57:45<232:33:24,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 838/203307 [57:45<232:33:27,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 839/203307 [57:49<232:35:30,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 839/203307 [57:49<232:35:33,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 840/203307 [57:53<232:35:22,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 840/203307 [57:53<232:35:23,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 841/203307 [57:57<232:34:54,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   0%|          | 841/203307 [57:57<232:34:57,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 842/203307 [58:01<232:34:27,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 842/203307 [58:01<232:34:30,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 843/203307 [58:06<232:34:55,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 843/203307 [58:06<232:34:56,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 844/203307 [58:10<232:35:03,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 844/203307 [58:10<232:35:04,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 845/203307 [58:14<232:34:31,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 845/203307 [58:14<232:34:33,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 846/203307 [58:18<232:33:56,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 846/203307 [58:18<232:33:58,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 847/203307 [58:23<232:36:18,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 847/203307 [58:23<232:36:21,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 848/203307 [58:27<232:38:32,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 848/203307 [58:27<232:38:35,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 849/203307 [58:31<232:37:46,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 849/203307 [58:31<232:37:48,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 850/203307 [58:35<232:37:12,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 850/203307 [58:35<232:37:14,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 851/203307 [58:39<232:36:19,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 851/203307 [58:39<232:36:22,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 852/203307 [58:44<232:36:27,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 852/203307 [58:44<232:36:30,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 853/203307 [58:48<232:36:05,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 853/203307 [58:48<232:36:05,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 854/203307 [58:51<232:34:55,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 854/203307 [58:51<232:34:58,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 855/203307 [58:56<232:36:49,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 855/203307 [58:56<232:36:50,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 856/203307 [59:00<232:37:04,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 856/203307 [59:00<232:37:06,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 857/203307 [59:04<232:36:33,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 857/203307 [59:04<232:36:35,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 858/203307 [59:08<232:36:21,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 858/203307 [59:08<232:36:23,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 859/203307 [59:12<232:35:37,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 859/203307 [59:12<232:35:40,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 860/203307 [59:17<232:35:46,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 860/203307 [59:17<232:35:49,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 861/203307 [59:21<232:35:13,  0.24it/s, v_num=t5e6, training/loss=0.136]Epoch 0:   0%|          | 861/203307 [59:21<232:35:15,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 862/203307 [59:25<232:34:32,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 862/203307 [59:25<232:34:35,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 863/203307 [59:29<232:36:42,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 863/203307 [59:29<232:36:45,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 864/203307 [59:33<232:36:48,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 864/203307 [59:33<232:36:50,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 865/203307 [59:37<232:36:08,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 865/203307 [59:37<232:36:11,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 866/203307 [59:41<232:35:34,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 866/203307 [59:41<232:35:35,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 867/203307 [59:45<232:35:05,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 867/203307 [59:45<232:35:05,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 868/203307 [59:50<232:34:51,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 868/203307 [59:50<232:34:53,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 869/203307 [59:54<232:34:27,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 869/203307 [59:54<232:34:29,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 870/203307 [59:58<232:34:35,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 870/203307 [59:58<232:34:37,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 871/203307 [1:00:02<232:34:36,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 871/203307 [1:00:02<232:34:39,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 872/203307 [1:00:07<232:37:27,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 872/203307 [1:00:07<232:37:30,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 873/203307 [1:00:11<232:36:42,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 873/203307 [1:00:11<232:36:44,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 874/203307 [1:00:15<232:35:59,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 874/203307 [1:00:15<232:35:59,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 875/203307 [1:00:19<232:35:56,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 875/203307 [1:00:19<232:35:58,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 876/203307 [1:00:23<232:35:50,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 876/203307 [1:00:23<232:35:53,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 877/203307 [1:00:27<232:35:24,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 877/203307 [1:00:27<232:35:27,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 878/203307 [1:00:31<232:36:05,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 878/203307 [1:00:31<232:36:08,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 879/203307 [1:00:35<232:35:43,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 879/203307 [1:00:35<232:35:43,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 880/203307 [1:00:40<232:38:40,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 880/203307 [1:00:40<232:38:41,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 881/203307 [1:00:44<232:37:55,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   0%|          | 881/203307 [1:00:44<232:37:57,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 882/203307 [1:00:48<232:37:21,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 882/203307 [1:00:48<232:37:23,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 883/203307 [1:00:52<232:37:10,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 883/203307 [1:00:52<232:37:13,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 884/203307 [1:00:57<232:37:25,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 884/203307 [1:00:57<232:37:27,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 885/203307 [1:01:00<232:35:25,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 885/203307 [1:01:00<232:35:27,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 886/203307 [1:01:04<232:35:03,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 886/203307 [1:01:04<232:35:06,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 887/203307 [1:01:09<232:34:53,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 887/203307 [1:01:09<232:34:54,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 888/203307 [1:01:13<232:37:49,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 888/203307 [1:01:13<232:37:51,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 889/203307 [1:01:17<232:37:25,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 889/203307 [1:01:17<232:37:27,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 890/203307 [1:01:22<232:37:09,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 890/203307 [1:01:22<232:37:11,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 891/203307 [1:01:26<232:37:07,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 891/203307 [1:01:26<232:37:09,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 892/203307 [1:01:30<232:37:36,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 892/203307 [1:01:30<232:37:38,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 893/203307 [1:01:34<232:37:57,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 893/203307 [1:01:34<232:37:59,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 894/203307 [1:01:38<232:37:52,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 894/203307 [1:01:38<232:37:54,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 895/203307 [1:01:42<232:37:32,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 895/203307 [1:01:42<232:37:33,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 896/203307 [1:01:47<232:40:18,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 896/203307 [1:01:47<232:40:19,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 897/203307 [1:01:52<232:42:02,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 897/203307 [1:01:52<232:42:04,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 898/203307 [1:01:56<232:41:22,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 898/203307 [1:01:56<232:41:23,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 899/203307 [1:02:00<232:41:35,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 899/203307 [1:02:00<232:41:37,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 900/203307 [1:02:04<232:41:40,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 900/203307 [1:02:04<232:41:42,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 901/203307 [1:02:08<232:41:06,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 901/203307 [1:02:08<232:41:07,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 902/203307 [1:02:12<232:40:38,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 902/203307 [1:02:12<232:40:41,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 903/203307 [1:02:17<232:40:40,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 903/203307 [1:02:17<232:40:42,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 904/203307 [1:02:21<232:42:54,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 904/203307 [1:02:21<232:42:56,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 905/203307 [1:02:25<232:42:43,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 905/203307 [1:02:25<232:42:45,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 906/203307 [1:02:29<232:42:25,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 906/203307 [1:02:29<232:42:28,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 907/203307 [1:02:34<232:42:17,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 907/203307 [1:02:34<232:42:19,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 908/203307 [1:02:38<232:42:23,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 908/203307 [1:02:38<232:42:25,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 909/203307 [1:02:42<232:42:08,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 909/203307 [1:02:42<232:42:11,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 910/203307 [1:02:46<232:41:47,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 910/203307 [1:02:46<232:41:47,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 911/203307 [1:02:50<232:41:37,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 911/203307 [1:02:50<232:41:37,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 912/203307 [1:02:55<232:44:20,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 912/203307 [1:02:55<232:44:21,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 913/203307 [1:02:59<232:43:52,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 913/203307 [1:02:59<232:43:54,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 914/203307 [1:03:03<232:44:45,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 914/203307 [1:03:03<232:44:45,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 915/203307 [1:03:07<232:44:30,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 915/203307 [1:03:07<232:44:32,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 916/203307 [1:03:12<232:44:44,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 916/203307 [1:03:12<232:44:46,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 917/203307 [1:03:16<232:44:21,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 917/203307 [1:03:16<232:44:23,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 918/203307 [1:03:20<232:43:58,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 918/203307 [1:03:20<232:43:58,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 919/203307 [1:03:24<232:44:08,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 919/203307 [1:03:24<232:44:08,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 920/203307 [1:03:28<232:43:58,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 920/203307 [1:03:28<232:43:59,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 921/203307 [1:03:33<232:45:24,  0.24it/s, v_num=t5e6, training/loss=0.134]Epoch 0:   0%|          | 921/203307 [1:03:33<232:45:26,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 922/203307 [1:03:37<232:44:41,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 922/203307 [1:03:37<232:44:44,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 923/203307 [1:03:41<232:44:27,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 923/203307 [1:03:41<232:44:29,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 924/203307 [1:03:45<232:44:27,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 924/203307 [1:03:45<232:44:27,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 925/203307 [1:03:49<232:44:18,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 925/203307 [1:03:49<232:44:18,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 926/203307 [1:03:53<232:43:31,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 926/203307 [1:03:53<232:43:32,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 927/203307 [1:03:57<232:43:33,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 927/203307 [1:03:57<232:43:35,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 928/203307 [1:04:01<232:43:00,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 928/203307 [1:04:01<232:43:03,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 929/203307 [1:04:06<232:45:08,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 929/203307 [1:04:06<232:45:10,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 930/203307 [1:04:10<232:43:37,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 930/203307 [1:04:10<232:43:40,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 931/203307 [1:04:14<232:43:43,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 931/203307 [1:04:14<232:43:45,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 932/203307 [1:04:18<232:43:05,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 932/203307 [1:04:18<232:43:07,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 933/203307 [1:04:22<232:42:40,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 933/203307 [1:04:22<232:42:43,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 934/203307 [1:04:26<232:41:22,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 934/203307 [1:04:26<232:41:22,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 935/203307 [1:04:30<232:41:14,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 935/203307 [1:04:30<232:41:17,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 936/203307 [1:04:34<232:41:07,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 936/203307 [1:04:34<232:41:08,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 937/203307 [1:04:39<232:43:07,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 937/203307 [1:04:39<232:43:10,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 938/203307 [1:04:43<232:44:48,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 938/203307 [1:04:43<232:44:51,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 939/203307 [1:04:47<232:44:12,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 939/203307 [1:04:47<232:44:14,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 940/203307 [1:04:51<232:43:54,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 940/203307 [1:04:51<232:43:55,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 941/203307 [1:04:55<232:43:37,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 941/203307 [1:04:55<232:43:40,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 942/203307 [1:04:59<232:42:57,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 942/203307 [1:04:59<232:43:00,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 943/203307 [1:05:03<232:42:12,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 943/203307 [1:05:03<232:42:14,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 944/203307 [1:05:07<232:41:58,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 944/203307 [1:05:07<232:42:00,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 945/203307 [1:05:11<232:40:42,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 945/203307 [1:05:11<232:40:43,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 946/203307 [1:05:16<232:44:34,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 946/203307 [1:05:16<232:44:36,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 947/203307 [1:05:20<232:43:57,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 947/203307 [1:05:20<232:44:00,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 948/203307 [1:05:24<232:43:17,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 948/203307 [1:05:24<232:43:17,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 949/203307 [1:05:28<232:42:23,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 949/203307 [1:05:28<232:42:23,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 950/203307 [1:05:32<232:41:58,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 950/203307 [1:05:32<232:41:59,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 951/203307 [1:05:36<232:41:01,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 951/203307 [1:05:36<232:41:04,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 952/203307 [1:05:40<232:40:51,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 952/203307 [1:05:40<232:40:53,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 953/203307 [1:05:45<232:42:10,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 953/203307 [1:05:45<232:42:10,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 954/203307 [1:05:49<232:43:44,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 954/203307 [1:05:49<232:43:46,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 955/203307 [1:05:53<232:43:12,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 955/203307 [1:05:53<232:43:15,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 956/203307 [1:05:58<232:43:01,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 956/203307 [1:05:58<232:43:03,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 957/203307 [1:06:02<232:42:28,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 957/203307 [1:06:02<232:42:31,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 958/203307 [1:06:06<232:41:58,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 958/203307 [1:06:06<232:41:58,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 959/203307 [1:06:10<232:41:13,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 959/203307 [1:06:10<232:41:15,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 960/203307 [1:06:14<232:40:59,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 960/203307 [1:06:14<232:41:01,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 961/203307 [1:06:18<232:42:51,  0.24it/s, v_num=t5e6, training/loss=0.127]Epoch 0:   0%|          | 961/203307 [1:06:18<232:42:51,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 962/203307 [1:06:23<232:44:12,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 962/203307 [1:06:23<232:44:12,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 963/203307 [1:06:27<232:43:17,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 963/203307 [1:06:27<232:43:19,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 964/203307 [1:06:31<232:43:08,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 964/203307 [1:06:31<232:43:10,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 965/203307 [1:06:35<232:42:30,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 965/203307 [1:06:35<232:42:32,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 966/203307 [1:06:39<232:41:34,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 966/203307 [1:06:39<232:41:34,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 967/203307 [1:06:43<232:40:43,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 967/203307 [1:06:43<232:40:44,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 968/203307 [1:06:47<232:40:28,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 968/203307 [1:06:47<232:40:28,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 969/203307 [1:06:51<232:39:39,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 969/203307 [1:06:51<232:39:42,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 970/203307 [1:06:55<232:41:33,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 970/203307 [1:06:55<232:41:36,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 971/203307 [1:06:59<232:41:01,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 971/203307 [1:06:59<232:41:02,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 972/203307 [1:07:04<232:40:57,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 972/203307 [1:07:04<232:40:58,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 973/203307 [1:07:08<232:40:24,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 973/203307 [1:07:08<232:40:26,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 974/203307 [1:07:11<232:39:21,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 974/203307 [1:07:11<232:39:21,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 975/203307 [1:07:15<232:38:30,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 975/203307 [1:07:15<232:38:33,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 976/203307 [1:07:19<232:38:31,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 976/203307 [1:07:19<232:38:32,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 977/203307 [1:07:23<232:37:53,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 977/203307 [1:07:23<232:37:55,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 978/203307 [1:07:28<232:39:59,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 978/203307 [1:07:28<232:40:00,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 979/203307 [1:07:33<232:41:28,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 979/203307 [1:07:33<232:41:29,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 980/203307 [1:07:37<232:40:55,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 980/203307 [1:07:37<232:40:57,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 981/203307 [1:07:41<232:40:17,  0.24it/s, v_num=t5e6, training/loss=0.131]Epoch 0:   0%|          | 981/203307 [1:07:41<232:40:19,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 982/203307 [1:07:45<232:39:47,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 982/203307 [1:07:45<232:39:49,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 983/203307 [1:07:49<232:38:38,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 983/203307 [1:07:49<232:38:39,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 984/203307 [1:07:53<232:38:35,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 984/203307 [1:07:53<232:38:37,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 985/203307 [1:07:57<232:38:00,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 985/203307 [1:07:57<232:38:02,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 986/203307 [1:08:02<232:42:16,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 986/203307 [1:08:02<232:42:19,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 987/203307 [1:08:06<232:41:25,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 987/203307 [1:08:06<232:41:28,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 988/203307 [1:08:10<232:41:19,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 988/203307 [1:08:10<232:41:21,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 989/203307 [1:08:14<232:40:42,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 989/203307 [1:08:14<232:40:44,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 990/203307 [1:08:18<232:40:09,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 990/203307 [1:08:18<232:40:11,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 991/203307 [1:08:22<232:39:41,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 991/203307 [1:08:22<232:39:44,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 992/203307 [1:08:26<232:39:36,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 992/203307 [1:08:26<232:39:37,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 993/203307 [1:08:30<232:39:09,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 993/203307 [1:08:30<232:39:11,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 994/203307 [1:08:35<232:39:05,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 994/203307 [1:08:35<232:39:06,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 995/203307 [1:08:40<232:42:29,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 995/203307 [1:08:40<232:42:31,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 996/203307 [1:08:44<232:42:24,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 996/203307 [1:08:44<232:42:26,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 997/203307 [1:08:48<232:42:05,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 997/203307 [1:08:48<232:42:08,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 998/203307 [1:08:52<232:41:36,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 998/203307 [1:08:52<232:41:36,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 999/203307 [1:08:56<232:40:59,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 999/203307 [1:08:56<232:41:01,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 1000/203307 [1:09:00<232:41:00,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 1000/203307 [1:09:00<232:41:00,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 1001/203307 [1:09:04<232:40:37,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   0%|          | 1001/203307 [1:09:04<232:40:37,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   0%|          | 1002/203307 [1:09:09<232:42:27,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   0%|          | 1002/203307 [1:09:09<232:42:29,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   0%|          | 1003/203307 [1:09:13<232:42:54,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   0%|          | 1003/203307 [1:09:13<232:42:55,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   0%|          | 1004/203307 [1:09:18<232:44:16,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   0%|          | 1004/203307 [1:09:18<232:44:16,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   0%|          | 1005/203307 [1:09:22<232:43:47,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   0%|          | 1005/203307 [1:09:22<232:43:49,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   0%|          | 1006/203307 [1:09:26<232:43:09,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   0%|          | 1006/203307 [1:09:26<232:43:11,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   0%|          | 1007/203307 [1:09:30<232:42:36,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   0%|          | 1007/203307 [1:09:30<232:42:38,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   0%|          | 1008/203307 [1:09:34<232:42:11,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   0%|          | 1008/203307 [1:09:34<232:42:12,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   0%|          | 1009/203307 [1:09:38<232:41:40,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   0%|          | 1009/203307 [1:09:38<232:41:42,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   0%|          | 1010/203307 [1:09:42<232:41:06,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   0%|          | 1010/203307 [1:09:42<232:41:08,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   0%|          | 1011/203307 [1:09:46<232:42:38,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   0%|          | 1011/203307 [1:09:46<232:42:40,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   0%|          | 1012/203307 [1:09:51<232:44:49,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   0%|          | 1012/203307 [1:09:51<232:44:49,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   0%|          | 1013/203307 [1:09:55<232:44:15,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   0%|          | 1013/203307 [1:09:55<232:44:17,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   0%|          | 1014/203307 [1:09:59<232:43:28,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   0%|          | 1014/203307 [1:09:59<232:43:31,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   0%|          | 1015/203307 [1:10:03<232:42:56,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   0%|          | 1015/203307 [1:10:03<232:42:59,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   0%|          | 1016/203307 [1:10:07<232:42:57,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   0%|          | 1016/203307 [1:10:07<232:42:57,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1017/203307 [1:10:11<232:42:30,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1017/203307 [1:10:11<232:42:31,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1018/203307 [1:10:15<232:41:57,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1018/203307 [1:10:15<232:41:59,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1019/203307 [1:10:19<232:41:11,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1019/203307 [1:10:19<232:41:13,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1020/203307 [1:10:24<232:43:54,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1020/203307 [1:10:24<232:43:56,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1021/203307 [1:10:28<232:43:15,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1021/203307 [1:10:28<232:43:15,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1022/203307 [1:10:32<232:42:46,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1022/203307 [1:10:32<232:42:47,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1023/203307 [1:10:36<232:42:13,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1023/203307 [1:10:36<232:42:15,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1024/203307 [1:10:40<232:42:08,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1024/203307 [1:10:40<232:42:10,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1025/203307 [1:10:44<232:41:30,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1025/203307 [1:10:44<232:41:31,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1026/203307 [1:10:48<232:41:04,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1026/203307 [1:10:48<232:41:06,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1027/203307 [1:10:52<232:40:33,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1027/203307 [1:10:52<232:40:36,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1028/203307 [1:10:57<232:42:53,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1028/203307 [1:10:57<232:42:55,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1029/203307 [1:11:01<232:42:01,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1029/203307 [1:11:01<232:42:03,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1030/203307 [1:11:05<232:41:30,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1030/203307 [1:11:05<232:41:30,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1031/203307 [1:11:09<232:40:53,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1031/203307 [1:11:09<232:40:55,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1032/203307 [1:11:13<232:40:57,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1032/203307 [1:11:13<232:40:58,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1033/203307 [1:11:17<232:40:32,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1033/203307 [1:11:17<232:40:34,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1034/203307 [1:11:21<232:39:38,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1034/203307 [1:11:21<232:39:40,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1035/203307 [1:11:25<232:38:56,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1035/203307 [1:11:25<232:38:58,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1036/203307 [1:11:30<232:41:10,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1036/203307 [1:11:30<232:41:12,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1037/203307 [1:11:35<232:42:44,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1037/203307 [1:11:35<232:42:46,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1038/203307 [1:11:38<232:42:00,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1038/203307 [1:11:38<232:42:00,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1039/203307 [1:11:42<232:41:27,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1039/203307 [1:11:43<232:41:29,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1040/203307 [1:11:47<232:41:19,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1040/203307 [1:11:47<232:41:19,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1041/203307 [1:11:51<232:40:45,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1041/203307 [1:11:51<232:40:45,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1042/203307 [1:11:55<232:40:00,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1042/203307 [1:11:55<232:40:00,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1043/203307 [1:11:58<232:39:06,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1043/203307 [1:11:58<232:39:09,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1044/203307 [1:12:03<232:38:53,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1044/203307 [1:12:03<232:38:55,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1045/203307 [1:12:07<232:40:47,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1045/203307 [1:12:07<232:40:49,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1046/203307 [1:12:11<232:39:59,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1046/203307 [1:12:11<232:40:01,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1047/203307 [1:12:15<232:39:17,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1047/203307 [1:12:15<232:39:19,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1048/203307 [1:12:19<232:39:12,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1048/203307 [1:12:19<232:39:14,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1049/203307 [1:12:23<232:38:32,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1049/203307 [1:12:23<232:38:34,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1050/203307 [1:12:27<232:38:06,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1050/203307 [1:12:27<232:38:08,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1051/203307 [1:12:31<232:37:30,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1051/203307 [1:12:31<232:37:32,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1052/203307 [1:12:36<232:39:31,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1052/203307 [1:12:36<232:39:33,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1053/203307 [1:12:40<232:39:37,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1053/203307 [1:12:40<232:39:39,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1054/203307 [1:12:45<232:41:15,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1054/203307 [1:12:45<232:41:17,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1055/203307 [1:12:49<232:40:43,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1055/203307 [1:12:49<232:40:43,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1056/203307 [1:12:53<232:40:27,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1056/203307 [1:12:53<232:40:28,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1057/203307 [1:12:57<232:40:01,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1057/203307 [1:12:57<232:40:03,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1058/203307 [1:13:01<232:39:42,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1058/203307 [1:13:01<232:39:42,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1059/203307 [1:13:05<232:39:14,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1059/203307 [1:13:05<232:39:15,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1060/203307 [1:13:09<232:39:23,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1060/203307 [1:13:09<232:39:24,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1061/203307 [1:13:14<232:40:47,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1061/203307 [1:13:14<232:40:47,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1062/203307 [1:13:18<232:40:27,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1062/203307 [1:13:18<232:40:29,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1063/203307 [1:13:23<232:42:05,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1063/203307 [1:13:23<232:42:08,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1064/203307 [1:13:27<232:41:48,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1064/203307 [1:13:27<232:41:50,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1065/203307 [1:13:31<232:41:05,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1065/203307 [1:13:31<232:41:06,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1066/203307 [1:13:35<232:40:49,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1066/203307 [1:13:35<232:40:49,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1067/203307 [1:13:39<232:39:53,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1067/203307 [1:13:39<232:39:56,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1068/203307 [1:13:43<232:39:42,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1068/203307 [1:13:43<232:39:43,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1069/203307 [1:13:47<232:41:25,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1069/203307 [1:13:47<232:41:25,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1070/203307 [1:13:51<232:41:14,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1070/203307 [1:13:51<232:41:16,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1071/203307 [1:13:56<232:42:52,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1071/203307 [1:13:56<232:42:54,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1072/203307 [1:14:00<232:42:31,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1072/203307 [1:14:00<232:42:33,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1073/203307 [1:14:04<232:41:57,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1073/203307 [1:14:04<232:41:59,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1074/203307 [1:14:08<232:41:18,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1074/203307 [1:14:08<232:41:20,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1075/203307 [1:14:12<232:41:01,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1075/203307 [1:14:12<232:41:03,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1076/203307 [1:14:16<232:40:58,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1076/203307 [1:14:16<232:41:00,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1077/203307 [1:14:21<232:42:15,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1077/203307 [1:14:21<232:42:17,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1078/203307 [1:14:25<232:42:14,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1078/203307 [1:14:25<232:42:15,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1079/203307 [1:14:29<232:41:37,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1079/203307 [1:14:29<232:41:39,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1080/203307 [1:14:34<232:43:49,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1080/203307 [1:14:34<232:43:51,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1081/203307 [1:14:38<232:43:22,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1081/203307 [1:14:38<232:43:24,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1082/203307 [1:14:42<232:42:47,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1082/203307 [1:14:42<232:42:49,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1083/203307 [1:14:46<232:41:26,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1083/203307 [1:14:46<232:41:28,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1084/203307 [1:14:50<232:41:21,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1084/203307 [1:14:50<232:41:21,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1085/203307 [1:14:54<232:42:47,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1085/203307 [1:14:54<232:42:49,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1086/203307 [1:14:59<232:43:07,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1086/203307 [1:14:59<232:43:07,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1087/203307 [1:15:03<232:42:10,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1087/203307 [1:15:03<232:42:12,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1088/203307 [1:15:07<232:42:09,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1088/203307 [1:15:07<232:42:09,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1089/203307 [1:15:11<232:43:45,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1089/203307 [1:15:11<232:43:47,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1090/203307 [1:15:15<232:43:04,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1090/203307 [1:15:15<232:43:06,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1091/203307 [1:15:19<232:42:19,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1091/203307 [1:15:19<232:42:19,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1092/203307 [1:15:23<232:42:06,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1092/203307 [1:15:23<232:42:07,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1093/203307 [1:15:27<232:41:31,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1093/203307 [1:15:27<232:41:33,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1094/203307 [1:15:32<232:43:14,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1094/203307 [1:15:32<232:43:14,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1095/203307 [1:15:36<232:43:15,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1095/203307 [1:15:36<232:43:17,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1096/203307 [1:15:40<232:42:55,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1096/203307 [1:15:40<232:42:57,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1097/203307 [1:15:45<232:44:38,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1097/203307 [1:15:45<232:44:40,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1098/203307 [1:15:49<232:44:07,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1098/203307 [1:15:49<232:44:09,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1099/203307 [1:15:53<232:43:30,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1099/203307 [1:15:53<232:43:32,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1100/203307 [1:15:57<232:43:34,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1100/203307 [1:15:57<232:43:36,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1101/203307 [1:16:01<232:43:00,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 1101/203307 [1:16:01<232:43:02,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1102/203307 [1:16:05<232:43:25,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1102/203307 [1:16:05<232:43:26,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1103/203307 [1:16:10<232:43:31,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1103/203307 [1:16:10<232:43:31,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1104/203307 [1:16:14<232:43:29,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1104/203307 [1:16:14<232:43:30,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1105/203307 [1:16:18<232:43:24,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1105/203307 [1:16:18<232:43:26,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1106/203307 [1:16:23<232:45:09,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1106/203307 [1:16:23<232:45:10,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1107/203307 [1:16:27<232:44:34,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1107/203307 [1:16:27<232:44:34,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1108/203307 [1:16:31<232:44:16,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1108/203307 [1:16:31<232:44:17,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1109/203307 [1:16:35<232:45:45,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1109/203307 [1:16:35<232:45:48,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1110/203307 [1:16:39<232:44:59,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1110/203307 [1:16:39<232:45:01,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1111/203307 [1:16:43<232:44:55,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1111/203307 [1:16:43<232:44:57,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1112/203307 [1:16:48<232:44:56,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1112/203307 [1:16:48<232:44:56,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1113/203307 [1:16:52<232:44:16,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1113/203307 [1:16:52<232:44:18,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1114/203307 [1:16:56<232:43:57,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1114/203307 [1:16:56<232:43:58,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1115/203307 [1:17:00<232:45:54,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1115/203307 [1:17:00<232:45:56,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1116/203307 [1:17:05<232:45:46,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1116/203307 [1:17:05<232:45:47,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1117/203307 [1:17:09<232:47:19,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1117/203307 [1:17:09<232:47:21,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1118/203307 [1:17:13<232:46:36,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1118/203307 [1:17:13<232:46:38,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1119/203307 [1:17:17<232:46:12,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1119/203307 [1:17:17<232:46:14,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1120/203307 [1:17:21<232:46:18,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1120/203307 [1:17:21<232:46:20,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1121/203307 [1:17:25<232:45:57,  0.24it/s, v_num=t5e6, training/loss=0.139]Epoch 0:   1%|          | 1121/203307 [1:17:25<232:45:59,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1122/203307 [1:17:29<232:45:30,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1122/203307 [1:17:29<232:45:30,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1123/203307 [1:17:34<232:46:56,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1123/203307 [1:17:34<232:46:59,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1124/203307 [1:17:38<232:46:54,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1124/203307 [1:17:38<232:46:56,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1125/203307 [1:17:42<232:46:27,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1125/203307 [1:17:42<232:46:29,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1126/203307 [1:17:46<232:46:00,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1126/203307 [1:17:46<232:46:02,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1127/203307 [1:17:51<232:47:38,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1127/203307 [1:17:51<232:47:40,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1128/203307 [1:17:55<232:47:44,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1128/203307 [1:17:55<232:47:46,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1129/203307 [1:17:59<232:47:21,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1129/203307 [1:17:59<232:47:23,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1130/203307 [1:18:03<232:46:53,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1130/203307 [1:18:03<232:46:55,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1131/203307 [1:18:07<232:46:31,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1131/203307 [1:18:07<232:46:31,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1132/203307 [1:18:12<232:48:49,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1132/203307 [1:18:12<232:48:51,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1133/203307 [1:18:16<232:48:33,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1133/203307 [1:18:16<232:48:34,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1134/203307 [1:18:21<232:48:33,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1134/203307 [1:18:21<232:48:35,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1135/203307 [1:18:25<232:49:56,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1135/203307 [1:18:25<232:49:57,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1136/203307 [1:18:29<232:49:57,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1136/203307 [1:18:29<232:49:57,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1137/203307 [1:18:33<232:49:38,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1137/203307 [1:18:33<232:49:39,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1138/203307 [1:18:37<232:49:18,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1138/203307 [1:18:37<232:49:20,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1139/203307 [1:18:41<232:48:54,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1139/203307 [1:18:41<232:48:54,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1140/203307 [1:18:46<232:49:02,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1140/203307 [1:18:46<232:49:02,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1141/203307 [1:18:50<232:50:51,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1141/203307 [1:18:50<232:50:53,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1142/203307 [1:18:54<232:50:11,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1142/203307 [1:18:54<232:50:13,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1143/203307 [1:18:59<232:51:45,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1143/203307 [1:18:59<232:51:46,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1144/203307 [1:19:03<232:51:46,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1144/203307 [1:19:03<232:51:48,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1145/203307 [1:19:08<232:51:55,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1145/203307 [1:19:08<232:51:57,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1146/203307 [1:19:12<232:51:38,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1146/203307 [1:19:12<232:51:39,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1147/203307 [1:19:16<232:51:41,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1147/203307 [1:19:16<232:51:42,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1148/203307 [1:19:20<232:51:43,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1148/203307 [1:19:20<232:51:45,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1149/203307 [1:19:25<232:53:19,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1149/203307 [1:19:25<232:53:21,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1150/203307 [1:19:29<232:53:00,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1150/203307 [1:19:29<232:53:02,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1151/203307 [1:19:33<232:52:41,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1151/203307 [1:19:33<232:52:42,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1152/203307 [1:19:38<232:54:47,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1152/203307 [1:19:38<232:54:48,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1153/203307 [1:19:42<232:54:36,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1153/203307 [1:19:42<232:54:38,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1154/203307 [1:19:46<232:54:10,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1154/203307 [1:19:46<232:54:12,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1155/203307 [1:19:50<232:53:38,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1155/203307 [1:19:50<232:53:40,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1156/203307 [1:19:54<232:53:28,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1156/203307 [1:19:54<232:53:30,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1157/203307 [1:19:58<232:53:12,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1157/203307 [1:19:58<232:53:14,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1158/203307 [1:20:03<232:55:08,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1158/203307 [1:20:03<232:55:10,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1159/203307 [1:20:07<232:54:31,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1159/203307 [1:20:07<232:54:33,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1160/203307 [1:20:12<232:56:11,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1160/203307 [1:20:12<232:56:13,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1161/203307 [1:20:16<232:56:45,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1161/203307 [1:20:16<232:56:47,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1162/203307 [1:20:20<232:56:08,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1162/203307 [1:20:20<232:56:09,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1163/203307 [1:20:24<232:55:35,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1163/203307 [1:20:24<232:55:37,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1164/203307 [1:20:28<232:55:39,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1164/203307 [1:20:28<232:55:41,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1165/203307 [1:20:32<232:55:07,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1165/203307 [1:20:32<232:55:08,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1166/203307 [1:20:36<232:54:40,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1166/203307 [1:20:36<232:54:40,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1167/203307 [1:20:41<232:56:56,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1167/203307 [1:20:41<232:56:58,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1168/203307 [1:20:45<232:56:42,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1168/203307 [1:20:45<232:56:42,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1169/203307 [1:20:50<232:58:07,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1169/203307 [1:20:50<232:58:07,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1170/203307 [1:20:54<232:58:15,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1170/203307 [1:20:54<232:58:16,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1171/203307 [1:20:58<232:57:28,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1171/203307 [1:20:58<232:57:30,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1172/203307 [1:21:02<232:57:20,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1172/203307 [1:21:02<232:57:21,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1173/203307 [1:21:06<232:56:55,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1173/203307 [1:21:06<232:56:56,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1174/203307 [1:21:10<232:56:01,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1174/203307 [1:21:10<232:56:03,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1175/203307 [1:21:15<232:58:10,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1175/203307 [1:21:15<232:58:10,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1176/203307 [1:21:19<232:58:07,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1176/203307 [1:21:19<232:58:09,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1177/203307 [1:21:23<232:57:43,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1177/203307 [1:21:23<232:57:43,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1178/203307 [1:21:28<232:59:15,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1178/203307 [1:21:28<232:59:17,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1179/203307 [1:21:32<232:58:52,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1179/203307 [1:21:32<232:58:52,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1180/203307 [1:21:36<232:58:41,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1180/203307 [1:21:36<232:58:42,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1181/203307 [1:21:40<232:58:36,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1181/203307 [1:21:40<232:58:37,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1182/203307 [1:21:44<232:57:49,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1182/203307 [1:21:44<232:57:51,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1183/203307 [1:21:48<232:57:26,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1183/203307 [1:21:48<232:57:27,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1184/203307 [1:21:53<232:59:59,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1184/203307 [1:21:53<233:00:01,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1185/203307 [1:21:57<232:59:42,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1185/203307 [1:21:57<232:59:44,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1186/203307 [1:22:02<233:01:06,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1186/203307 [1:22:02<233:01:08,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1187/203307 [1:22:06<233:00:58,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1187/203307 [1:22:06<233:00:59,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1188/203307 [1:22:10<233:00:51,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1188/203307 [1:22:10<233:00:51,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1189/203307 [1:22:14<233:00:15,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1189/203307 [1:22:14<233:00:17,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1190/203307 [1:22:18<233:00:22,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1190/203307 [1:22:18<233:00:22,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1191/203307 [1:22:22<232:59:40,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1191/203307 [1:22:22<232:59:41,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1192/203307 [1:22:26<232:59:38,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1192/203307 [1:22:26<232:59:39,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1193/203307 [1:22:31<233:01:41,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1193/203307 [1:22:31<233:01:43,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1194/203307 [1:22:35<233:01:19,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1194/203307 [1:22:35<233:01:21,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1195/203307 [1:22:40<233:02:07,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1195/203307 [1:22:40<233:02:09,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1196/203307 [1:22:44<233:02:01,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1196/203307 [1:22:44<233:02:03,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1197/203307 [1:22:48<233:01:27,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1197/203307 [1:22:48<233:01:29,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1198/203307 [1:22:52<233:00:59,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1198/203307 [1:22:52<233:01:00,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1199/203307 [1:22:56<233:00:25,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1199/203307 [1:22:56<233:00:27,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1200/203307 [1:23:00<233:00:10,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1200/203307 [1:23:00<233:00:10,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1201/203307 [1:23:05<233:01:42,  0.24it/s, v_num=t5e6, training/loss=0.133]Epoch 0:   1%|          | 1201/203307 [1:23:05<233:01:44,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1202/203307 [1:23:09<233:01:07,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1202/203307 [1:23:09<233:01:07,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1203/203307 [1:23:13<233:01:26,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1203/203307 [1:23:13<233:01:27,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1204/203307 [1:23:18<233:02:57,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1204/203307 [1:23:18<233:02:59,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1205/203307 [1:23:21<233:02:12,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1205/203307 [1:23:21<233:02:12,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1206/203307 [1:23:26<233:01:44,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1206/203307 [1:23:26<233:01:45,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1207/203307 [1:23:29<233:01:08,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1207/203307 [1:23:29<233:01:10,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1208/203307 [1:23:34<233:01:18,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1208/203307 [1:23:34<233:01:20,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1209/203307 [1:23:38<233:00:57,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1209/203307 [1:23:38<233:00:59,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1210/203307 [1:23:42<233:02:30,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1210/203307 [1:23:42<233:02:31,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1211/203307 [1:23:47<233:02:08,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1211/203307 [1:23:47<233:02:10,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1212/203307 [1:23:51<233:03:51,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1212/203307 [1:23:51<233:03:53,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1213/203307 [1:23:55<233:03:31,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1213/203307 [1:23:55<233:03:32,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1214/203307 [1:23:59<233:03:02,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1214/203307 [1:23:59<233:03:03,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1215/203307 [1:24:03<233:02:36,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1215/203307 [1:24:03<233:02:38,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1216/203307 [1:24:08<233:02:32,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1216/203307 [1:24:08<233:02:33,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1217/203307 [1:24:12<233:02:02,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1217/203307 [1:24:12<233:02:04,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1218/203307 [1:24:16<233:01:31,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1218/203307 [1:24:16<233:01:33,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1219/203307 [1:24:20<233:03:10,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1219/203307 [1:24:20<233:03:12,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1220/203307 [1:24:24<233:03:08,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1220/203307 [1:24:24<233:03:10,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1221/203307 [1:24:29<233:04:27,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1221/203307 [1:24:29<233:04:28,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1222/203307 [1:24:33<233:04:02,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1222/203307 [1:24:33<233:04:04,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1223/203307 [1:24:37<233:03:37,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1223/203307 [1:24:37<233:03:39,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1224/203307 [1:24:41<233:03:34,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1224/203307 [1:24:41<233:03:34,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1225/203307 [1:24:45<233:03:19,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1225/203307 [1:24:45<233:03:20,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1226/203307 [1:24:49<233:02:55,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1226/203307 [1:24:49<233:02:57,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1227/203307 [1:24:54<233:04:38,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1227/203307 [1:24:54<233:04:40,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1228/203307 [1:24:58<233:04:44,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1228/203307 [1:24:58<233:04:44,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1229/203307 [1:25:03<233:04:33,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1229/203307 [1:25:03<233:04:33,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1230/203307 [1:25:07<233:06:09,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1230/203307 [1:25:07<233:06:11,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1231/203307 [1:25:11<233:05:40,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1231/203307 [1:25:11<233:05:41,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1232/203307 [1:25:16<233:05:37,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1232/203307 [1:25:16<233:05:38,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1233/203307 [1:25:19<233:04:59,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1233/203307 [1:25:19<233:05:01,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1234/203307 [1:25:23<233:04:20,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1234/203307 [1:25:23<233:04:22,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1235/203307 [1:25:27<233:03:52,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1235/203307 [1:25:27<233:03:53,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1236/203307 [1:25:32<233:05:50,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1236/203307 [1:25:32<233:05:52,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1237/203307 [1:25:36<233:05:19,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1237/203307 [1:25:36<233:05:20,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1238/203307 [1:25:41<233:06:39,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1238/203307 [1:25:41<233:06:41,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1239/203307 [1:25:45<233:06:06,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1239/203307 [1:25:45<233:06:08,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1240/203307 [1:25:49<233:05:51,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1240/203307 [1:25:49<233:05:53,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1241/203307 [1:25:53<233:05:28,  0.24it/s, v_num=t5e6, training/loss=0.137]Epoch 0:   1%|          | 1241/203307 [1:25:53<233:05:28,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1242/203307 [1:25:57<233:04:57,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1242/203307 [1:25:57<233:04:59,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1243/203307 [1:26:01<233:04:15,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1243/203307 [1:26:01<233:04:17,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1244/203307 [1:26:05<233:04:01,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1244/203307 [1:26:05<233:04:02,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1245/203307 [1:26:10<233:05:34,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1245/203307 [1:26:10<233:05:36,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1246/203307 [1:26:14<233:04:51,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1246/203307 [1:26:14<233:04:52,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1247/203307 [1:26:18<233:06:23,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1247/203307 [1:26:18<233:06:25,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1248/203307 [1:26:23<233:06:18,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1248/203307 [1:26:23<233:06:19,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1249/203307 [1:26:27<233:05:43,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1249/203307 [1:26:27<233:05:45,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1250/203307 [1:26:30<233:04:57,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1250/203307 [1:26:30<233:04:57,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1251/203307 [1:26:34<233:04:24,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1251/203307 [1:26:34<233:04:26,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1252/203307 [1:26:39<233:04:05,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1252/203307 [1:26:39<233:04:07,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1253/203307 [1:26:43<233:05:59,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1253/203307 [1:26:43<233:06:01,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1254/203307 [1:26:47<233:05:03,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1254/203307 [1:26:47<233:05:03,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1255/203307 [1:26:51<233:04:25,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1255/203307 [1:26:51<233:04:27,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1256/203307 [1:26:56<233:06:05,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1256/203307 [1:26:56<233:06:06,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1257/203307 [1:27:00<233:05:30,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1257/203307 [1:27:00<233:05:32,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1258/203307 [1:27:04<233:04:43,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1258/203307 [1:27:04<233:04:45,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1259/203307 [1:27:08<233:04:04,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1259/203307 [1:27:08<233:04:06,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1260/203307 [1:27:12<233:03:11,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1260/203307 [1:27:12<233:03:12,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1261/203307 [1:27:16<233:03:29,  0.24it/s, v_num=t5e6, training/loss=0.129]Epoch 0:   1%|          | 1261/203307 [1:27:16<233:03:31,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1262/203307 [1:27:21<233:04:46,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1262/203307 [1:27:21<233:04:48,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1263/203307 [1:27:25<233:04:32,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1263/203307 [1:27:25<233:04:34,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1264/203307 [1:27:29<233:05:46,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1264/203307 [1:27:29<233:05:48,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1265/203307 [1:27:33<233:05:27,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1265/203307 [1:27:33<233:05:29,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1266/203307 [1:27:37<233:04:49,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1266/203307 [1:27:37<233:04:51,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1267/203307 [1:27:41<233:04:25,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1267/203307 [1:27:41<233:04:27,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1268/203307 [1:27:45<233:03:56,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1268/203307 [1:27:45<233:03:57,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1269/203307 [1:27:49<233:03:22,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1269/203307 [1:27:49<233:03:23,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1270/203307 [1:27:53<233:02:58,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1270/203307 [1:27:53<233:03:00,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1271/203307 [1:27:58<233:04:37,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1271/203307 [1:27:58<233:04:38,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1272/203307 [1:28:02<233:04:13,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1272/203307 [1:28:02<233:04:15,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1273/203307 [1:28:07<233:05:33,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1273/203307 [1:28:07<233:05:33,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1274/203307 [1:28:11<233:05:01,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1274/203307 [1:28:11<233:05:02,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1275/203307 [1:28:15<233:04:22,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1275/203307 [1:28:15<233:04:22,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1276/203307 [1:28:19<233:04:07,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1276/203307 [1:28:19<233:04:08,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1277/203307 [1:28:23<233:03:46,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1277/203307 [1:28:23<233:03:46,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1278/203307 [1:28:27<233:03:35,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1278/203307 [1:28:27<233:03:36,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1279/203307 [1:28:32<233:04:57,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1279/203307 [1:28:32<233:04:59,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1280/203307 [1:28:36<233:04:27,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1280/203307 [1:28:36<233:04:29,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1281/203307 [1:28:40<233:03:52,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1281/203307 [1:28:40<233:03:54,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1282/203307 [1:28:44<233:05:17,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1282/203307 [1:28:44<233:05:18,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1283/203307 [1:28:48<233:04:48,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1283/203307 [1:28:48<233:04:50,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1284/203307 [1:28:52<233:04:36,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1284/203307 [1:28:52<233:04:37,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1285/203307 [1:28:56<233:04:04,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1285/203307 [1:28:56<233:04:05,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1286/203307 [1:29:00<233:03:50,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1286/203307 [1:29:01<233:03:52,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1287/203307 [1:29:04<233:03:18,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1287/203307 [1:29:04<233:03:20,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1288/203307 [1:29:09<233:05:11,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1288/203307 [1:29:09<233:05:13,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1289/203307 [1:29:13<233:04:29,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1289/203307 [1:29:13<233:04:31,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1290/203307 [1:29:18<233:05:52,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1290/203307 [1:29:18<233:05:52,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1291/203307 [1:29:22<233:05:22,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1291/203307 [1:29:22<233:05:22,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1292/203307 [1:29:26<233:05:09,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1292/203307 [1:29:26<233:05:09,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1293/203307 [1:29:30<233:04:49,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1293/203307 [1:29:30<233:04:50,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1294/203307 [1:29:34<233:04:20,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1294/203307 [1:29:34<233:04:21,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1295/203307 [1:29:38<233:04:01,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1295/203307 [1:29:38<233:04:03,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1296/203307 [1:29:42<233:04:00,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1296/203307 [1:29:42<233:04:01,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1297/203307 [1:29:47<233:05:42,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1297/203307 [1:29:47<233:05:43,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1298/203307 [1:29:51<233:05:05,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1298/203307 [1:29:51<233:05:05,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1299/203307 [1:29:56<233:06:02,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1299/203307 [1:29:56<233:06:04,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1300/203307 [1:30:00<233:05:55,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1300/203307 [1:30:00<233:05:55,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1301/203307 [1:30:04<233:05:27,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1301/203307 [1:30:04<233:05:28,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1302/203307 [1:30:08<233:05:04,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1302/203307 [1:30:08<233:05:06,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1303/203307 [1:30:12<233:05:05,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1303/203307 [1:30:12<233:05:06,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1304/203307 [1:30:16<233:04:52,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1304/203307 [1:30:16<233:04:54,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1305/203307 [1:30:21<233:06:05,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1305/203307 [1:30:21<233:06:07,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1306/203307 [1:30:25<233:05:41,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1306/203307 [1:30:25<233:05:42,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1307/203307 [1:30:29<233:05:17,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1307/203307 [1:30:29<233:05:18,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1308/203307 [1:30:34<233:06:54,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1308/203307 [1:30:34<233:06:54,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1309/203307 [1:30:38<233:06:14,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1309/203307 [1:30:38<233:06:15,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1310/203307 [1:30:42<233:05:42,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1310/203307 [1:30:42<233:05:44,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1311/203307 [1:30:46<233:05:53,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1311/203307 [1:30:46<233:05:55,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1312/203307 [1:30:50<233:05:44,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1312/203307 [1:30:50<233:05:45,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1313/203307 [1:30:54<233:05:26,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1313/203307 [1:30:54<233:05:28,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1314/203307 [1:30:59<233:06:46,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1314/203307 [1:30:59<233:06:47,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1315/203307 [1:31:03<233:06:30,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1315/203307 [1:31:03<233:06:31,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1316/203307 [1:31:08<233:07:58,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1316/203307 [1:31:08<233:08:00,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1317/203307 [1:31:12<233:07:29,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1317/203307 [1:31:12<233:07:30,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1318/203307 [1:31:15<233:06:46,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1318/203307 [1:31:15<233:06:47,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1319/203307 [1:31:19<233:06:27,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1319/203307 [1:31:19<233:06:29,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1320/203307 [1:31:24<233:06:48,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1320/203307 [1:31:24<233:06:49,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1321/203307 [1:31:28<233:06:35,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1321/203307 [1:31:28<233:06:36,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1322/203307 [1:31:32<233:05:59,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1322/203307 [1:31:32<233:06:01,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1323/203307 [1:31:37<233:07:16,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1323/203307 [1:31:37<233:07:18,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1324/203307 [1:31:41<233:06:59,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1324/203307 [1:31:41<233:07:01,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1325/203307 [1:31:45<233:08:09,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1325/203307 [1:31:45<233:08:11,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1326/203307 [1:31:49<233:07:35,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1326/203307 [1:31:49<233:07:36,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1327/203307 [1:31:53<233:07:04,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1327/203307 [1:31:53<233:07:04,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1328/203307 [1:31:57<233:06:55,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1328/203307 [1:31:57<233:06:56,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1329/203307 [1:32:01<233:06:26,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1329/203307 [1:32:01<233:06:27,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1330/203307 [1:32:05<233:05:51,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1330/203307 [1:32:05<233:05:51,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1331/203307 [1:32:10<233:07:00,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1331/203307 [1:32:10<233:07:02,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1332/203307 [1:32:14<233:06:56,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1332/203307 [1:32:14<233:06:56,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1333/203307 [1:32:18<233:06:38,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1333/203307 [1:32:18<233:06:40,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1334/203307 [1:32:23<233:07:52,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1334/203307 [1:32:23<233:07:52,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1335/203307 [1:32:27<233:07:12,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1335/203307 [1:32:27<233:07:14,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1336/203307 [1:32:31<233:07:01,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1336/203307 [1:32:31<233:07:03,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1337/203307 [1:32:35<233:06:36,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1337/203307 [1:32:35<233:06:37,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1338/203307 [1:32:39<233:06:13,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1338/203307 [1:32:39<233:06:15,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1339/203307 [1:32:43<233:06:03,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1339/203307 [1:32:43<233:06:03,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1340/203307 [1:32:48<233:07:39,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1340/203307 [1:32:48<233:07:40,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1341/203307 [1:32:52<233:07:04,  0.24it/s, v_num=t5e6, training/loss=0.126]Epoch 0:   1%|          | 1341/203307 [1:32:52<233:07:05,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1342/203307 [1:32:56<233:08:08,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1342/203307 [1:32:56<233:08:09,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1343/203307 [1:33:00<233:07:39,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1343/203307 [1:33:00<233:07:40,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1344/203307 [1:33:04<233:07:24,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1344/203307 [1:33:04<233:07:26,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1345/203307 [1:33:09<233:07:25,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1345/203307 [1:33:09<233:07:26,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1346/203307 [1:33:13<233:07:20,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1346/203307 [1:33:13<233:07:22,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1347/203307 [1:33:17<233:06:56,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1347/203307 [1:33:17<233:06:57,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1348/203307 [1:33:21<233:06:53,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1348/203307 [1:33:21<233:06:55,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1349/203307 [1:33:26<233:08:23,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1349/203307 [1:33:26<233:08:24,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1350/203307 [1:33:30<233:07:47,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1350/203307 [1:33:30<233:07:49,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1351/203307 [1:33:34<233:08:49,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1351/203307 [1:33:34<233:08:49,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1352/203307 [1:33:38<233:08:38,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1352/203307 [1:33:38<233:08:38,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1353/203307 [1:33:43<233:08:34,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1353/203307 [1:33:43<233:08:35,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1354/203307 [1:33:47<233:08:06,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1354/203307 [1:33:47<233:08:07,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1355/203307 [1:33:51<233:07:39,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1355/203307 [1:33:51<233:07:41,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1356/203307 [1:33:55<233:07:43,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1356/203307 [1:33:55<233:07:44,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1357/203307 [1:33:59<233:09:02,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1357/203307 [1:33:59<233:09:04,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1358/203307 [1:34:03<233:08:38,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1358/203307 [1:34:03<233:08:41,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1359/203307 [1:34:07<233:08:02,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1359/203307 [1:34:07<233:08:03,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1360/203307 [1:34:12<233:09:20,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1360/203307 [1:34:12<233:09:20,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1361/203307 [1:34:16<233:09:21,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1361/203307 [1:34:16<233:09:23,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1362/203307 [1:34:20<233:08:49,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1362/203307 [1:34:20<233:08:50,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1363/203307 [1:34:24<233:08:20,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1363/203307 [1:34:24<233:08:22,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1364/203307 [1:34:28<233:08:16,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1364/203307 [1:34:28<233:08:18,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1365/203307 [1:34:32<233:07:52,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1365/203307 [1:34:32<233:07:53,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1366/203307 [1:34:37<233:09:02,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1366/203307 [1:34:37<233:09:04,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1367/203307 [1:34:41<233:08:38,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1367/203307 [1:34:41<233:08:38,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1368/203307 [1:34:46<233:09:59,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1368/203307 [1:34:46<233:09:59,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1369/203307 [1:34:50<233:09:38,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1369/203307 [1:34:50<233:09:40,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1370/203307 [1:34:54<233:09:54,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1370/203307 [1:34:54<233:09:56,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1371/203307 [1:34:58<233:09:28,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1371/203307 [1:34:58<233:09:29,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1372/203307 [1:35:02<233:09:30,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1372/203307 [1:35:02<233:09:32,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1373/203307 [1:35:06<233:08:55,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1373/203307 [1:35:06<233:08:55,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1374/203307 [1:35:10<233:08:34,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1374/203307 [1:35:10<233:08:36,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1375/203307 [1:35:15<233:09:49,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1375/203307 [1:35:15<233:09:51,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1376/203307 [1:35:19<233:09:58,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1376/203307 [1:35:19<233:09:59,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1377/203307 [1:35:24<233:11:01,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1377/203307 [1:35:24<233:11:02,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1378/203307 [1:35:28<233:10:57,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1378/203307 [1:35:28<233:10:59,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1379/203307 [1:35:32<233:10:39,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1379/203307 [1:35:32<233:10:41,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1380/203307 [1:35:36<233:10:39,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1380/203307 [1:35:36<233:10:40,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1381/203307 [1:35:40<233:10:18,  0.24it/s, v_num=t5e6, training/loss=0.128]Epoch 0:   1%|          | 1381/203307 [1:35:40<233:10:19,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1382/203307 [1:35:44<233:09:58,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1382/203307 [1:35:44<233:09:59,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1383/203307 [1:35:49<233:12:03,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1383/203307 [1:35:50<233:12:05,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1384/203307 [1:35:54<233:11:57,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1384/203307 [1:35:54<233:11:58,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1385/203307 [1:35:58<233:11:39,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1385/203307 [1:35:58<233:11:39,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1386/203307 [1:36:02<233:12:46,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1386/203307 [1:36:02<233:12:48,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1387/203307 [1:36:06<233:12:20,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1387/203307 [1:36:06<233:12:21,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1388/203307 [1:36:10<233:12:09,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1388/203307 [1:36:10<233:12:11,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1389/203307 [1:36:14<233:11:43,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1389/203307 [1:36:14<233:11:45,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1390/203307 [1:36:18<233:11:13,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1390/203307 [1:36:18<233:11:13,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1391/203307 [1:36:22<233:10:52,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1391/203307 [1:36:22<233:10:52,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1392/203307 [1:36:27<233:12:44,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1392/203307 [1:36:27<233:12:46,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1393/203307 [1:36:31<233:12:12,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1393/203307 [1:36:31<233:12:14,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1394/203307 [1:36:36<233:13:06,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1394/203307 [1:36:36<233:13:08,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1395/203307 [1:36:40<233:13:34,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1395/203307 [1:36:40<233:13:35,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1396/203307 [1:36:44<233:13:13,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1396/203307 [1:36:44<233:13:15,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1397/203307 [1:36:48<233:12:40,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1397/203307 [1:36:48<233:12:42,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1398/203307 [1:36:52<233:12:23,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1398/203307 [1:36:52<233:12:25,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1399/203307 [1:36:56<233:11:55,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1399/203307 [1:36:56<233:11:56,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1400/203307 [1:37:01<233:11:50,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1400/203307 [1:37:01<233:11:52,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1401/203307 [1:37:05<233:13:20,  0.24it/s, v_num=t5e6, training/loss=0.117]Epoch 0:   1%|          | 1401/203307 [1:37:05<233:13:22,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1402/203307 [1:37:09<233:12:28,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1402/203307 [1:37:09<233:12:30,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1403/203307 [1:37:14<233:13:28,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1403/203307 [1:37:14<233:13:30,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1404/203307 [1:37:18<233:13:31,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1404/203307 [1:37:18<233:13:32,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1405/203307 [1:37:22<233:13:08,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1405/203307 [1:37:22<233:13:09,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1406/203307 [1:37:26<233:12:42,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1406/203307 [1:37:26<233:12:43,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1407/203307 [1:37:30<233:12:27,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1407/203307 [1:37:30<233:12:28,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1408/203307 [1:37:34<233:12:18,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1408/203307 [1:37:34<233:12:18,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1409/203307 [1:37:39<233:13:54,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1409/203307 [1:37:39<233:13:55,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1410/203307 [1:37:43<233:13:18,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1410/203307 [1:37:43<233:13:19,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1411/203307 [1:37:47<233:13:28,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1411/203307 [1:37:47<233:13:30,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1412/203307 [1:37:52<233:14:49,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1412/203307 [1:37:52<233:14:50,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1413/203307 [1:37:56<233:14:30,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1413/203307 [1:37:56<233:14:31,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1414/203307 [1:38:00<233:14:03,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1414/203307 [1:38:00<233:14:04,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1415/203307 [1:38:04<233:13:34,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1415/203307 [1:38:04<233:13:36,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1416/203307 [1:38:08<233:13:21,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1416/203307 [1:38:08<233:13:22,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1417/203307 [1:38:12<233:12:48,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1417/203307 [1:38:12<233:12:49,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1418/203307 [1:38:17<233:14:03,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1418/203307 [1:38:17<233:14:05,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1419/203307 [1:38:21<233:13:40,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1419/203307 [1:38:21<233:13:42,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1420/203307 [1:38:26<233:15:01,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1420/203307 [1:38:26<233:15:03,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1421/203307 [1:38:30<233:14:24,  0.24it/s, v_num=t5e6, training/loss=0.125]Epoch 0:   1%|          | 1421/203307 [1:38:30<233:14:25,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1422/203307 [1:38:34<233:13:56,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1422/203307 [1:38:34<233:13:57,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1423/203307 [1:38:38<233:13:27,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1423/203307 [1:38:38<233:13:29,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1424/203307 [1:38:42<233:13:17,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1424/203307 [1:38:42<233:13:18,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1425/203307 [1:38:46<233:12:48,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1425/203307 [1:38:46<233:12:49,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1426/203307 [1:38:50<233:12:14,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1426/203307 [1:38:50<233:12:15,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1427/203307 [1:38:55<233:13:56,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1427/203307 [1:38:55<233:13:57,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1428/203307 [1:38:59<233:13:54,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1428/203307 [1:38:59<233:13:56,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1429/203307 [1:39:03<233:14:56,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1429/203307 [1:39:03<233:14:58,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1430/203307 [1:39:07<233:14:27,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1430/203307 [1:39:07<233:14:28,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1431/203307 [1:39:11<233:14:07,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1431/203307 [1:39:11<233:14:08,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1432/203307 [1:39:15<233:13:56,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1432/203307 [1:39:15<233:13:58,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1433/203307 [1:39:19<233:13:33,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1433/203307 [1:39:19<233:13:34,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1434/203307 [1:39:23<233:12:56,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1434/203307 [1:39:23<233:12:57,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1435/203307 [1:39:28<233:14:38,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1435/203307 [1:39:28<233:14:38,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1436/203307 [1:39:32<233:14:34,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1436/203307 [1:39:33<233:14:36,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1437/203307 [1:39:37<233:14:11,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1437/203307 [1:39:37<233:14:13,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1438/203307 [1:39:41<233:15:18,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1438/203307 [1:39:41<233:15:19,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1439/203307 [1:39:45<233:14:43,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1439/203307 [1:39:45<233:14:45,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1440/203307 [1:39:49<233:14:24,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1440/203307 [1:39:49<233:14:25,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1441/203307 [1:39:53<233:14:04,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1441/203307 [1:39:53<233:14:05,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1442/203307 [1:39:57<233:13:15,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1442/203307 [1:39:57<233:13:17,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1443/203307 [1:40:01<233:12:43,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1443/203307 [1:40:01<233:12:45,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1444/203307 [1:40:06<233:14:39,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1444/203307 [1:40:06<233:14:40,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1445/203307 [1:40:10<233:14:24,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1445/203307 [1:40:10<233:14:24,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1446/203307 [1:40:15<233:15:08,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1446/203307 [1:40:15<233:15:10,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1447/203307 [1:40:19<233:14:30,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1447/203307 [1:40:19<233:14:32,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1448/203307 [1:40:23<233:14:18,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1448/203307 [1:40:23<233:14:20,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1449/203307 [1:40:27<233:14:03,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1449/203307 [1:40:27<233:14:04,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1450/203307 [1:40:31<233:14:02,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1450/203307 [1:40:31<233:14:03,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1451/203307 [1:40:35<233:13:28,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1451/203307 [1:40:35<233:13:29,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1452/203307 [1:40:39<233:13:15,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1452/203307 [1:40:39<233:13:15,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1453/203307 [1:40:44<233:14:57,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1453/203307 [1:40:44<233:14:58,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1454/203307 [1:40:48<233:14:30,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1454/203307 [1:40:48<233:14:31,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1455/203307 [1:40:53<233:15:32,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1455/203307 [1:40:53<233:15:33,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1456/203307 [1:40:57<233:15:31,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1456/203307 [1:40:57<233:15:32,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1457/203307 [1:41:01<233:15:04,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1457/203307 [1:41:01<233:15:05,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1458/203307 [1:41:05<233:14:44,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1458/203307 [1:41:05<233:14:45,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1459/203307 [1:41:09<233:14:28,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1459/203307 [1:41:09<233:14:29,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1460/203307 [1:41:13<233:14:21,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1460/203307 [1:41:13<233:14:22,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1461/203307 [1:41:18<233:15:51,  0.24it/s, v_num=t5e6, training/loss=0.130]Epoch 0:   1%|          | 1461/203307 [1:41:18<233:15:51,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1462/203307 [1:41:22<233:15:25,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1462/203307 [1:41:22<233:15:26,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1463/203307 [1:41:26<233:14:56,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1463/203307 [1:41:26<233:14:57,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1464/203307 [1:41:31<233:16:13,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1464/203307 [1:41:31<233:16:14,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1465/203307 [1:41:34<233:15:45,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1465/203307 [1:41:35<233:15:46,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1466/203307 [1:41:38<233:15:15,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1466/203307 [1:41:38<233:15:16,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1467/203307 [1:41:42<233:14:50,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1467/203307 [1:41:42<233:14:51,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1468/203307 [1:41:47<233:14:37,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1468/203307 [1:41:47<233:14:38,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1469/203307 [1:41:51<233:14:12,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1469/203307 [1:41:51<233:14:14,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1470/203307 [1:41:55<233:15:23,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1470/203307 [1:41:55<233:15:25,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1471/203307 [1:41:59<233:14:46,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1471/203307 [1:41:59<233:14:48,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1472/203307 [1:42:04<233:15:45,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1472/203307 [1:42:04<233:15:47,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1473/203307 [1:42:08<233:15:17,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1473/203307 [1:42:08<233:15:18,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1474/203307 [1:42:12<233:14:56,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1474/203307 [1:42:12<233:14:57,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1475/203307 [1:42:16<233:14:25,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1475/203307 [1:42:16<233:14:26,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1476/203307 [1:42:20<233:14:18,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1476/203307 [1:42:20<233:14:20,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1477/203307 [1:42:24<233:13:55,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1477/203307 [1:42:24<233:13:57,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1478/203307 [1:42:28<233:13:59,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1478/203307 [1:42:28<233:14:00,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1479/203307 [1:42:33<233:15:08,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1479/203307 [1:42:33<233:15:09,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1480/203307 [1:42:37<233:14:51,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1480/203307 [1:42:37<233:14:53,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1481/203307 [1:42:42<233:15:46,  0.24it/s, v_num=t5e6, training/loss=0.122]Epoch 0:   1%|          | 1481/203307 [1:42:42<233:15:47,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1482/203307 [1:42:46<233:15:13,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1482/203307 [1:42:46<233:15:13,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1483/203307 [1:42:50<233:14:49,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1483/203307 [1:42:50<233:14:49,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1484/203307 [1:42:54<233:14:45,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1484/203307 [1:42:54<233:14:46,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1485/203307 [1:42:58<233:14:30,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1485/203307 [1:42:58<233:14:31,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1486/203307 [1:43:02<233:14:40,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1486/203307 [1:43:02<233:14:41,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1487/203307 [1:43:07<233:15:42,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1487/203307 [1:43:07<233:15:43,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1488/203307 [1:43:11<233:15:35,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1488/203307 [1:43:11<233:15:36,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1489/203307 [1:43:15<233:15:07,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1489/203307 [1:43:15<233:15:09,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1490/203307 [1:43:19<233:16:06,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1490/203307 [1:43:19<233:16:06,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1491/203307 [1:43:23<233:15:28,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1491/203307 [1:43:23<233:15:30,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1492/203307 [1:43:27<233:15:18,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1492/203307 [1:43:27<233:15:19,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1493/203307 [1:43:31<233:14:46,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1493/203307 [1:43:31<233:14:47,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1494/203307 [1:43:35<233:14:13,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1494/203307 [1:43:35<233:14:14,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1495/203307 [1:43:40<233:14:47,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1495/203307 [1:43:40<233:14:47,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1496/203307 [1:43:45<233:16:10,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1496/203307 [1:43:45<233:16:11,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1497/203307 [1:43:49<233:15:43,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1497/203307 [1:43:49<233:15:45,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1498/203307 [1:43:53<233:16:34,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1498/203307 [1:43:53<233:16:35,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1499/203307 [1:43:57<233:16:09,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1499/203307 [1:43:57<233:16:09,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1500/203307 [1:44:01<233:15:57,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1500/203307 [1:44:01<233:15:58,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1501/203307 [1:44:05<233:15:34,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1501/203307 [1:44:05<233:15:35,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1502/203307 [1:44:09<233:15:09,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1502/203307 [1:44:09<233:15:10,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1503/203307 [1:44:13<233:15:06,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1503/203307 [1:44:13<233:15:06,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1504/203307 [1:44:18<233:14:54,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1504/203307 [1:44:18<233:14:54,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1505/203307 [1:44:22<233:16:09,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1505/203307 [1:44:22<233:16:10,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1506/203307 [1:44:26<233:15:45,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1506/203307 [1:44:26<233:15:46,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1507/203307 [1:44:31<233:16:35,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1507/203307 [1:44:31<233:16:37,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1508/203307 [1:44:35<233:16:24,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1508/203307 [1:44:35<233:16:26,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1509/203307 [1:44:39<233:15:48,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1509/203307 [1:44:39<233:15:49,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1510/203307 [1:44:43<233:15:29,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1510/203307 [1:44:43<233:15:30,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1511/203307 [1:44:47<233:15:47,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1511/203307 [1:44:47<233:15:47,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1512/203307 [1:44:51<233:15:39,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1512/203307 [1:44:51<233:15:39,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1513/203307 [1:44:56<233:17:06,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1513/203307 [1:44:56<233:17:06,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1514/203307 [1:45:00<233:16:28,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1514/203307 [1:45:00<233:16:30,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1515/203307 [1:45:04<233:16:05,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1515/203307 [1:45:04<233:16:06,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1516/203307 [1:45:09<233:17:16,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1516/203307 [1:45:09<233:17:18,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1517/203307 [1:45:13<233:16:31,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1517/203307 [1:45:13<233:16:33,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1518/203307 [1:45:17<233:16:07,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1518/203307 [1:45:17<233:16:09,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1519/203307 [1:45:21<233:15:42,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1519/203307 [1:45:21<233:15:44,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1520/203307 [1:45:25<233:15:35,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1520/203307 [1:45:25<233:15:37,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1521/203307 [1:45:29<233:15:14,  0.24it/s, v_num=t5e6, training/loss=0.124]Epoch 0:   1%|          | 1521/203307 [1:45:29<233:15:14,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1522/203307 [1:45:34<233:16:24,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1522/203307 [1:45:34<233:16:25,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1523/203307 [1:45:38<233:15:54,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1523/203307 [1:45:38<233:15:56,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1524/203307 [1:45:42<233:16:59,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1524/203307 [1:45:42<233:17:00,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1525/203307 [1:45:46<233:16:49,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1525/203307 [1:45:47<233:16:51,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1526/203307 [1:45:51<233:16:26,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1526/203307 [1:45:51<233:16:28,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1527/203307 [1:45:54<233:15:56,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1527/203307 [1:45:54<233:15:57,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1528/203307 [1:45:59<233:15:55,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1528/203307 [1:45:59<233:15:56,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1529/203307 [1:46:03<233:15:46,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1529/203307 [1:46:03<233:15:48,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1530/203307 [1:46:07<233:15:28,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1530/203307 [1:46:07<233:15:30,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1531/203307 [1:46:12<233:16:44,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1531/203307 [1:46:12<233:16:45,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1532/203307 [1:46:16<233:16:43,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1532/203307 [1:46:16<233:16:44,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1533/203307 [1:46:21<233:17:53,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1533/203307 [1:46:21<233:17:54,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1534/203307 [1:46:25<233:17:29,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1534/203307 [1:46:25<233:17:31,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1535/203307 [1:46:29<233:17:03,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1535/203307 [1:46:29<233:17:03,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1536/203307 [1:46:33<233:17:26,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1536/203307 [1:46:33<233:17:27,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1537/203307 [1:46:37<233:17:20,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1537/203307 [1:46:37<233:17:22,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1538/203307 [1:46:41<233:16:43,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1538/203307 [1:46:41<233:16:43,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1539/203307 [1:46:46<233:18:38,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1539/203307 [1:46:46<233:18:38,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1540/203307 [1:46:50<233:18:31,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1540/203307 [1:46:50<233:18:32,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1541/203307 [1:46:54<233:18:02,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1541/203307 [1:46:54<233:18:04,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1542/203307 [1:46:59<233:19:10,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1542/203307 [1:46:59<233:19:11,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1543/203307 [1:47:03<233:19:00,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1543/203307 [1:47:03<233:19:01,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1544/203307 [1:47:07<233:18:46,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1544/203307 [1:47:07<233:18:47,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1545/203307 [1:47:11<233:18:50,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1545/203307 [1:47:11<233:18:52,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1546/203307 [1:47:15<233:18:14,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1546/203307 [1:47:15<233:18:15,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1547/203307 [1:47:19<233:18:03,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1547/203307 [1:47:19<233:18:03,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1548/203307 [1:47:24<233:19:47,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1548/203307 [1:47:24<233:19:47,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1549/203307 [1:47:28<233:19:25,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1549/203307 [1:47:28<233:19:26,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1550/203307 [1:47:33<233:20:16,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1550/203307 [1:47:33<233:20:18,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1551/203307 [1:47:37<233:20:05,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1551/203307 [1:47:37<233:20:05,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1552/203307 [1:47:41<233:19:51,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1552/203307 [1:47:41<233:19:53,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1553/203307 [1:47:45<233:19:43,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1553/203307 [1:47:45<233:19:44,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1554/203307 [1:47:49<233:19:30,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1554/203307 [1:47:49<233:19:31,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1555/203307 [1:47:53<233:19:05,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1555/203307 [1:47:53<233:19:06,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1556/203307 [1:47:58<233:18:57,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1556/203307 [1:47:58<233:18:59,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1557/203307 [1:48:02<233:20:00,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1557/203307 [1:48:02<233:20:02,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1558/203307 [1:48:06<233:19:24,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1558/203307 [1:48:06<233:19:25,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1559/203307 [1:48:11<233:20:23,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1559/203307 [1:48:11<233:20:25,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1560/203307 [1:48:15<233:20:10,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1560/203307 [1:48:15<233:20:12,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1561/203307 [1:48:19<233:20:14,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1561/203307 [1:48:19<233:20:16,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1562/203307 [1:48:23<233:19:41,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1562/203307 [1:48:23<233:19:42,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1563/203307 [1:48:27<233:19:23,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1563/203307 [1:48:27<233:19:23,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1564/203307 [1:48:31<233:19:14,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1564/203307 [1:48:31<233:19:16,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1565/203307 [1:48:36<233:20:30,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1565/203307 [1:48:36<233:20:32,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1566/203307 [1:48:40<233:20:01,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1566/203307 [1:48:40<233:20:02,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1567/203307 [1:48:44<233:19:28,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1567/203307 [1:48:44<233:19:28,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1568/203307 [1:48:49<233:20:40,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1568/203307 [1:48:49<233:20:41,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1569/203307 [1:48:53<233:20:08,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1569/203307 [1:48:53<233:20:09,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1570/203307 [1:48:57<233:20:21,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1570/203307 [1:48:57<233:20:23,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1571/203307 [1:49:01<233:19:53,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1571/203307 [1:49:01<233:19:55,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1572/203307 [1:49:05<233:19:46,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1572/203307 [1:49:05<233:19:47,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1573/203307 [1:49:09<233:19:18,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1573/203307 [1:49:09<233:19:19,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1574/203307 [1:49:14<233:20:18,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1574/203307 [1:49:14<233:20:19,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1575/203307 [1:49:18<233:19:47,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1575/203307 [1:49:18<233:19:48,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1576/203307 [1:49:22<233:20:53,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1576/203307 [1:49:22<233:20:55,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1577/203307 [1:49:26<233:20:02,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1577/203307 [1:49:26<233:20:03,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1578/203307 [1:49:30<233:20:02,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1578/203307 [1:49:30<233:20:04,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1579/203307 [1:49:34<233:19:38,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1579/203307 [1:49:34<233:19:39,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1580/203307 [1:49:38<233:19:29,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1580/203307 [1:49:38<233:19:29,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1581/203307 [1:49:42<233:19:07,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1581/203307 [1:49:42<233:19:07,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1582/203307 [1:49:46<233:18:45,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1582/203307 [1:49:47<233:18:47,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1583/203307 [1:49:51<233:19:51,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1583/203307 [1:49:51<233:19:53,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1584/203307 [1:49:55<233:19:35,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1584/203307 [1:49:55<233:19:36,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1585/203307 [1:50:00<233:20:35,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1585/203307 [1:50:00<233:20:35,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1586/203307 [1:50:04<233:20:49,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1586/203307 [1:50:04<233:20:50,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1587/203307 [1:50:08<233:20:15,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1587/203307 [1:50:08<233:20:15,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1588/203307 [1:50:12<233:20:09,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1588/203307 [1:50:12<233:20:09,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1589/203307 [1:50:16<233:19:55,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1589/203307 [1:50:16<233:19:56,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1590/203307 [1:50:20<233:19:28,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1590/203307 [1:50:20<233:19:29,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1591/203307 [1:50:25<233:20:54,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1591/203307 [1:50:25<233:20:54,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1592/203307 [1:50:29<233:20:51,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1592/203307 [1:50:29<233:20:52,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1593/203307 [1:50:33<233:20:28,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1593/203307 [1:50:33<233:20:30,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1594/203307 [1:50:38<233:21:33,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1594/203307 [1:50:38<233:21:34,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1595/203307 [1:50:42<233:21:35,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1595/203307 [1:50:42<233:21:36,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1596/203307 [1:50:47<233:21:29,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1596/203307 [1:50:47<233:21:30,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1597/203307 [1:50:51<233:21:10,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1597/203307 [1:50:51<233:21:12,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1598/203307 [1:50:54<233:20:30,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1598/203307 [1:50:54<233:20:32,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1599/203307 [1:50:59<233:20:14,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1599/203307 [1:50:59<233:20:15,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1600/203307 [1:51:04<233:21:52,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1600/203307 [1:51:04<233:21:54,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1601/203307 [1:51:08<233:21:33,  0.24it/s, v_num=t5e6, training/loss=0.132]Epoch 0:   1%|          | 1601/203307 [1:51:08<233:21:34,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1602/203307 [1:51:12<233:22:17,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1602/203307 [1:51:12<233:22:18,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1603/203307 [1:51:16<233:22:27,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1603/203307 [1:51:16<233:22:28,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1604/203307 [1:51:21<233:22:19,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1604/203307 [1:51:21<233:22:20,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1605/203307 [1:51:25<233:21:54,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1605/203307 [1:51:25<233:21:55,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1606/203307 [1:51:29<233:21:30,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1606/203307 [1:51:29<233:21:32,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1607/203307 [1:51:33<233:21:06,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1607/203307 [1:51:33<233:21:08,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1608/203307 [1:51:37<233:20:54,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1608/203307 [1:51:37<233:20:55,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1609/203307 [1:51:41<233:22:16,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1609/203307 [1:51:42<233:22:17,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1610/203307 [1:51:45<233:21:47,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1610/203307 [1:51:45<233:21:47,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1611/203307 [1:51:50<233:22:34,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1611/203307 [1:51:50<233:22:35,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1612/203307 [1:51:54<233:22:28,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1612/203307 [1:51:54<233:22:29,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1613/203307 [1:51:58<233:22:12,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1613/203307 [1:51:58<233:22:13,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1614/203307 [1:52:02<233:21:43,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1614/203307 [1:52:02<233:21:45,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1615/203307 [1:52:06<233:21:19,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1615/203307 [1:52:06<233:21:20,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1616/203307 [1:52:10<233:21:16,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1616/203307 [1:52:10<233:21:17,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1617/203307 [1:52:15<233:22:25,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1617/203307 [1:52:15<233:22:27,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1618/203307 [1:52:19<233:22:08,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1618/203307 [1:52:19<233:22:09,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1619/203307 [1:52:23<233:21:46,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1619/203307 [1:52:23<233:21:46,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1620/203307 [1:52:28<233:23:00,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1620/203307 [1:52:28<233:23:02,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1621/203307 [1:52:32<233:22:21,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1621/203307 [1:52:32<233:22:23,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1622/203307 [1:52:36<233:22:06,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1622/203307 [1:52:36<233:22:08,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1623/203307 [1:52:40<233:21:22,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1623/203307 [1:52:40<233:21:24,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1624/203307 [1:52:44<233:21:14,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1624/203307 [1:52:44<233:21:16,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1625/203307 [1:52:48<233:20:55,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1625/203307 [1:52:48<233:20:57,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1626/203307 [1:52:53<233:22:02,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1626/203307 [1:52:53<233:22:04,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1627/203307 [1:52:57<233:21:26,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1627/203307 [1:52:57<233:21:28,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1628/203307 [1:53:01<233:22:34,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1628/203307 [1:53:01<233:22:35,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1629/203307 [1:53:05<233:22:11,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1629/203307 [1:53:05<233:22:13,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1630/203307 [1:53:10<233:21:58,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1630/203307 [1:53:10<233:22:00,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1631/203307 [1:53:13<233:21:28,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1631/203307 [1:53:13<233:21:29,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1632/203307 [1:53:18<233:21:38,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1632/203307 [1:53:18<233:21:39,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1633/203307 [1:53:22<233:21:12,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1633/203307 [1:53:22<233:21:13,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1634/203307 [1:53:26<233:20:52,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1634/203307 [1:53:26<233:20:54,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1635/203307 [1:53:31<233:22:05,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1635/203307 [1:53:31<233:22:06,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1636/203307 [1:53:35<233:22:01,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1636/203307 [1:53:35<233:22:02,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1637/203307 [1:53:39<233:22:42,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1637/203307 [1:53:39<233:22:43,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1638/203307 [1:53:43<233:22:08,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1638/203307 [1:53:43<233:22:09,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1639/203307 [1:53:47<233:21:38,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1639/203307 [1:53:47<233:21:40,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1640/203307 [1:53:51<233:21:08,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1640/203307 [1:53:51<233:21:09,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1641/203307 [1:53:55<233:20:40,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1641/203307 [1:53:55<233:20:42,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1642/203307 [1:53:59<233:20:07,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1642/203307 [1:53:59<233:20:09,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1643/203307 [1:54:04<233:21:28,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1643/203307 [1:54:04<233:21:29,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1644/203307 [1:54:08<233:21:12,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1644/203307 [1:54:08<233:21:13,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1645/203307 [1:54:12<233:21:26,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1645/203307 [1:54:12<233:21:27,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1646/203307 [1:54:17<233:22:15,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1646/203307 [1:54:17<233:22:17,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1647/203307 [1:54:21<233:22:02,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1647/203307 [1:54:21<233:22:02,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1648/203307 [1:54:25<233:21:44,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1648/203307 [1:54:25<233:21:46,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1649/203307 [1:54:29<233:21:29,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1649/203307 [1:54:29<233:21:30,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1650/203307 [1:54:33<233:21:22,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1650/203307 [1:54:33<233:21:23,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1651/203307 [1:54:37<233:20:59,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1651/203307 [1:54:37<233:21:00,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1652/203307 [1:54:42<233:22:34,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1652/203307 [1:54:42<233:22:35,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1653/203307 [1:54:46<233:22:24,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1653/203307 [1:54:46<233:22:25,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1654/203307 [1:54:51<233:23:14,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1654/203307 [1:54:51<233:23:15,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1655/203307 [1:54:55<233:22:50,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1655/203307 [1:54:55<233:22:51,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1656/203307 [1:54:59<233:22:37,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1656/203307 [1:54:59<233:22:38,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1657/203307 [1:55:03<233:22:18,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1657/203307 [1:55:03<233:22:19,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1658/203307 [1:55:07<233:21:50,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1658/203307 [1:55:07<233:21:50,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1659/203307 [1:55:11<233:21:22,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1659/203307 [1:55:11<233:21:23,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1660/203307 [1:55:15<233:21:17,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1660/203307 [1:55:15<233:21:18,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1661/203307 [1:55:20<233:22:44,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1661/203307 [1:55:20<233:22:45,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1662/203307 [1:55:24<233:21:58,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1662/203307 [1:55:24<233:21:59,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1663/203307 [1:55:29<233:22:50,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1663/203307 [1:55:29<233:22:51,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1664/203307 [1:55:33<233:22:33,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1664/203307 [1:55:33<233:22:34,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1665/203307 [1:55:37<233:22:02,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1665/203307 [1:55:37<233:22:02,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1666/203307 [1:55:41<233:21:34,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1666/203307 [1:55:41<233:21:34,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1667/203307 [1:55:45<233:21:33,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1667/203307 [1:55:45<233:21:34,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1668/203307 [1:55:49<233:21:23,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1668/203307 [1:55:49<233:21:24,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1669/203307 [1:55:54<233:22:32,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1669/203307 [1:55:54<233:22:33,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1670/203307 [1:55:58<233:22:51,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1670/203307 [1:55:58<233:22:53,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1671/203307 [1:56:02<233:22:44,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1671/203307 [1:56:02<233:22:45,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1672/203307 [1:56:07<233:23:43,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1672/203307 [1:56:07<233:23:44,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1673/203307 [1:56:11<233:23:16,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1673/203307 [1:56:11<233:23:17,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1674/203307 [1:56:15<233:22:50,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1674/203307 [1:56:15<233:22:52,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1675/203307 [1:56:19<233:22:49,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1675/203307 [1:56:19<233:22:50,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1676/203307 [1:56:23<233:22:22,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1676/203307 [1:56:23<233:22:23,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1677/203307 [1:56:27<233:21:52,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1677/203307 [1:56:27<233:21:53,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1678/203307 [1:56:32<233:23:07,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1678/203307 [1:56:32<233:23:08,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1679/203307 [1:56:36<233:22:56,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1679/203307 [1:56:36<233:22:57,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1680/203307 [1:56:40<233:23:49,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1680/203307 [1:56:40<233:23:50,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1681/203307 [1:56:45<233:23:36,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1681/203307 [1:56:45<233:23:37,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1682/203307 [1:56:49<233:23:07,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1682/203307 [1:56:49<233:23:08,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1683/203307 [1:56:53<233:22:56,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1683/203307 [1:56:53<233:22:56,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1684/203307 [1:56:57<233:22:50,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1684/203307 [1:56:57<233:22:51,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1685/203307 [1:57:01<233:22:25,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1685/203307 [1:57:01<233:22:26,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1686/203307 [1:57:05<233:22:25,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1686/203307 [1:57:05<233:22:27,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1687/203307 [1:57:10<233:23:51,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1687/203307 [1:57:10<233:23:52,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1688/203307 [1:57:14<233:23:30,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1688/203307 [1:57:14<233:23:31,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1689/203307 [1:57:19<233:24:32,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1689/203307 [1:57:19<233:24:34,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1690/203307 [1:57:23<233:24:00,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1690/203307 [1:57:23<233:24:00,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1691/203307 [1:57:27<233:23:57,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1691/203307 [1:57:27<233:23:57,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1692/203307 [1:57:31<233:23:44,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1692/203307 [1:57:31<233:23:45,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1693/203307 [1:57:35<233:23:32,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1693/203307 [1:57:35<233:23:33,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1694/203307 [1:57:39<233:23:02,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1694/203307 [1:57:39<233:23:03,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1695/203307 [1:57:44<233:24:32,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1695/203307 [1:57:44<233:24:32,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1696/203307 [1:57:48<233:24:18,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1696/203307 [1:57:48<233:24:18,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1697/203307 [1:57:52<233:23:47,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1697/203307 [1:57:52<233:23:47,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1698/203307 [1:57:57<233:24:54,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1698/203307 [1:57:57<233:24:55,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1699/203307 [1:58:01<233:25:01,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1699/203307 [1:58:01<233:25:01,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1700/203307 [1:58:05<233:24:51,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1700/203307 [1:58:05<233:24:53,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1701/203307 [1:58:09<233:24:40,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1701/203307 [1:58:09<233:24:41,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1702/203307 [1:58:13<233:24:13,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1702/203307 [1:58:13<233:24:14,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1703/203307 [1:58:18<233:24:59,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1703/203307 [1:58:18<233:25:01,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1704/203307 [1:58:23<233:26:25,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1704/203307 [1:58:23<233:26:26,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1705/203307 [1:58:27<233:26:05,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1705/203307 [1:58:27<233:26:06,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1706/203307 [1:58:31<233:26:47,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1706/203307 [1:58:31<233:26:48,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1707/203307 [1:58:35<233:26:40,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1707/203307 [1:58:35<233:26:41,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1708/203307 [1:58:39<233:26:28,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1708/203307 [1:58:40<233:26:29,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1709/203307 [1:58:44<233:26:06,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1709/203307 [1:58:44<233:26:07,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1710/203307 [1:58:47<233:25:37,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1710/203307 [1:58:47<233:25:39,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1711/203307 [1:58:52<233:26:42,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1711/203307 [1:58:52<233:26:43,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1712/203307 [1:58:56<233:26:17,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1712/203307 [1:58:56<233:26:18,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1713/203307 [1:59:01<233:27:19,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1713/203307 [1:59:01<233:27:20,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1714/203307 [1:59:05<233:26:47,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1714/203307 [1:59:05<233:26:48,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1715/203307 [1:59:10<233:27:58,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1715/203307 [1:59:10<233:27:58,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1716/203307 [1:59:14<233:27:31,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1716/203307 [1:59:14<233:27:32,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1717/203307 [1:59:18<233:27:21,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1717/203307 [1:59:18<233:27:22,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1718/203307 [1:59:22<233:26:50,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1718/203307 [1:59:22<233:26:52,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1719/203307 [1:59:26<233:26:40,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1719/203307 [1:59:26<233:26:42,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1720/203307 [1:59:30<233:26:39,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1720/203307 [1:59:30<233:26:40,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1721/203307 [1:59:35<233:27:49,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 1721/203307 [1:59:35<233:27:51,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1722/203307 [1:59:39<233:27:20,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1722/203307 [1:59:39<233:27:22,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1723/203307 [1:59:43<233:27:19,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1723/203307 [1:59:43<233:27:19,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1724/203307 [1:59:48<233:28:32,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1724/203307 [1:59:48<233:28:33,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1725/203307 [1:59:52<233:28:12,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1725/203307 [1:59:52<233:28:12,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1726/203307 [1:59:56<233:27:35,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1726/203307 [1:59:56<233:27:35,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1727/203307 [2:00:00<233:27:26,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1727/203307 [2:00:00<233:27:27,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1728/203307 [2:00:04<233:27:22,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1728/203307 [2:00:04<233:27:23,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1729/203307 [2:00:08<233:27:02,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1729/203307 [2:00:08<233:27:03,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1730/203307 [2:00:13<233:27:53,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1730/203307 [2:00:13<233:27:55,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1731/203307 [2:00:17<233:27:51,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1731/203307 [2:00:17<233:27:52,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1732/203307 [2:00:22<233:28:49,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1732/203307 [2:00:22<233:28:50,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1733/203307 [2:00:26<233:28:37,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1733/203307 [2:00:26<233:28:38,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1734/203307 [2:00:30<233:28:02,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1734/203307 [2:00:30<233:28:02,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1735/203307 [2:00:34<233:27:58,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1735/203307 [2:00:34<233:28:00,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1736/203307 [2:00:38<233:27:56,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1736/203307 [2:00:38<233:27:57,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1737/203307 [2:00:42<233:27:27,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1737/203307 [2:00:42<233:27:28,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1738/203307 [2:00:46<233:27:04,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1738/203307 [2:00:46<233:27:04,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1739/203307 [2:00:51<233:28:33,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1739/203307 [2:00:51<233:28:33,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1740/203307 [2:00:55<233:28:07,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1740/203307 [2:00:55<233:28:08,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1741/203307 [2:01:00<233:29:01,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|          | 1741/203307 [2:01:00<233:29:03,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1742/203307 [2:01:04<233:28:32,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1742/203307 [2:01:04<233:28:33,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1743/203307 [2:01:08<233:28:26,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1743/203307 [2:01:08<233:28:27,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1744/203307 [2:01:12<233:28:16,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1744/203307 [2:01:12<233:28:16,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1745/203307 [2:01:16<233:28:19,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1745/203307 [2:01:16<233:28:19,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1746/203307 [2:01:20<233:27:42,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1746/203307 [2:01:20<233:27:42,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1747/203307 [2:01:25<233:29:09,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1747/203307 [2:01:25<233:29:09,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1748/203307 [2:01:29<233:28:58,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1748/203307 [2:01:29<233:28:59,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1749/203307 [2:01:33<233:28:54,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1749/203307 [2:01:33<233:28:54,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1750/203307 [2:01:38<233:29:41,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1750/203307 [2:01:38<233:29:42,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1751/203307 [2:01:42<233:29:37,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1751/203307 [2:01:42<233:29:38,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1752/203307 [2:01:46<233:29:19,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1752/203307 [2:01:46<233:29:20,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1753/203307 [2:01:50<233:29:13,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1753/203307 [2:01:50<233:29:13,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1754/203307 [2:01:54<233:28:33,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1754/203307 [2:01:54<233:28:34,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1755/203307 [2:01:58<233:28:33,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1755/203307 [2:01:58<233:28:33,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1756/203307 [2:02:03<233:29:48,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1756/203307 [2:02:03<233:29:48,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1757/203307 [2:02:07<233:29:23,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1757/203307 [2:02:07<233:29:23,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1758/203307 [2:02:12<233:30:07,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1758/203307 [2:02:12<233:30:08,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1759/203307 [2:02:16<233:30:01,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1759/203307 [2:02:16<233:30:02,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1760/203307 [2:02:20<233:29:44,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1760/203307 [2:02:20<233:29:45,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1761/203307 [2:02:24<233:29:40,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 1761/203307 [2:02:24<233:29:41,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1762/203307 [2:02:28<233:29:16,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1762/203307 [2:02:28<233:29:16,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1763/203307 [2:02:32<233:29:04,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1763/203307 [2:02:32<233:29:05,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1764/203307 [2:02:36<233:28:44,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1764/203307 [2:02:36<233:28:45,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1765/203307 [2:02:41<233:29:39,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1765/203307 [2:02:41<233:29:41,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1766/203307 [2:02:45<233:29:13,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1766/203307 [2:02:45<233:29:13,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1767/203307 [2:02:50<233:30:24,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1767/203307 [2:02:50<233:30:25,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1768/203307 [2:02:54<233:30:05,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1768/203307 [2:02:54<233:30:06,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1769/203307 [2:02:58<233:29:45,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1769/203307 [2:02:58<233:29:46,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1770/203307 [2:03:02<233:29:48,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1770/203307 [2:03:02<233:29:48,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1771/203307 [2:03:06<233:29:35,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1771/203307 [2:03:06<233:29:35,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1772/203307 [2:03:10<233:29:26,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1772/203307 [2:03:10<233:29:26,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1773/203307 [2:03:15<233:30:52,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1773/203307 [2:03:15<233:30:53,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1774/203307 [2:03:19<233:30:26,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1774/203307 [2:03:19<233:30:27,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1775/203307 [2:03:23<233:30:18,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1775/203307 [2:03:23<233:30:18,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1776/203307 [2:03:28<233:31:27,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1776/203307 [2:03:28<233:31:27,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1777/203307 [2:03:32<233:31:09,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1777/203307 [2:03:32<233:31:10,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1778/203307 [2:03:36<233:31:09,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1778/203307 [2:03:36<233:31:10,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1779/203307 [2:03:41<233:31:06,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1779/203307 [2:03:41<233:31:07,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1780/203307 [2:03:45<233:30:48,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1780/203307 [2:03:45<233:30:49,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1781/203307 [2:03:49<233:30:32,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 1781/203307 [2:03:49<233:30:34,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1782/203307 [2:03:53<233:31:28,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1782/203307 [2:03:53<233:31:29,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1783/203307 [2:03:57<233:31:19,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1783/203307 [2:03:57<233:31:20,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1784/203307 [2:04:02<233:32:07,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1784/203307 [2:04:02<233:32:08,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1785/203307 [2:04:06<233:31:47,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1785/203307 [2:04:06<233:31:48,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1786/203307 [2:04:10<233:31:37,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1786/203307 [2:04:10<233:31:38,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1787/203307 [2:04:14<233:31:24,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1787/203307 [2:04:14<233:31:25,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1788/203307 [2:04:18<233:31:05,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1788/203307 [2:04:18<233:31:07,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1789/203307 [2:04:22<233:30:48,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1789/203307 [2:04:22<233:30:49,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1790/203307 [2:04:26<233:30:18,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1790/203307 [2:04:26<233:30:18,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1791/203307 [2:04:32<233:31:59,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1791/203307 [2:04:32<233:31:59,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1792/203307 [2:04:36<233:31:47,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1792/203307 [2:04:36<233:31:47,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1793/203307 [2:04:40<233:32:35,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1793/203307 [2:04:40<233:32:36,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1794/203307 [2:04:44<233:32:02,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1794/203307 [2:04:44<233:32:03,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1795/203307 [2:04:49<233:32:53,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1795/203307 [2:04:49<233:32:54,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1796/203307 [2:04:53<233:32:41,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1796/203307 [2:04:53<233:32:42,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1797/203307 [2:04:57<233:32:19,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1797/203307 [2:04:57<233:32:20,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1798/203307 [2:05:01<233:31:57,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1798/203307 [2:05:01<233:31:59,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1799/203307 [2:05:06<233:33:15,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1799/203307 [2:05:06<233:33:16,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1800/203307 [2:05:10<233:32:58,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1800/203307 [2:05:10<233:32:59,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1801/203307 [2:05:14<233:32:37,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 1801/203307 [2:05:14<233:32:38,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1802/203307 [2:05:19<233:33:24,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1802/203307 [2:05:19<233:33:26,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1803/203307 [2:05:23<233:34:15,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1803/203307 [2:05:23<233:34:15,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1804/203307 [2:05:27<233:34:06,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1804/203307 [2:05:27<233:34:07,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1805/203307 [2:05:31<233:33:49,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1805/203307 [2:05:31<233:33:51,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1806/203307 [2:05:35<233:33:17,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1806/203307 [2:05:35<233:33:18,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1807/203307 [2:05:40<233:33:13,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1807/203307 [2:05:40<233:33:14,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1808/203307 [2:05:44<233:34:24,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1808/203307 [2:05:44<233:34:25,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1809/203307 [2:05:48<233:34:05,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1809/203307 [2:05:48<233:34:07,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1810/203307 [2:05:53<233:34:46,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1810/203307 [2:05:53<233:34:48,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1811/203307 [2:05:58<233:35:40,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1811/203307 [2:05:58<233:35:42,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1812/203307 [2:06:02<233:35:22,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1812/203307 [2:06:02<233:35:23,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1813/203307 [2:06:06<233:35:07,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1813/203307 [2:06:06<233:35:07,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1814/203307 [2:06:10<233:34:21,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1814/203307 [2:06:10<233:34:21,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1815/203307 [2:06:14<233:34:08,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1815/203307 [2:06:14<233:34:09,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1816/203307 [2:06:18<233:33:51,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1816/203307 [2:06:18<233:33:52,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1817/203307 [2:06:23<233:34:56,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1817/203307 [2:06:23<233:34:57,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1818/203307 [2:06:27<233:34:30,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1818/203307 [2:06:27<233:34:31,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1819/203307 [2:06:31<233:35:43,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1819/203307 [2:06:31<233:35:43,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1820/203307 [2:06:36<233:35:43,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1820/203307 [2:06:36<233:35:43,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1821/203307 [2:06:40<233:35:24,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   1%|          | 1821/203307 [2:06:40<233:35:25,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1822/203307 [2:06:44<233:34:59,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1822/203307 [2:06:44<233:35:00,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1823/203307 [2:06:48<233:34:51,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1823/203307 [2:06:48<233:34:52,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1824/203307 [2:06:52<233:34:30,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1824/203307 [2:06:52<233:34:31,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1825/203307 [2:06:57<233:35:43,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1825/203307 [2:06:57<233:35:45,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1826/203307 [2:07:01<233:35:23,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1826/203307 [2:07:01<233:35:25,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1827/203307 [2:07:05<233:35:20,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1827/203307 [2:07:05<233:35:22,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1828/203307 [2:07:10<233:36:36,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1828/203307 [2:07:10<233:36:37,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1829/203307 [2:07:14<233:36:19,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1829/203307 [2:07:14<233:36:20,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1830/203307 [2:07:18<233:35:50,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1830/203307 [2:07:18<233:35:50,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1831/203307 [2:07:22<233:35:41,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1831/203307 [2:07:22<233:35:42,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1832/203307 [2:07:26<233:35:33,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1832/203307 [2:07:26<233:35:33,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1833/203307 [2:07:30<233:35:07,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1833/203307 [2:07:30<233:35:08,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1834/203307 [2:07:35<233:36:01,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1834/203307 [2:07:35<233:36:02,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1835/203307 [2:07:39<233:35:54,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1835/203307 [2:07:39<233:35:55,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1836/203307 [2:07:44<233:36:40,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1836/203307 [2:07:44<233:36:40,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1837/203307 [2:07:48<233:36:16,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1837/203307 [2:07:48<233:36:17,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1838/203307 [2:07:51<233:35:43,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1838/203307 [2:07:51<233:35:44,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1839/203307 [2:07:56<233:35:32,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1839/203307 [2:07:56<233:35:33,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1840/203307 [2:08:00<233:35:15,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1840/203307 [2:08:00<233:35:16,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1841/203307 [2:08:04<233:34:58,  0.24it/s, v_num=t5e6, training/loss=0.123]Epoch 0:   1%|          | 1841/203307 [2:08:04<233:34:59,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1842/203307 [2:08:08<233:34:39,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1842/203307 [2:08:08<233:34:40,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1843/203307 [2:08:12<233:35:38,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1843/203307 [2:08:12<233:35:39,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1844/203307 [2:08:16<233:35:20,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1844/203307 [2:08:16<233:35:22,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1845/203307 [2:08:21<233:36:14,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1845/203307 [2:08:21<233:36:15,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1846/203307 [2:08:25<233:35:48,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1846/203307 [2:08:25<233:35:50,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1847/203307 [2:08:29<233:35:45,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1847/203307 [2:08:29<233:35:46,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1848/203307 [2:08:34<233:35:40,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1848/203307 [2:08:34<233:35:41,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1849/203307 [2:08:38<233:35:22,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1849/203307 [2:08:38<233:35:23,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1850/203307 [2:08:42<233:34:55,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1850/203307 [2:08:42<233:34:56,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1851/203307 [2:08:46<233:36:12,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1851/203307 [2:08:46<233:36:13,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1852/203307 [2:08:51<233:36:02,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1852/203307 [2:08:51<233:36:02,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1853/203307 [2:08:55<233:35:51,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1853/203307 [2:08:55<233:35:53,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1854/203307 [2:08:59<233:36:43,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1854/203307 [2:08:59<233:36:45,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1855/203307 [2:09:03<233:36:29,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1855/203307 [2:09:03<233:36:30,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1856/203307 [2:09:08<233:36:22,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1856/203307 [2:09:08<233:36:23,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1857/203307 [2:09:12<233:36:06,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1857/203307 [2:09:12<233:36:07,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1858/203307 [2:09:16<233:35:37,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1858/203307 [2:09:16<233:35:38,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1859/203307 [2:09:20<233:35:30,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1859/203307 [2:09:20<233:35:32,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1860/203307 [2:09:25<233:36:41,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1860/203307 [2:09:25<233:36:42,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1861/203307 [2:09:29<233:36:41,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 1861/203307 [2:09:29<233:36:41,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1862/203307 [2:09:33<233:37:16,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1862/203307 [2:09:33<233:37:16,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1863/203307 [2:09:38<233:37:06,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1863/203307 [2:09:38<233:37:07,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1864/203307 [2:09:41<233:36:41,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1864/203307 [2:09:42<233:36:42,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1865/203307 [2:09:46<233:36:25,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1865/203307 [2:09:46<233:36:25,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1866/203307 [2:09:50<233:36:08,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1866/203307 [2:09:50<233:36:09,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1867/203307 [2:09:54<233:35:56,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1867/203307 [2:09:54<233:35:57,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1868/203307 [2:09:58<233:35:35,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1868/203307 [2:09:58<233:35:36,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1869/203307 [2:10:03<233:36:39,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1869/203307 [2:10:03<233:36:39,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1870/203307 [2:10:07<233:36:33,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1870/203307 [2:10:07<233:36:34,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1871/203307 [2:10:11<233:37:33,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1871/203307 [2:10:11<233:37:34,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1872/203307 [2:10:16<233:37:18,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1872/203307 [2:10:16<233:37:19,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1873/203307 [2:10:20<233:36:58,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1873/203307 [2:10:20<233:36:59,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1874/203307 [2:10:24<233:36:40,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1874/203307 [2:10:24<233:36:42,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1875/203307 [2:10:28<233:36:30,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1875/203307 [2:10:28<233:36:31,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1876/203307 [2:10:32<233:36:10,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1876/203307 [2:10:32<233:36:11,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1877/203307 [2:10:36<233:37:01,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1877/203307 [2:10:36<233:37:02,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1878/203307 [2:10:41<233:36:59,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1878/203307 [2:10:41<233:37:00,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1879/203307 [2:10:45<233:36:52,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1879/203307 [2:10:45<233:36:53,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1880/203307 [2:10:50<233:37:53,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1880/203307 [2:10:50<233:37:54,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1881/203307 [2:10:54<233:37:31,  0.24it/s, v_num=t5e6, training/loss=0.112]Epoch 0:   1%|          | 1881/203307 [2:10:54<233:37:31,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1882/203307 [2:10:58<233:37:07,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1882/203307 [2:10:58<233:37:08,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1883/203307 [2:11:02<233:36:58,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1883/203307 [2:11:02<233:36:59,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1884/203307 [2:11:06<233:36:41,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1884/203307 [2:11:06<233:36:42,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1885/203307 [2:11:10<233:36:19,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1885/203307 [2:11:10<233:36:20,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1886/203307 [2:11:15<233:37:14,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1886/203307 [2:11:15<233:37:16,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1887/203307 [2:11:19<233:37:12,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1887/203307 [2:11:19<233:37:13,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1888/203307 [2:11:24<233:38:17,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1888/203307 [2:11:24<233:38:18,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1889/203307 [2:11:28<233:37:57,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1889/203307 [2:11:28<233:37:57,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1890/203307 [2:11:32<233:37:37,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1890/203307 [2:11:32<233:37:38,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1891/203307 [2:11:36<233:37:30,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1891/203307 [2:11:36<233:37:30,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1892/203307 [2:11:40<233:37:37,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1892/203307 [2:11:40<233:37:37,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1893/203307 [2:11:44<233:37:19,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1893/203307 [2:11:44<233:37:20,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1894/203307 [2:11:48<233:36:59,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1894/203307 [2:11:48<233:37:00,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1895/203307 [2:11:53<233:38:07,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1895/203307 [2:11:53<233:38:08,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1896/203307 [2:11:57<233:37:55,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1896/203307 [2:11:57<233:37:55,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1897/203307 [2:12:02<233:38:54,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1897/203307 [2:12:02<233:38:55,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1898/203307 [2:12:06<233:38:33,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1898/203307 [2:12:06<233:38:33,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1899/203307 [2:12:10<233:38:29,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1899/203307 [2:12:10<233:38:30,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1900/203307 [2:12:14<233:38:23,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1900/203307 [2:12:14<233:38:23,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1901/203307 [2:12:18<233:38:11,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1901/203307 [2:12:18<233:38:12,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1902/203307 [2:12:22<233:37:41,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1902/203307 [2:12:22<233:37:43,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1903/203307 [2:12:27<233:38:58,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1903/203307 [2:12:27<233:38:59,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1904/203307 [2:12:31<233:38:41,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1904/203307 [2:12:31<233:38:41,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1905/203307 [2:12:35<233:38:25,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1905/203307 [2:12:35<233:38:25,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1906/203307 [2:12:40<233:39:14,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1906/203307 [2:12:40<233:39:16,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1907/203307 [2:12:44<233:39:06,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1907/203307 [2:12:44<233:39:06,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1908/203307 [2:12:48<233:38:52,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1908/203307 [2:12:48<233:38:53,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1909/203307 [2:12:52<233:38:40,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1909/203307 [2:12:52<233:38:42,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1910/203307 [2:12:56<233:38:17,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1910/203307 [2:12:56<233:38:18,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1911/203307 [2:13:01<233:38:59,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1911/203307 [2:13:01<233:39:00,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1912/203307 [2:13:06<233:40:16,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1912/203307 [2:13:06<233:40:17,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1913/203307 [2:13:10<233:39:50,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1913/203307 [2:13:10<233:39:51,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1914/203307 [2:13:14<233:40:23,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1914/203307 [2:13:14<233:40:24,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1915/203307 [2:13:18<233:40:16,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1915/203307 [2:13:18<233:40:17,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1916/203307 [2:13:23<233:40:02,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1916/203307 [2:13:23<233:40:03,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1917/203307 [2:13:27<233:39:49,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1917/203307 [2:13:27<233:39:49,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1918/203307 [2:13:31<233:39:19,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1918/203307 [2:13:31<233:39:20,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1919/203307 [2:13:35<233:38:57,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1919/203307 [2:13:35<233:38:58,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1920/203307 [2:13:39<233:39:36,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1920/203307 [2:13:39<233:39:36,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1921/203307 [2:13:44<233:41:02,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 1921/203307 [2:13:44<233:41:03,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1922/203307 [2:13:48<233:40:30,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1922/203307 [2:13:48<233:40:31,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1923/203307 [2:13:53<233:41:25,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1923/203307 [2:13:53<233:41:26,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1924/203307 [2:13:57<233:41:01,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1924/203307 [2:13:57<233:41:02,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1925/203307 [2:14:01<233:40:43,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1925/203307 [2:14:01<233:40:44,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1926/203307 [2:14:05<233:40:16,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1926/203307 [2:14:05<233:40:17,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1927/203307 [2:14:09<233:39:50,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1927/203307 [2:14:09<233:39:51,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1928/203307 [2:14:13<233:39:41,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1928/203307 [2:14:13<233:39:42,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1929/203307 [2:14:18<233:40:54,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1929/203307 [2:14:18<233:40:55,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1930/203307 [2:14:22<233:40:30,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1930/203307 [2:14:22<233:40:31,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1931/203307 [2:14:26<233:40:27,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1931/203307 [2:14:26<233:40:28,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1932/203307 [2:14:31<233:41:13,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1932/203307 [2:14:31<233:41:15,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1933/203307 [2:14:35<233:40:53,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1933/203307 [2:14:35<233:40:53,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1934/203307 [2:14:39<233:40:25,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1934/203307 [2:14:39<233:40:26,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1935/203307 [2:14:43<233:40:18,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1935/203307 [2:14:43<233:40:18,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1936/203307 [2:14:47<233:40:11,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1936/203307 [2:14:47<233:40:12,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1937/203307 [2:14:51<233:39:48,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1937/203307 [2:14:51<233:39:49,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1938/203307 [2:14:56<233:40:48,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1938/203307 [2:14:56<233:40:50,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1939/203307 [2:15:00<233:40:39,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1939/203307 [2:15:00<233:40:40,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1940/203307 [2:15:05<233:41:26,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1940/203307 [2:15:05<233:41:26,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1941/203307 [2:15:09<233:41:11,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 1941/203307 [2:15:09<233:41:12,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1942/203307 [2:15:13<233:40:50,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1942/203307 [2:15:13<233:40:51,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1943/203307 [2:15:17<233:40:39,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1943/203307 [2:15:17<233:40:40,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1944/203307 [2:15:21<233:40:37,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1944/203307 [2:15:21<233:40:37,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1945/203307 [2:15:25<233:40:33,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1945/203307 [2:15:25<233:40:34,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1946/203307 [2:15:29<233:40:08,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1946/203307 [2:15:29<233:40:09,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1947/203307 [2:15:34<233:41:24,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1947/203307 [2:15:34<233:41:24,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1948/203307 [2:15:38<233:41:13,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1948/203307 [2:15:38<233:41:14,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1949/203307 [2:15:43<233:42:01,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1949/203307 [2:15:43<233:42:01,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1950/203307 [2:15:47<233:41:25,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1950/203307 [2:15:47<233:41:26,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1951/203307 [2:15:51<233:41:13,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1951/203307 [2:15:51<233:41:13,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1952/203307 [2:15:55<233:40:57,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1952/203307 [2:15:55<233:40:57,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1953/203307 [2:15:59<233:40:55,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1953/203307 [2:15:59<233:40:56,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1954/203307 [2:16:03<233:40:26,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1954/203307 [2:16:03<233:40:28,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1955/203307 [2:16:08<233:41:33,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1955/203307 [2:16:08<233:41:34,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1956/203307 [2:16:12<233:41:19,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1956/203307 [2:16:12<233:41:20,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1957/203307 [2:16:16<233:41:01,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1957/203307 [2:16:16<233:41:02,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1958/203307 [2:16:21<233:41:41,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1958/203307 [2:16:21<233:41:43,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1959/203307 [2:16:25<233:41:22,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1959/203307 [2:16:25<233:41:23,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1960/203307 [2:16:29<233:41:00,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1960/203307 [2:16:29<233:41:01,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1961/203307 [2:16:33<233:41:00,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|          | 1961/203307 [2:16:33<233:41:01,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1962/203307 [2:16:37<233:40:39,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1962/203307 [2:16:37<233:40:40,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1963/203307 [2:16:41<233:40:25,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1963/203307 [2:16:41<233:40:26,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1964/203307 [2:16:46<233:41:37,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1964/203307 [2:16:46<233:41:37,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1965/203307 [2:16:50<233:41:06,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1965/203307 [2:16:50<233:41:07,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1966/203307 [2:16:54<233:41:33,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1966/203307 [2:16:54<233:41:34,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1967/203307 [2:16:59<233:41:33,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1967/203307 [2:16:59<233:41:33,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1968/203307 [2:17:03<233:41:17,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1968/203307 [2:17:03<233:41:18,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1969/203307 [2:17:07<233:40:56,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1969/203307 [2:17:07<233:40:57,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1970/203307 [2:17:11<233:40:57,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1970/203307 [2:17:11<233:40:58,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1971/203307 [2:17:15<233:40:48,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1971/203307 [2:17:15<233:40:48,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1972/203307 [2:17:19<233:40:23,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1972/203307 [2:17:19<233:40:24,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1973/203307 [2:17:24<233:41:17,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1973/203307 [2:17:24<233:41:18,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1974/203307 [2:17:28<233:40:39,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1974/203307 [2:17:28<233:40:40,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1975/203307 [2:17:32<233:41:38,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1975/203307 [2:17:32<233:41:38,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1976/203307 [2:17:36<233:41:25,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1976/203307 [2:17:36<233:41:25,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1977/203307 [2:17:40<233:41:01,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1977/203307 [2:17:40<233:41:03,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1978/203307 [2:17:45<233:41:03,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1978/203307 [2:17:45<233:41:03,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1979/203307 [2:17:49<233:41:00,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1979/203307 [2:17:49<233:41:00,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1980/203307 [2:17:53<233:40:31,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1980/203307 [2:17:53<233:40:32,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1981/203307 [2:17:58<233:41:26,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 1981/203307 [2:17:58<233:41:27,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1982/203307 [2:18:02<233:40:58,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1982/203307 [2:18:02<233:40:59,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1983/203307 [2:18:06<233:40:42,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1983/203307 [2:18:06<233:40:43,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1984/203307 [2:18:10<233:41:37,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1984/203307 [2:18:10<233:41:38,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1985/203307 [2:18:14<233:41:14,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1985/203307 [2:18:14<233:41:15,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1986/203307 [2:18:19<233:41:13,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1986/203307 [2:18:19<233:41:13,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1987/203307 [2:18:23<233:41:08,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1987/203307 [2:18:23<233:41:08,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1988/203307 [2:18:27<233:40:47,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1988/203307 [2:18:27<233:40:48,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1989/203307 [2:18:31<233:40:29,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1989/203307 [2:18:31<233:40:30,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1990/203307 [2:18:35<233:41:12,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1990/203307 [2:18:35<233:41:13,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1991/203307 [2:18:39<233:40:56,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1991/203307 [2:18:39<233:40:56,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1992/203307 [2:18:44<233:41:48,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1992/203307 [2:18:44<233:41:49,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1993/203307 [2:18:48<233:41:44,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1993/203307 [2:18:48<233:41:45,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1994/203307 [2:18:52<233:41:21,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1994/203307 [2:18:52<233:41:22,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1995/203307 [2:18:57<233:42:08,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1995/203307 [2:18:57<233:42:09,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1996/203307 [2:19:01<233:42:02,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1996/203307 [2:19:01<233:42:03,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1997/203307 [2:19:05<233:41:32,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1997/203307 [2:19:05<233:41:34,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1998/203307 [2:19:09<233:41:09,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1998/203307 [2:19:09<233:41:11,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1999/203307 [2:19:14<233:42:24,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 1999/203307 [2:19:14<233:42:25,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2000/203307 [2:19:18<233:42:09,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2000/203307 [2:19:18<233:42:10,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2001/203307 [2:19:23<233:42:49,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2001/203307 [2:19:23<233:42:49,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2002/203307 [2:19:27<233:42:23,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2002/203307 [2:19:27<233:42:24,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2003/203307 [2:19:31<233:42:55,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2003/203307 [2:19:31<233:42:56,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2004/203307 [2:19:35<233:42:35,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2004/203307 [2:19:35<233:42:36,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2005/203307 [2:19:39<233:42:16,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2005/203307 [2:19:39<233:42:16,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2006/203307 [2:19:43<233:41:53,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2006/203307 [2:19:43<233:41:54,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2007/203307 [2:19:48<233:43:00,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2007/203307 [2:19:48<233:43:00,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2008/203307 [2:19:52<233:42:36,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2008/203307 [2:19:52<233:42:36,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2009/203307 [2:19:56<233:42:11,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2009/203307 [2:19:56<233:42:11,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2010/203307 [2:20:01<233:42:54,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2010/203307 [2:20:01<233:42:55,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2011/203307 [2:20:05<233:43:35,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2011/203307 [2:20:05<233:43:35,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2012/203307 [2:20:10<233:43:18,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2012/203307 [2:20:10<233:43:18,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2013/203307 [2:20:14<233:42:58,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2013/203307 [2:20:14<233:42:59,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2014/203307 [2:20:18<233:42:33,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2014/203307 [2:20:18<233:42:34,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2015/203307 [2:20:22<233:42:29,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2015/203307 [2:20:22<233:42:30,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2016/203307 [2:20:27<233:43:38,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2016/203307 [2:20:27<233:43:38,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2017/203307 [2:20:31<233:43:08,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2017/203307 [2:20:31<233:43:09,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2018/203307 [2:20:35<233:43:54,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2018/203307 [2:20:35<233:43:54,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2019/203307 [2:20:39<233:43:45,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2019/203307 [2:20:39<233:43:46,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2020/203307 [2:20:44<233:43:42,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2020/203307 [2:20:44<233:43:42,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2021/203307 [2:20:48<233:43:34,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2021/203307 [2:20:48<233:43:35,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2022/203307 [2:20:52<233:43:13,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2022/203307 [2:20:52<233:43:14,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2023/203307 [2:20:56<233:42:57,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2023/203307 [2:20:56<233:42:58,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2024/203307 [2:21:00<233:42:36,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2024/203307 [2:21:00<233:42:38,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2025/203307 [2:21:05<233:43:41,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2025/203307 [2:21:05<233:43:42,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2026/203307 [2:21:09<233:43:23,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2026/203307 [2:21:09<233:43:23,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2027/203307 [2:21:13<233:44:15,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2027/203307 [2:21:13<233:44:16,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2028/203307 [2:21:18<233:44:10,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2028/203307 [2:21:18<233:44:11,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2029/203307 [2:21:22<233:43:49,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2029/203307 [2:21:22<233:43:50,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2030/203307 [2:21:26<233:43:21,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2030/203307 [2:21:26<233:43:22,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2031/203307 [2:21:30<233:43:05,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2031/203307 [2:21:30<233:43:06,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2032/203307 [2:21:34<233:42:51,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2032/203307 [2:21:34<233:42:51,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2033/203307 [2:21:38<233:43:41,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2033/203307 [2:21:38<233:43:43,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2034/203307 [2:21:42<233:43:17,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2034/203307 [2:21:42<233:43:19,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2035/203307 [2:21:47<233:43:06,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2035/203307 [2:21:47<233:43:06,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2036/203307 [2:21:51<233:43:51,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2036/203307 [2:21:51<233:43:52,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2037/203307 [2:21:55<233:43:38,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2037/203307 [2:21:55<233:43:39,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2038/203307 [2:21:59<233:43:06,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2038/203307 [2:21:59<233:43:07,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2039/203307 [2:22:03<233:42:55,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2039/203307 [2:22:03<233:42:55,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2040/203307 [2:22:07<233:42:35,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2040/203307 [2:22:07<233:42:36,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2041/203307 [2:22:11<233:42:15,  0.24it/s, v_num=t5e6, training/loss=0.121]Epoch 0:   1%|          | 2041/203307 [2:22:11<233:42:16,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2042/203307 [2:22:16<233:42:58,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2042/203307 [2:22:16<233:42:59,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2043/203307 [2:22:20<233:42:49,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2043/203307 [2:22:20<233:42:49,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2044/203307 [2:22:25<233:43:32,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2044/203307 [2:22:25<233:43:33,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2045/203307 [2:22:29<233:43:29,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2045/203307 [2:22:29<233:43:30,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2046/203307 [2:22:33<233:42:58,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2046/203307 [2:22:33<233:42:59,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2047/203307 [2:22:37<233:42:47,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2047/203307 [2:22:37<233:42:48,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2048/203307 [2:22:41<233:42:41,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2048/203307 [2:22:41<233:42:41,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2049/203307 [2:22:45<233:42:11,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2049/203307 [2:22:45<233:42:12,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2050/203307 [2:22:49<233:41:49,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2050/203307 [2:22:49<233:41:50,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2051/203307 [2:22:54<233:42:59,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2051/203307 [2:22:54<233:43:00,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2052/203307 [2:22:58<233:42:42,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2052/203307 [2:22:58<233:42:43,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2053/203307 [2:23:03<233:43:31,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2053/203307 [2:23:03<233:43:32,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2054/203307 [2:23:07<233:43:06,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2054/203307 [2:23:07<233:43:07,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2055/203307 [2:23:11<233:42:54,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2055/203307 [2:23:11<233:42:55,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2056/203307 [2:23:15<233:42:49,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2056/203307 [2:23:15<233:42:50,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2057/203307 [2:23:19<233:42:29,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2057/203307 [2:23:19<233:42:30,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2058/203307 [2:23:23<233:42:08,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2058/203307 [2:23:23<233:42:08,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2059/203307 [2:23:28<233:43:07,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2059/203307 [2:23:28<233:43:08,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2060/203307 [2:23:32<233:42:43,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2060/203307 [2:23:32<233:42:44,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2061/203307 [2:23:36<233:42:42,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2061/203307 [2:23:36<233:42:43,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2062/203307 [2:23:41<233:43:20,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2062/203307 [2:23:41<233:43:20,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2063/203307 [2:23:45<233:43:08,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2063/203307 [2:23:45<233:43:08,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2064/203307 [2:23:49<233:42:56,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2064/203307 [2:23:49<233:42:57,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2065/203307 [2:23:53<233:42:40,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2065/203307 [2:23:53<233:42:40,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2066/203307 [2:23:57<233:42:18,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2066/203307 [2:23:57<233:42:20,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2067/203307 [2:24:01<233:42:09,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2067/203307 [2:24:01<233:42:10,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2068/203307 [2:24:06<233:43:11,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2068/203307 [2:24:06<233:43:12,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2069/203307 [2:24:10<233:42:45,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2069/203307 [2:24:10<233:42:47,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2070/203307 [2:24:15<233:43:24,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2070/203307 [2:24:15<233:43:25,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2071/203307 [2:24:19<233:43:16,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2071/203307 [2:24:19<233:43:17,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2072/203307 [2:24:23<233:42:56,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2072/203307 [2:24:23<233:42:57,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2073/203307 [2:24:27<233:42:31,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2073/203307 [2:24:27<233:42:32,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2074/203307 [2:24:31<233:42:15,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2074/203307 [2:24:31<233:42:17,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2075/203307 [2:24:35<233:42:10,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2075/203307 [2:24:35<233:42:11,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2076/203307 [2:24:39<233:41:46,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2076/203307 [2:24:39<233:41:47,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2077/203307 [2:24:44<233:42:40,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2077/203307 [2:24:44<233:42:41,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2078/203307 [2:24:48<233:42:35,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2078/203307 [2:24:48<233:42:36,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2079/203307 [2:24:53<233:43:29,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2079/203307 [2:24:53<233:43:30,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2080/203307 [2:24:57<233:43:22,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2080/203307 [2:24:57<233:43:23,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2081/203307 [2:25:01<233:43:02,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2081/203307 [2:25:01<233:43:04,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2082/203307 [2:25:05<233:42:38,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2082/203307 [2:25:05<233:42:39,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2083/203307 [2:25:09<233:42:27,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2083/203307 [2:25:09<233:42:27,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2084/203307 [2:25:13<233:42:09,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2084/203307 [2:25:13<233:42:09,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2085/203307 [2:25:18<233:43:07,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2085/203307 [2:25:18<233:43:07,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2086/203307 [2:25:22<233:42:59,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2086/203307 [2:25:22<233:43:00,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2087/203307 [2:25:26<233:42:34,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2087/203307 [2:25:26<233:42:35,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2088/203307 [2:25:31<233:43:23,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2088/203307 [2:25:31<233:43:24,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2089/203307 [2:25:35<233:43:13,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2089/203307 [2:25:35<233:43:14,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2090/203307 [2:25:39<233:42:50,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2090/203307 [2:25:39<233:42:51,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2091/203307 [2:25:43<233:42:39,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2091/203307 [2:25:43<233:42:40,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2092/203307 [2:25:47<233:42:20,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2092/203307 [2:25:47<233:42:20,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2093/203307 [2:25:51<233:41:59,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2093/203307 [2:25:51<233:42:01,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2094/203307 [2:25:56<233:42:48,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2094/203307 [2:25:56<233:42:49,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2095/203307 [2:26:00<233:43:32,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2095/203307 [2:26:00<233:43:33,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2096/203307 [2:26:05<233:44:12,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2096/203307 [2:26:05<233:44:12,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2097/203307 [2:26:09<233:43:50,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2097/203307 [2:26:09<233:43:51,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2098/203307 [2:26:13<233:43:23,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2098/203307 [2:26:13<233:43:24,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2099/203307 [2:26:17<233:43:10,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2099/203307 [2:26:17<233:43:11,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2100/203307 [2:26:21<233:42:56,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2100/203307 [2:26:21<233:42:56,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2101/203307 [2:26:25<233:42:29,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   1%|          | 2101/203307 [2:26:25<233:42:30,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2102/203307 [2:26:29<233:42:04,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2102/203307 [2:26:29<233:42:05,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2103/203307 [2:26:34<233:43:06,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2103/203307 [2:26:34<233:43:07,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2104/203307 [2:26:38<233:42:52,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2104/203307 [2:26:38<233:42:52,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2105/203307 [2:26:42<233:43:35,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2105/203307 [2:26:43<233:43:36,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2106/203307 [2:26:46<233:43:08,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2106/203307 [2:26:46<233:43:09,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2107/203307 [2:26:50<233:42:50,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2107/203307 [2:26:50<233:42:51,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2108/203307 [2:26:55<233:42:39,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2108/203307 [2:26:55<233:42:39,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2109/203307 [2:26:59<233:42:24,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2109/203307 [2:26:59<233:42:25,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2110/203307 [2:27:03<233:41:54,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2110/203307 [2:27:03<233:41:55,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2111/203307 [2:27:08<233:43:04,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2111/203307 [2:27:08<233:43:05,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2112/203307 [2:27:11<233:42:40,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2112/203307 [2:27:12<233:42:41,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2113/203307 [2:27:15<233:42:17,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2113/203307 [2:27:15<233:42:18,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2114/203307 [2:27:20<233:42:56,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2114/203307 [2:27:20<233:42:57,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2115/203307 [2:27:24<233:42:41,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2115/203307 [2:27:24<233:42:42,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2116/203307 [2:27:28<233:42:24,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2116/203307 [2:27:28<233:42:25,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2117/203307 [2:27:32<233:42:12,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2117/203307 [2:27:32<233:42:12,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2118/203307 [2:27:36<233:41:53,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2118/203307 [2:27:36<233:41:53,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2119/203307 [2:27:40<233:41:44,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2119/203307 [2:27:40<233:41:44,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2120/203307 [2:27:45<233:42:48,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2120/203307 [2:27:45<233:42:50,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2121/203307 [2:27:49<233:42:13,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2121/203307 [2:27:49<233:42:14,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2122/203307 [2:27:54<233:42:58,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2122/203307 [2:27:54<233:42:58,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2123/203307 [2:27:58<233:42:42,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2123/203307 [2:27:58<233:42:43,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2124/203307 [2:28:02<233:42:32,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2124/203307 [2:28:02<233:42:33,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2125/203307 [2:28:06<233:42:18,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2125/203307 [2:28:06<233:42:19,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2126/203307 [2:28:10<233:42:02,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2126/203307 [2:28:10<233:42:03,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2127/203307 [2:28:14<233:41:48,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2127/203307 [2:28:14<233:41:49,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2128/203307 [2:28:19<233:41:55,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2128/203307 [2:28:19<233:41:56,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2129/203307 [2:28:23<233:42:41,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2129/203307 [2:28:23<233:42:41,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2130/203307 [2:28:27<233:42:10,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2130/203307 [2:28:27<233:42:12,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2131/203307 [2:28:32<233:43:04,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2131/203307 [2:28:32<233:43:05,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2132/203307 [2:28:36<233:43:04,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2132/203307 [2:28:36<233:43:05,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2133/203307 [2:28:40<233:42:41,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2133/203307 [2:28:40<233:42:42,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2134/203307 [2:28:44<233:42:17,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2134/203307 [2:28:44<233:42:18,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2135/203307 [2:28:48<233:42:07,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2135/203307 [2:28:48<233:42:08,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2136/203307 [2:28:53<233:42:01,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2136/203307 [2:28:53<233:42:02,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2137/203307 [2:28:57<233:42:49,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2137/203307 [2:28:57<233:42:50,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2138/203307 [2:29:01<233:42:21,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2138/203307 [2:29:01<233:42:22,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2139/203307 [2:29:05<233:42:12,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2139/203307 [2:29:05<233:42:12,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2140/203307 [2:29:10<233:42:58,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2140/203307 [2:29:10<233:42:59,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2141/203307 [2:29:14<233:42:42,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2141/203307 [2:29:14<233:42:43,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2142/203307 [2:29:18<233:42:22,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2142/203307 [2:29:18<233:42:23,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2143/203307 [2:29:22<233:42:16,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2143/203307 [2:29:22<233:42:16,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2144/203307 [2:29:26<233:42:02,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2144/203307 [2:29:26<233:42:03,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2145/203307 [2:29:31<233:42:14,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2145/203307 [2:29:31<233:42:14,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2146/203307 [2:29:35<233:43:03,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2146/203307 [2:29:35<233:43:04,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2147/203307 [2:29:39<233:42:44,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2147/203307 [2:29:39<233:42:44,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2148/203307 [2:29:44<233:43:51,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2148/203307 [2:29:44<233:43:51,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2149/203307 [2:29:48<233:43:38,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2149/203307 [2:29:49<233:43:39,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2150/203307 [2:29:52<233:43:11,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2150/203307 [2:29:52<233:43:12,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2151/203307 [2:29:57<233:43:01,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2151/203307 [2:29:57<233:43:01,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2152/203307 [2:30:01<233:42:53,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2152/203307 [2:30:01<233:42:54,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2153/203307 [2:30:05<233:42:57,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2153/203307 [2:30:05<233:42:57,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2154/203307 [2:30:09<233:42:38,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2154/203307 [2:30:09<233:42:39,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2155/203307 [2:30:14<233:43:40,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2155/203307 [2:30:14<233:43:41,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2156/203307 [2:30:18<233:43:27,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2156/203307 [2:30:18<233:43:27,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2157/203307 [2:30:23<233:44:14,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2157/203307 [2:30:23<233:44:14,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2158/203307 [2:30:27<233:43:52,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2158/203307 [2:30:27<233:43:52,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2159/203307 [2:30:31<233:43:39,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2159/203307 [2:30:31<233:43:40,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2160/203307 [2:30:35<233:43:35,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2160/203307 [2:30:35<233:43:36,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2161/203307 [2:30:39<233:43:51,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2161/203307 [2:30:39<233:43:52,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2162/203307 [2:30:43<233:43:27,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2162/203307 [2:30:43<233:43:28,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2163/203307 [2:30:48<233:44:18,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2163/203307 [2:30:48<233:44:19,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2164/203307 [2:30:52<233:43:59,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2164/203307 [2:30:52<233:44:00,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2165/203307 [2:30:56<233:43:34,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2165/203307 [2:30:56<233:43:34,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2166/203307 [2:31:01<233:44:18,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2166/203307 [2:31:01<233:44:19,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2167/203307 [2:31:05<233:44:09,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2167/203307 [2:31:05<233:44:10,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2168/203307 [2:31:09<233:43:58,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2168/203307 [2:31:09<233:43:58,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2169/203307 [2:31:13<233:43:40,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2169/203307 [2:31:13<233:43:41,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2170/203307 [2:31:17<233:43:31,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2170/203307 [2:31:17<233:43:31,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2171/203307 [2:31:21<233:43:26,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2171/203307 [2:31:21<233:43:27,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2172/203307 [2:31:26<233:44:30,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2172/203307 [2:31:26<233:44:30,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2173/203307 [2:31:30<233:44:13,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2173/203307 [2:31:30<233:44:14,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2174/203307 [2:31:35<233:44:47,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2174/203307 [2:31:35<233:44:48,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2175/203307 [2:31:39<233:44:37,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2175/203307 [2:31:39<233:44:38,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2176/203307 [2:31:43<233:44:33,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2176/203307 [2:31:43<233:44:33,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2177/203307 [2:31:47<233:44:20,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2177/203307 [2:31:47<233:44:21,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2178/203307 [2:31:52<233:44:25,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2178/203307 [2:31:52<233:44:26,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2179/203307 [2:31:56<233:44:11,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2179/203307 [2:31:56<233:44:11,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2180/203307 [2:32:00<233:43:57,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2180/203307 [2:32:00<233:43:58,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2181/203307 [2:32:05<233:44:43,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2181/203307 [2:32:05<233:44:45,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2182/203307 [2:32:08<233:44:16,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2182/203307 [2:32:08<233:44:16,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2183/203307 [2:32:13<233:45:18,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2183/203307 [2:32:13<233:45:19,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2184/203307 [2:32:17<233:45:03,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2184/203307 [2:32:17<233:45:03,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2185/203307 [2:32:21<233:44:35,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2185/203307 [2:32:21<233:44:37,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2186/203307 [2:32:26<233:44:41,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2186/203307 [2:32:26<233:44:43,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2187/203307 [2:32:30<233:44:28,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2187/203307 [2:32:30<233:44:29,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2188/203307 [2:32:34<233:44:03,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2188/203307 [2:32:34<233:44:03,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2189/203307 [2:32:39<233:45:00,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2189/203307 [2:32:39<233:45:01,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2190/203307 [2:32:43<233:44:48,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2190/203307 [2:32:43<233:44:49,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2191/203307 [2:32:47<233:44:39,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2191/203307 [2:32:47<233:44:40,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2192/203307 [2:32:52<233:45:35,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2192/203307 [2:32:52<233:45:36,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2193/203307 [2:32:56<233:45:12,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2193/203307 [2:32:56<233:45:13,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2194/203307 [2:33:00<233:44:47,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2194/203307 [2:33:00<233:44:47,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2195/203307 [2:33:04<233:45:27,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2195/203307 [2:33:04<233:45:27,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2196/203307 [2:33:08<233:45:16,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2196/203307 [2:33:08<233:45:17,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2197/203307 [2:33:12<233:44:53,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2197/203307 [2:33:12<233:44:54,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2198/203307 [2:33:17<233:45:38,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2198/203307 [2:33:17<233:45:38,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2199/203307 [2:33:21<233:45:26,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2199/203307 [2:33:21<233:45:27,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2200/203307 [2:33:26<233:46:20,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2200/203307 [2:33:26<233:46:21,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2201/203307 [2:33:30<233:46:03,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2201/203307 [2:33:30<233:46:04,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2202/203307 [2:33:34<233:45:28,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2202/203307 [2:33:34<233:45:29,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2203/203307 [2:33:39<233:46:11,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2203/203307 [2:33:39<233:46:11,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2204/203307 [2:33:43<233:45:55,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2204/203307 [2:33:43<233:45:55,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2205/203307 [2:33:47<233:45:30,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2205/203307 [2:33:47<233:45:31,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2206/203307 [2:33:50<233:45:03,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2206/203307 [2:33:50<233:45:04,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2207/203307 [2:33:55<233:46:01,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2207/203307 [2:33:55<233:46:01,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2208/203307 [2:34:00<233:45:57,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2208/203307 [2:34:00<233:45:58,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2209/203307 [2:34:04<233:46:16,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2209/203307 [2:34:04<233:46:17,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2210/203307 [2:34:08<233:45:54,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2210/203307 [2:34:08<233:45:56,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2211/203307 [2:34:13<233:46:29,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2211/203307 [2:34:13<233:46:30,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2212/203307 [2:34:17<233:46:13,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2212/203307 [2:34:17<233:46:13,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2213/203307 [2:34:20<233:45:33,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2213/203307 [2:34:20<233:45:34,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2214/203307 [2:34:25<233:45:23,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2214/203307 [2:34:25<233:45:24,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2215/203307 [2:34:29<233:46:20,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2215/203307 [2:34:29<233:46:21,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2216/203307 [2:34:34<233:46:28,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2216/203307 [2:34:34<233:46:29,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2217/203307 [2:34:38<233:46:21,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2217/203307 [2:34:38<233:46:22,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2218/203307 [2:34:42<233:46:53,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2218/203307 [2:34:42<233:46:54,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2219/203307 [2:34:47<233:46:47,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2219/203307 [2:34:47<233:46:48,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2220/203307 [2:34:51<233:46:46,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2220/203307 [2:34:51<233:46:46,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2221/203307 [2:34:55<233:46:29,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2221/203307 [2:34:55<233:46:29,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2222/203307 [2:34:59<233:46:04,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2222/203307 [2:34:59<233:46:05,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2223/203307 [2:35:03<233:46:02,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2223/203307 [2:35:03<233:46:03,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2224/203307 [2:35:08<233:46:38,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2224/203307 [2:35:08<233:46:39,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2225/203307 [2:35:12<233:46:27,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2225/203307 [2:35:12<233:46:28,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2226/203307 [2:35:16<233:47:04,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2226/203307 [2:35:16<233:47:04,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2227/203307 [2:35:21<233:46:59,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2227/203307 [2:35:21<233:46:59,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2228/203307 [2:35:25<233:46:58,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2228/203307 [2:35:25<233:46:59,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2229/203307 [2:35:29<233:46:43,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2229/203307 [2:35:29<233:46:44,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2230/203307 [2:35:33<233:46:15,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2230/203307 [2:35:33<233:46:16,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2231/203307 [2:35:37<233:46:00,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2231/203307 [2:35:37<233:46:01,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2232/203307 [2:35:41<233:45:32,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2232/203307 [2:35:41<233:45:32,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2233/203307 [2:35:46<233:46:22,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2233/203307 [2:35:46<233:46:22,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2234/203307 [2:35:49<233:45:53,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2234/203307 [2:35:49<233:45:54,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2235/203307 [2:35:54<233:46:44,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2235/203307 [2:35:54<233:46:45,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2236/203307 [2:35:59<233:46:42,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2236/203307 [2:35:59<233:46:43,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2237/203307 [2:36:03<233:46:28,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2237/203307 [2:36:03<233:46:28,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2238/203307 [2:36:07<233:46:04,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2238/203307 [2:36:07<233:46:04,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2239/203307 [2:36:11<233:45:55,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2239/203307 [2:36:11<233:45:56,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2240/203307 [2:36:15<233:45:49,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2240/203307 [2:36:15<233:45:50,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2241/203307 [2:36:20<233:46:33,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|          | 2241/203307 [2:36:20<233:46:34,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2242/203307 [2:36:24<233:46:12,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2242/203307 [2:36:24<233:46:13,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2243/203307 [2:36:28<233:46:04,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2243/203307 [2:36:28<233:46:04,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2244/203307 [2:36:32<233:46:54,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2244/203307 [2:36:32<233:46:54,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2245/203307 [2:36:37<233:46:51,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2245/203307 [2:36:37<233:46:51,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2246/203307 [2:36:41<233:46:24,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2246/203307 [2:36:41<233:46:25,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2247/203307 [2:36:45<233:46:16,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2247/203307 [2:36:45<233:46:17,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2248/203307 [2:36:49<233:45:56,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2248/203307 [2:36:49<233:45:56,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2249/203307 [2:36:53<233:45:51,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2249/203307 [2:36:53<233:45:51,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2250/203307 [2:36:58<233:46:29,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2250/203307 [2:36:58<233:46:30,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2251/203307 [2:37:02<233:46:15,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2251/203307 [2:37:02<233:46:16,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2252/203307 [2:37:06<233:46:55,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2252/203307 [2:37:06<233:46:56,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2253/203307 [2:37:11<233:46:56,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2253/203307 [2:37:11<233:46:57,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2254/203307 [2:37:15<233:46:26,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2254/203307 [2:37:15<233:46:27,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2255/203307 [2:37:19<233:46:18,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2255/203307 [2:37:19<233:46:19,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2256/203307 [2:37:23<233:46:07,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2256/203307 [2:37:23<233:46:08,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2257/203307 [2:37:27<233:45:50,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2257/203307 [2:37:27<233:45:51,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2258/203307 [2:37:31<233:45:33,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2258/203307 [2:37:31<233:45:34,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2259/203307 [2:37:36<233:46:30,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2259/203307 [2:37:36<233:46:30,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2260/203307 [2:37:40<233:46:13,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2260/203307 [2:37:40<233:46:14,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2261/203307 [2:37:44<233:46:58,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|          | 2261/203307 [2:37:44<233:46:58,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2262/203307 [2:37:49<233:46:38,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2262/203307 [2:37:49<233:46:38,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2263/203307 [2:37:53<233:46:29,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2263/203307 [2:37:53<233:46:30,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2264/203307 [2:37:57<233:46:15,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2264/203307 [2:37:57<233:46:16,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2265/203307 [2:38:01<233:46:15,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2265/203307 [2:38:01<233:46:15,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2266/203307 [2:38:05<233:45:48,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2266/203307 [2:38:05<233:45:49,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2267/203307 [2:38:10<233:46:38,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2267/203307 [2:38:10<233:46:39,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2268/203307 [2:38:14<233:46:24,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2268/203307 [2:38:14<233:46:25,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2269/203307 [2:38:18<233:46:04,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2269/203307 [2:38:18<233:46:05,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2270/203307 [2:38:22<233:46:44,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2270/203307 [2:38:22<233:46:45,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2271/203307 [2:38:27<233:46:46,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2271/203307 [2:38:27<233:46:47,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2272/203307 [2:38:31<233:46:36,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2272/203307 [2:38:31<233:46:37,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2273/203307 [2:38:35<233:46:16,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2273/203307 [2:38:35<233:46:17,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2274/203307 [2:38:39<233:45:57,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2274/203307 [2:38:39<233:45:57,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2275/203307 [2:38:43<233:45:49,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2275/203307 [2:38:43<233:45:50,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2276/203307 [2:38:48<233:46:41,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2276/203307 [2:38:48<233:46:41,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2277/203307 [2:38:52<233:46:34,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2277/203307 [2:38:52<233:46:35,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2278/203307 [2:38:57<233:47:15,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2278/203307 [2:38:57<233:47:16,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2279/203307 [2:39:01<233:47:13,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2279/203307 [2:39:01<233:47:13,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2280/203307 [2:39:05<233:46:56,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2280/203307 [2:39:05<233:46:57,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2281/203307 [2:39:09<233:46:42,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2281/203307 [2:39:09<233:46:43,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2282/203307 [2:39:13<233:46:19,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2282/203307 [2:39:13<233:46:20,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2283/203307 [2:39:17<233:46:23,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2283/203307 [2:39:17<233:46:24,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2284/203307 [2:39:21<233:45:53,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2284/203307 [2:39:21<233:45:54,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2285/203307 [2:39:26<233:46:43,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2285/203307 [2:39:26<233:46:44,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2286/203307 [2:39:30<233:46:36,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2286/203307 [2:39:30<233:46:36,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2287/203307 [2:39:35<233:47:38,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2287/203307 [2:39:35<233:47:39,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2288/203307 [2:39:39<233:47:14,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2288/203307 [2:39:39<233:47:15,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2289/203307 [2:39:43<233:47:12,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2289/203307 [2:39:43<233:47:13,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2290/203307 [2:39:47<233:46:47,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2290/203307 [2:39:47<233:46:48,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2291/203307 [2:39:51<233:46:41,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2291/203307 [2:39:51<233:46:42,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2292/203307 [2:39:55<233:46:25,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2292/203307 [2:39:55<233:46:26,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2293/203307 [2:40:00<233:47:23,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2293/203307 [2:40:00<233:47:24,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2294/203307 [2:40:04<233:47:02,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2294/203307 [2:40:04<233:47:03,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2295/203307 [2:40:09<233:47:47,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2295/203307 [2:40:09<233:47:47,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2296/203307 [2:40:14<233:48:41,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2296/203307 [2:40:14<233:48:42,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2297/203307 [2:40:18<233:48:12,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2297/203307 [2:40:18<233:48:13,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2298/203307 [2:40:22<233:48:03,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2298/203307 [2:40:22<233:48:03,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2299/203307 [2:40:26<233:48:02,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2299/203307 [2:40:26<233:48:03,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2300/203307 [2:40:30<233:47:35,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2300/203307 [2:40:30<233:47:35,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2301/203307 [2:40:34<233:47:36,  0.24it/s, v_num=t5e6, training/loss=0.114]Epoch 0:   1%|          | 2301/203307 [2:40:34<233:47:36,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2302/203307 [2:40:39<233:48:09,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2302/203307 [2:40:39<233:48:10,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2303/203307 [2:40:43<233:48:40,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2303/203307 [2:40:43<233:48:40,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2304/203307 [2:40:48<233:49:29,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2304/203307 [2:40:48<233:49:29,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2305/203307 [2:40:52<233:49:05,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2305/203307 [2:40:52<233:49:05,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2306/203307 [2:40:56<233:48:39,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2306/203307 [2:40:56<233:48:40,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2307/203307 [2:41:00<233:48:45,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2307/203307 [2:41:01<233:48:46,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2308/203307 [2:41:04<233:48:22,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2308/203307 [2:41:04<233:48:23,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2309/203307 [2:41:09<233:48:17,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2309/203307 [2:41:09<233:48:18,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2310/203307 [2:41:13<233:47:47,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2310/203307 [2:41:13<233:47:47,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2311/203307 [2:41:17<233:48:48,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2311/203307 [2:41:17<233:48:49,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2312/203307 [2:41:21<233:48:28,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2312/203307 [2:41:21<233:48:29,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2313/203307 [2:41:26<233:49:15,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2313/203307 [2:41:26<233:49:16,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2314/203307 [2:41:30<233:48:58,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2314/203307 [2:41:30<233:48:58,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2315/203307 [2:41:34<233:48:50,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2315/203307 [2:41:34<233:48:51,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2316/203307 [2:41:39<233:48:36,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2316/203307 [2:41:39<233:48:37,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2317/203307 [2:41:43<233:48:37,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2317/203307 [2:41:43<233:48:37,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2318/203307 [2:41:47<233:48:26,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2318/203307 [2:41:47<233:48:26,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2319/203307 [2:41:52<233:49:25,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2319/203307 [2:41:52<233:49:26,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2320/203307 [2:41:56<233:49:29,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2320/203307 [2:41:56<233:49:30,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2321/203307 [2:42:00<233:49:22,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2321/203307 [2:42:00<233:49:23,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2322/203307 [2:42:05<233:50:02,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2322/203307 [2:42:05<233:50:02,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2323/203307 [2:42:09<233:49:55,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2323/203307 [2:42:09<233:49:56,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2324/203307 [2:42:13<233:49:32,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2324/203307 [2:42:13<233:49:33,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2325/203307 [2:42:17<233:49:30,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2325/203307 [2:42:17<233:49:31,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2326/203307 [2:42:21<233:49:12,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2326/203307 [2:42:21<233:49:13,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2327/203307 [2:42:25<233:48:59,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2327/203307 [2:42:25<233:49:00,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2328/203307 [2:42:30<233:49:45,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2328/203307 [2:42:30<233:49:46,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2329/203307 [2:42:34<233:49:42,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2329/203307 [2:42:34<233:49:43,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2330/203307 [2:42:39<233:50:21,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2330/203307 [2:42:39<233:50:21,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2331/203307 [2:42:43<233:50:11,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2331/203307 [2:42:43<233:50:12,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2332/203307 [2:42:47<233:49:51,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2332/203307 [2:42:47<233:49:51,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2333/203307 [2:42:51<233:49:29,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2333/203307 [2:42:51<233:49:29,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2334/203307 [2:42:55<233:49:08,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2334/203307 [2:42:55<233:49:09,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2335/203307 [2:42:59<233:48:59,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2335/203307 [2:42:59<233:48:59,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2336/203307 [2:43:03<233:48:57,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2336/203307 [2:43:03<233:48:57,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2337/203307 [2:43:08<233:49:30,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2337/203307 [2:43:08<233:49:31,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2338/203307 [2:43:12<233:49:10,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2338/203307 [2:43:12<233:49:11,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2339/203307 [2:43:17<233:49:55,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2339/203307 [2:43:17<233:49:56,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2340/203307 [2:43:21<233:49:38,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2340/203307 [2:43:21<233:49:38,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2341/203307 [2:43:25<233:49:24,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2341/203307 [2:43:25<233:49:25,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2342/203307 [2:43:29<233:49:08,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2342/203307 [2:43:29<233:49:09,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2343/203307 [2:43:33<233:49:04,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2343/203307 [2:43:33<233:49:05,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2344/203307 [2:43:37<233:48:46,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2344/203307 [2:43:37<233:48:48,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2345/203307 [2:43:42<233:49:28,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2345/203307 [2:43:42<233:49:29,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2346/203307 [2:43:46<233:49:03,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2346/203307 [2:43:46<233:49:04,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2347/203307 [2:43:50<233:48:58,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2347/203307 [2:43:50<233:48:58,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2348/203307 [2:43:55<233:49:39,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2348/203307 [2:43:55<233:49:40,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2349/203307 [2:43:59<233:49:26,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2349/203307 [2:43:59<233:49:27,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2350/203307 [2:44:03<233:49:17,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2350/203307 [2:44:03<233:49:18,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2351/203307 [2:44:07<233:48:51,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2351/203307 [2:44:07<233:48:51,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2352/203307 [2:44:11<233:48:22,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2352/203307 [2:44:11<233:48:23,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2353/203307 [2:44:15<233:48:20,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2353/203307 [2:44:15<233:48:20,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2354/203307 [2:44:20<233:48:56,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2354/203307 [2:44:20<233:48:57,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2355/203307 [2:44:24<233:48:27,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2355/203307 [2:44:24<233:48:27,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2356/203307 [2:44:28<233:48:57,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2356/203307 [2:44:28<233:48:57,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2357/203307 [2:44:32<233:48:39,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2357/203307 [2:44:32<233:48:39,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2358/203307 [2:44:36<233:48:11,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2358/203307 [2:44:36<233:48:12,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2359/203307 [2:44:40<233:48:04,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2359/203307 [2:44:40<233:48:05,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2360/203307 [2:44:44<233:47:46,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2360/203307 [2:44:44<233:47:47,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2361/203307 [2:44:49<233:47:38,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2361/203307 [2:44:49<233:47:39,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2362/203307 [2:44:53<233:47:19,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2362/203307 [2:44:53<233:47:20,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2363/203307 [2:44:57<233:48:12,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2363/203307 [2:44:57<233:48:12,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2364/203307 [2:45:01<233:47:46,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2364/203307 [2:45:01<233:47:47,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2365/203307 [2:45:06<233:48:30,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2365/203307 [2:45:06<233:48:31,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2366/203307 [2:45:10<233:48:08,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2366/203307 [2:45:10<233:48:09,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2367/203307 [2:45:14<233:48:00,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2367/203307 [2:45:14<233:48:01,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2368/203307 [2:45:18<233:47:42,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2368/203307 [2:45:18<233:47:43,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2369/203307 [2:45:22<233:47:33,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2369/203307 [2:45:22<233:47:33,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2370/203307 [2:45:27<233:47:39,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2370/203307 [2:45:27<233:47:40,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2371/203307 [2:45:32<233:48:33,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2371/203307 [2:45:32<233:48:34,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2372/203307 [2:45:36<233:48:11,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2372/203307 [2:45:36<233:48:12,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2373/203307 [2:45:40<233:47:57,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2373/203307 [2:45:40<233:47:58,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2374/203307 [2:45:44<233:48:35,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2374/203307 [2:45:44<233:48:36,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2375/203307 [2:45:48<233:48:31,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2375/203307 [2:45:48<233:48:32,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2376/203307 [2:45:52<233:48:11,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2376/203307 [2:45:52<233:48:11,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2377/203307 [2:45:56<233:47:53,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2377/203307 [2:45:57<233:47:54,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2378/203307 [2:46:01<233:48:07,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2378/203307 [2:46:01<233:48:08,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2379/203307 [2:46:05<233:48:00,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2379/203307 [2:46:05<233:48:01,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2380/203307 [2:46:10<233:48:38,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2380/203307 [2:46:10<233:48:39,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2381/203307 [2:46:14<233:48:12,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|          | 2381/203307 [2:46:14<233:48:12,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2382/203307 [2:46:18<233:48:48,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2382/203307 [2:46:18<233:48:49,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2383/203307 [2:46:22<233:48:36,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2383/203307 [2:46:22<233:48:37,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2384/203307 [2:46:26<233:48:16,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2384/203307 [2:46:26<233:48:16,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2385/203307 [2:46:30<233:48:00,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2385/203307 [2:46:30<233:48:00,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2386/203307 [2:46:35<233:48:12,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2386/203307 [2:46:35<233:48:12,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2387/203307 [2:46:39<233:47:55,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2387/203307 [2:46:39<233:47:56,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2388/203307 [2:46:43<233:47:35,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2388/203307 [2:46:43<233:47:36,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2389/203307 [2:46:48<233:48:21,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2389/203307 [2:46:48<233:48:22,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2390/203307 [2:46:52<233:48:00,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2390/203307 [2:46:52<233:48:01,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2391/203307 [2:46:56<233:48:44,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2391/203307 [2:46:56<233:48:45,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2392/203307 [2:47:01<233:48:30,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2392/203307 [2:47:01<233:48:30,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2393/203307 [2:47:05<233:48:17,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2393/203307 [2:47:05<233:48:17,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2394/203307 [2:47:09<233:47:55,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2394/203307 [2:47:09<233:47:56,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2395/203307 [2:47:13<233:48:33,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2395/203307 [2:47:13<233:48:33,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2396/203307 [2:47:17<233:48:07,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2396/203307 [2:47:17<233:48:08,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2397/203307 [2:47:22<233:48:57,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2397/203307 [2:47:22<233:48:58,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2398/203307 [2:47:26<233:48:42,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2398/203307 [2:47:26<233:48:42,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2399/203307 [2:47:30<233:48:32,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2399/203307 [2:47:30<233:48:32,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2400/203307 [2:47:35<233:48:58,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2400/203307 [2:47:35<233:48:58,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2401/203307 [2:47:39<233:48:46,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|          | 2401/203307 [2:47:39<233:48:46,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2402/203307 [2:47:43<233:48:20,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2402/203307 [2:47:43<233:48:21,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2403/203307 [2:47:47<233:48:54,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2403/203307 [2:47:47<233:48:55,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2404/203307 [2:47:51<233:48:32,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2404/203307 [2:47:51<233:48:32,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2405/203307 [2:47:55<233:48:13,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2405/203307 [2:47:55<233:48:13,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2406/203307 [2:48:00<233:48:43,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2406/203307 [2:48:00<233:48:44,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2407/203307 [2:48:04<233:48:34,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2407/203307 [2:48:04<233:48:35,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2408/203307 [2:48:09<233:49:10,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2408/203307 [2:48:09<233:49:10,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2409/203307 [2:48:13<233:48:51,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2409/203307 [2:48:13<233:48:52,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2410/203307 [2:48:17<233:48:29,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2410/203307 [2:48:17<233:48:29,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2411/203307 [2:48:22<233:49:08,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2411/203307 [2:48:22<233:49:09,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2412/203307 [2:48:26<233:48:54,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2412/203307 [2:48:26<233:48:54,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2413/203307 [2:48:30<233:48:33,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2413/203307 [2:48:30<233:48:34,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2414/203307 [2:48:34<233:48:10,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2414/203307 [2:48:34<233:48:10,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2415/203307 [2:48:38<233:49:04,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2415/203307 [2:48:38<233:49:05,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2416/203307 [2:48:42<233:48:44,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2416/203307 [2:48:42<233:48:44,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2417/203307 [2:48:47<233:49:18,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2417/203307 [2:48:47<233:49:18,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2418/203307 [2:48:51<233:48:53,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2418/203307 [2:48:51<233:48:53,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2419/203307 [2:48:55<233:48:43,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2419/203307 [2:48:55<233:48:43,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2420/203307 [2:48:59<233:48:46,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2420/203307 [2:48:59<233:48:47,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2421/203307 [2:49:04<233:48:36,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   1%|          | 2421/203307 [2:49:04<233:48:36,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2422/203307 [2:49:07<233:48:09,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2422/203307 [2:49:07<233:48:10,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2423/203307 [2:49:12<233:48:59,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2423/203307 [2:49:12<233:49:00,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2424/203307 [2:49:16<233:48:42,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2424/203307 [2:49:16<233:48:43,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2425/203307 [2:49:20<233:48:23,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2425/203307 [2:49:20<233:48:24,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2426/203307 [2:49:25<233:49:02,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2426/203307 [2:49:25<233:49:02,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2427/203307 [2:49:29<233:48:56,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2427/203307 [2:49:29<233:48:57,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2428/203307 [2:49:34<233:49:02,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2428/203307 [2:49:34<233:49:03,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2429/203307 [2:49:38<233:48:45,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2429/203307 [2:49:38<233:48:46,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2430/203307 [2:49:41<233:48:19,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2430/203307 [2:49:42<233:48:20,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2431/203307 [2:49:46<233:48:16,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2431/203307 [2:49:46<233:48:16,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2432/203307 [2:49:50<233:48:57,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2432/203307 [2:49:50<233:48:58,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2433/203307 [2:49:54<233:48:38,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2433/203307 [2:49:54<233:48:38,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2434/203307 [2:49:59<233:49:08,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2434/203307 [2:49:59<233:49:09,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2435/203307 [2:50:03<233:49:04,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2435/203307 [2:50:03<233:49:05,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2436/203307 [2:50:07<233:49:03,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2436/203307 [2:50:07<233:49:04,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2437/203307 [2:50:12<233:49:00,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2437/203307 [2:50:12<233:49:01,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2438/203307 [2:50:16<233:48:38,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2438/203307 [2:50:16<233:48:39,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2439/203307 [2:50:20<233:48:26,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2439/203307 [2:50:20<233:48:27,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2440/203307 [2:50:24<233:48:05,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2440/203307 [2:50:24<233:48:05,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2441/203307 [2:50:29<233:49:01,  0.24it/s, v_num=t5e6, training/loss=0.0993]Epoch 0:   1%|          | 2441/203307 [2:50:29<233:49:02,  0.24it/s, v_num=t5e6, training/loss=0.111] Epoch 0:   1%|          | 2442/203307 [2:50:33<233:48:50,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2442/203307 [2:50:33<233:48:50,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2443/203307 [2:50:38<233:49:39,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2443/203307 [2:50:38<233:49:39,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2444/203307 [2:50:42<233:49:22,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2444/203307 [2:50:42<233:49:23,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2445/203307 [2:50:46<233:49:15,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2445/203307 [2:50:46<233:49:16,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2446/203307 [2:50:50<233:49:02,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2446/203307 [2:50:50<233:49:03,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2447/203307 [2:50:54<233:49:05,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2447/203307 [2:50:54<233:49:06,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2448/203307 [2:50:58<233:48:51,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2448/203307 [2:50:58<233:48:51,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2449/203307 [2:51:03<233:49:30,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2449/203307 [2:51:03<233:49:31,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2450/203307 [2:51:07<233:49:06,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2450/203307 [2:51:07<233:49:07,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2451/203307 [2:51:11<233:49:03,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2451/203307 [2:51:11<233:49:04,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2452/203307 [2:51:16<233:49:37,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2452/203307 [2:51:16<233:49:37,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2453/203307 [2:51:20<233:49:24,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2453/203307 [2:51:20<233:49:25,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2454/203307 [2:51:24<233:48:58,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2454/203307 [2:51:24<233:48:59,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2455/203307 [2:51:28<233:48:44,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2455/203307 [2:51:28<233:48:44,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2456/203307 [2:51:32<233:48:24,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2456/203307 [2:51:32<233:48:24,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2457/203307 [2:51:36<233:48:17,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2457/203307 [2:51:36<233:48:18,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2458/203307 [2:51:41<233:48:54,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2458/203307 [2:51:41<233:48:55,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2459/203307 [2:51:45<233:48:45,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2459/203307 [2:51:45<233:48:46,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2460/203307 [2:51:49<233:49:20,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2460/203307 [2:51:49<233:49:20,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2461/203307 [2:51:54<233:49:10,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   1%|          | 2461/203307 [2:51:54<233:49:11,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2462/203307 [2:51:58<233:48:47,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2462/203307 [2:51:58<233:48:47,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2463/203307 [2:52:02<233:48:37,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2463/203307 [2:52:02<233:48:38,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2464/203307 [2:52:06<233:48:20,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2464/203307 [2:52:06<233:48:21,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2465/203307 [2:52:10<233:48:10,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2465/203307 [2:52:10<233:48:11,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2466/203307 [2:52:14<233:47:50,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2466/203307 [2:52:14<233:47:51,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2467/203307 [2:52:19<233:48:31,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2467/203307 [2:52:19<233:48:32,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2468/203307 [2:52:23<233:48:13,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2468/203307 [2:52:23<233:48:13,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2469/203307 [2:52:27<233:48:48,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2469/203307 [2:52:27<233:48:49,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2470/203307 [2:52:31<233:48:45,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2470/203307 [2:52:31<233:48:46,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2471/203307 [2:52:36<233:48:32,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2471/203307 [2:52:36<233:48:32,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2472/203307 [2:52:40<233:48:09,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2472/203307 [2:52:40<233:48:09,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2473/203307 [2:52:43<233:47:45,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2473/203307 [2:52:43<233:47:46,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2474/203307 [2:52:48<233:47:28,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2474/203307 [2:52:48<233:47:28,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2475/203307 [2:52:52<233:48:16,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2475/203307 [2:52:52<233:48:17,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2476/203307 [2:52:56<233:47:55,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2476/203307 [2:52:56<233:47:56,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2477/203307 [2:53:00<233:47:31,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2477/203307 [2:53:00<233:47:31,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2478/203307 [2:53:05<233:48:08,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2478/203307 [2:53:05<233:48:10,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2479/203307 [2:53:09<233:48:01,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2479/203307 [2:53:09<233:48:01,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2480/203307 [2:53:13<233:47:50,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2480/203307 [2:53:13<233:47:51,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2481/203307 [2:53:17<233:47:25,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|          | 2481/203307 [2:53:17<233:47:26,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2482/203307 [2:53:21<233:47:02,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2482/203307 [2:53:21<233:47:02,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2483/203307 [2:53:25<233:46:46,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2483/203307 [2:53:25<233:46:46,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2484/203307 [2:53:30<233:47:19,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2484/203307 [2:53:30<233:47:20,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2485/203307 [2:53:34<233:46:51,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2485/203307 [2:53:34<233:46:52,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2486/203307 [2:53:38<233:47:18,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2486/203307 [2:53:38<233:47:19,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2487/203307 [2:53:42<233:47:05,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2487/203307 [2:53:42<233:47:06,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2488/203307 [2:53:46<233:46:39,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2488/203307 [2:53:46<233:46:40,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2489/203307 [2:53:50<233:46:22,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2489/203307 [2:53:50<233:46:22,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2490/203307 [2:53:54<233:45:58,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2490/203307 [2:53:54<233:46:00,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2491/203307 [2:53:58<233:45:42,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2491/203307 [2:53:58<233:45:43,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2492/203307 [2:54:02<233:45:18,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2492/203307 [2:54:02<233:45:19,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2493/203307 [2:54:07<233:45:59,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2493/203307 [2:54:07<233:46:00,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2494/203307 [2:54:11<233:45:32,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2494/203307 [2:54:11<233:45:33,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2495/203307 [2:54:16<233:46:22,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2495/203307 [2:54:16<233:46:23,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2496/203307 [2:54:20<233:46:02,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2496/203307 [2:54:20<233:46:03,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2497/203307 [2:54:24<233:45:44,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2497/203307 [2:54:24<233:45:45,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2498/203307 [2:54:28<233:45:25,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2498/203307 [2:54:28<233:45:25,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2499/203307 [2:54:32<233:45:14,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2499/203307 [2:54:32<233:45:15,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2500/203307 [2:54:36<233:44:54,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2500/203307 [2:54:36<233:44:55,  0.24it/s, v_num=t5e6, training/loss=0.108]
Validation: |          | 0/? [00:00<?, ?it/s][A
Validation:   0%|          | 0/1 [00:00<?, ?it/s][A


Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s][A[A

Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:34,  1.05it/s][A[A

Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:26,  1.13it/s][A[A

Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:25,  1.14it/s][A[A

Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:24,  1.13it/s][A[A

Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:23,  1.14it/s][A[A

Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:21,  1.15it/s][A[A

Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:20,  1.15it/s][A[A

Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:19,  1.15it/s][A[A

Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:18,  1.15it/s][A[A

Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:18,  1.15it/s][A[A

Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:17,  1.15it/s][A[A

Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:16,  1.15it/s][A[A

Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:29,  1.10it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:26,  1.13it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:25,  1.13it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:24,  1.14it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:22,  1.15it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:22,  1.15it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:21,  1.15it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:20,  1.15it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:19,  1.15it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:18,  1.15it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:17,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:30,  1.09it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:27,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:25,  1.14it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:24,  1.14it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:23,  1.14it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:22,  1.14it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:21,  1.14it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:21,  1.13it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:20,  1.13it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:19,  1.13it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:18,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:30,  1.09it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:27,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:25,  1.13it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:24,  1.14it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:23,  1.14it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:22,  1.14it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:21,  1.13it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:21,  1.13it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:20,  1.13it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:19,  1.13it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:19,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:34,  1.04it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:29,  1.09it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:26,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:25,  1.12it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:24,  1.12it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:23,  1.12it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:23,  1.12it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:22,  1.12it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:21,  1.12it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:20,  1.12it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:19,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:34,  1.04it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:30,  1.09it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:27,  1.11it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:26,  1.11it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:25,  1.12it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:24,  1.11it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:23,  1.11it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:22,  1.11it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:21,  1.11it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:09<01:20,  1.12it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:19,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:34,  1.05it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:30,  1.08it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:28,  1.09it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:27,  1.09it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:26,  1.09it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:26,  1.09it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:25,  1.09it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:24,  1.09it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:22,  1.10it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:09<01:21,  1.11it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:10<01:20,  1.1Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:15,  1.15it/s][A[A

Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:37,  1.01it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:33,  1.05it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:32,  1.05it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:30,  1.06it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:29,  1.06it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:28,  1.07it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:27,  1.06it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:26,  1.07it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:25,  1.07it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:09<01:24,  1.07it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:10<01:23,  1.0Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:14,  1.15it/s][A[A

Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:13,  1.15it/s][A[A

Sampling (mamba memory):  58%|█████▊    | 116/200 [00:13<01:13,  1.14it/s][A[A

Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:13,  1.14it/s][A[A

Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:12,  1.12it/s][A[A

Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:12,  1.12it/s][A[A

Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:11,  1.12it/s][A[A

Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:10,  1.12it/s][A[A

Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:09,  1.12it/s][A[A

Sampling (mamba memory):  62%|██████▏   | 123/200 [00:20<01:08,  1.12it/s][A[A

Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:08,  1.11it/s][A[A

5it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:16,  1.15it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:15,  1.15it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:14,  1.15it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:13,  1.15it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:13<01:13,  1.15it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:12,  1.15it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:11,  1.14it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:11,  1.14it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:10,  1.14it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:09,  1.14it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:08,  1.13it/s]Sampling (mamba memory):  62%|██████▏   | 123/3it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:17,  1.13it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:17,  1.13it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:16,  1.13it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:15,  1.13it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:14,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:13,  1.12it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:13,  1.12it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:12,  1.12it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:11,  1.11it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:11,  1.11it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:10,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 123/3it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:18,  1.12it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:17,  1.12it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:16,  1.12it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:15,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:15,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:14,  1.11it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:13,  1.11it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:13,  1.11it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:12,  1.11it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:11,  1.11it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:10,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 123/2it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:18,  1.12it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:17,  1.12it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:16,  1.12it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:15,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:14,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:14,  1.11it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:13,  1.11it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:13,  1.10it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:12,  1.11it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:11,  1.11it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:10,  1.10it/s]Sampling (mamba memory):  62%|██████▏   | 123/2it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:18,  1.12it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:17,  1.12it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:17,  1.11it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:16,  1.11it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:15,  1.11it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:15,  1.11it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:14,  1.11it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:13,  1.11it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:12,  1.11it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:11,  1.11it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:10,  1.10it/s]Sampling (mamba memory):  62%|██████▏   | 123/Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:07,  1.11it/s][A[A

1it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:19,  1.11it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:18,  1.11it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:17,  1.11it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:16,  1.11it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:16,  1.10it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:15,  1.09it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:14,  1.10it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:13,  1.10it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:13,  1.09it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:19<01:12,  1.09it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:20<01:11,  1.08it/s]Sampling (mamba memory):  62%|██████▏   | 123/7it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:11<01:22,  1.07it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:12<01:21,  1.07it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:13<01:21,  1.06it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:14<01:20,  1.06it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:15<01:19,  1.06it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:16<01:18,  1.06it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:17,  1.06it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:16,  1.06it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:15,  1.06it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:19<01:14,  1.06it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:20<01:13,  1.06it/s]Sampling (mamba memory):  62%|██████▏   | 123/Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:07,  1.10it/s][A[A

Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:06,  1.11it/s][A[A

Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:05,  1.11it/s][A[A

Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:04,  1.10it/s][A[A

Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:03,  1.10it/s][A[A

Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:02,  1.10it/s][A[A

Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:02,  1.09it/s][A[A

Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:01,  1.09it/s][A[A

Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:00,  1.09it/s][A[A

Sampling (mamba memory):  68%|██████▊   | 135/200 [00:31<00:59,  1.09it/s][A[A

Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:58,  1.09it/s][A[A

200 [00:20<01:08,  1.13it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:07,  1.12it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:21<01:07,  1.12it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:22<01:06,  1.12it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:05,  1.11it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:04,  1.11it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:03,  1.11it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:02,  1.11it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:02,  1.11it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:01,  1.11it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:00,  1.10it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<00:59,  1.10it/s]Sampling (mamba 200 [00:20<01:09,  1.10it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:09,  1.10it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:08,  1.09it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:07,  1.09it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:07,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:06,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:05,  1.09it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:04,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:03,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:02,  1.08it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:02,  1.08it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:01,  1.08it/s]Sampling (mamba 200 [00:20<01:09,  1.10it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:09,  1.10it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:08,  1.10it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:07,  1.10it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:06,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:05,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:05,  1.09it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:04,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:03,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:02,  1.09it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:01,  1.08it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:00,  1.08it/s]Sampling (mamba 200 [00:20<01:09,  1.10it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:08,  1.11it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:07,  1.11it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:06,  1.11it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:06,  1.11it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:05,  1.10it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:04,  1.09it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:04,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:03,  1.08it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:02,  1.08it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:01,  1.08it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:01,  1.08it/s]Sampling (mamba 200 [00:20<01:10,  1.10it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:09,  1.09it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:08,  1.09it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:07,  1.09it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:07,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:06,  1.08it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:05,  1.08it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:04,  1.08it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:04,  1.08it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:03,  1.07it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:02,  1.08it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:01,  1.08it/s]Sampling (mamba Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:57,  1.09it/s][A[A

200 [00:21<01:11,  1.08it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:10,  1.08it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:09,  1.08it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:08,  1.08it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:07,  1.08it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:06,  1.08it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:05,  1.08it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:04,  1.08it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:04,  1.07it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:03,  1.07it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:02,  1.07it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<01:01,  1.07it/s]Sampling (mamba Sampling (mamba memory):  69%|██████▉   | 138/200 [00:33<00:56,  1.09it/s][A[A

200 [00:21<01:12,  1.06it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:22<01:11,  1.06it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:23<01:11,  1.06it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:24<01:10,  1.06it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:25<01:09,  1.05it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:26<01:08,  1.05it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:27<01:07,  1.05it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:28<01:06,  1.05it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:29<01:06,  1.05it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:30<01:05,  1.04it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:31<01:04,  1.04it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:32<01:03,  1.04it/s]Sampling (mamba Sampling (mamba memory):  70%|██████▉   | 139/200 [00:34<00:56,  1.09it/s][A[A

Sampling (mamba memory):  70%|███████   | 140/200 [00:35<00:55,  1.09it/s][A[A

Sampling (mamba memory):  70%|███████   | 141/200 [00:36<00:54,  1.09it/s][A[A

Sampling (mamba memory):  71%|███████   | 142/200 [00:37<00:53,  1.08it/s][A[A

Sampling (mamba memory):  72%|███████▏  | 143/200 [00:38<00:52,  1.08it/s][A[A

Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:51,  1.08it/s][A[A

Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:51,  1.08it/s][A[A

Sampling (mamba memory):  73%|███████▎  | 146/200 [00:41<00:50,  1.08it/s][A[A

memory):  68%|██████▊   | 135/200 [00:30<00:59,  1.10it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:31<00:57,  1.10it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:32<00:57,  1.10it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:33<00:56,  1.10it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:34<00:55,  1.10it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:35<00:54,  1.10it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:36<00:53,  1.09it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:37<00:53,  1.09it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:38<00:52,  1.09it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:51,  1.08it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:50,  1.08it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:49,  1.08it/s][A[A

memory):  68%|██████▊   | 135/200 [00:31<00:59,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:58,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:58,  1.08it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:57,  1.08it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:56,  1.08it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:55,  1.08it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:55,  1.07it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:54,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:53,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:52,  1.07it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:51,  1.07it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:31<01:00,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:59,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:58,  1.08it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:57,  1.08it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:56,  1.08it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:56,  1.07it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:55,  1.07it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:54,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:53,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:52,  1.07it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:51,  1.06it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:48,  1.07it/s][A[A

memory):  68%|██████▊   | 135/200 [00:31<01:00,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:59,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:58,  1.07it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:57,  1.07it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:57,  1.07it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:56,  1.06it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:55,  1.06it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:54,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:53,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:53,  1.06it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:52,  1.06it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:31<01:00,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:59,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:58,  1.07it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:58,  1.07it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:57,  1.06it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:56,  1.06it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:55,  1.06it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:55,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:54,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:53,  1.05it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:52,  1.05it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:32<01:00,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:33<00:59,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:34<00:58,  1.07it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:58,  1.07it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:57,  1.07it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:56,  1.06it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:55,  1.06it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:54,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:53,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:53,  1.06it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:52,  1.05it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:47,  1.07it/s][A[A

memory):  68%|██████▊   | 135/200 [00:33<01:02,  1.04it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:34<01:01,  1.04it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:35<01:00,  1.04it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:36<00:59,  1.04it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:37<00:59,  1.03it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:37<00:58,  1.03it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:38<00:57,  1.03it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:39<00:56,  1.03it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:40<00:55,  1.03it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:41<00:54,  1.03it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:42<00:53,  1.02it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:46,  1.07it/s][A[A

Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:46,  1.06it/s][A[A

Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:45,  1.07it/s][A[A

Sampling (mamba memory):  76%|███████▋  | 153/200 [00:47<00:44,  1.07it/s][A[A

Sampling (mamba memory):  77%|███████▋  | 154/200 [00:48<00:43,  1.07it/s][A[A

Sampling (mamba memory):  78%|███████▊  | 155/200 [00:49<00:42,  1.07it/s][A[A

Sampling (mamba memory):  78%|███████▊  | 156/200 [00:50<00:41,  1.07it/s][A[A

Sampling (mamba memory):  78%|███████▊  | 157/200 [00:51<00:40,  1.07it/s][A[A

Sampling (mamba memory):  79%|███████▉  | 158/200 [00:52<00:39,  1.07it/s][A[A

 | 146/200 [00:41<00:50,  1.07it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:49,  1.07it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:48,  1.07it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:43<00:47,  1.06it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:44<00:47,  1.06it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:45<00:46,  1.06it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:46<00:45,  1.06it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:47<00:44,  1.05it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:48<00:43,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:49<00:43,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:50<00:42,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:51<00:41 | 146/200 [00:41<00:50,  1.07it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:49,  1.07it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:48,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:48,  1.06it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:47,  1.06it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:46,  1.06it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:45,  1.05it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:44,  1.05it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:43,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:43,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:42,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:41Sampling (mamba memory):  80%|███████▉  | 159/200 [00:53<00:38,  1.07it/s][A[A

 | 146/200 [00:41<00:50,  1.06it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:49,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:49,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:48,  1.05it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:47,  1.06it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:46,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:45,  1.05it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:44,  1.05it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:44,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:43,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:42,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:41 | 146/200 [00:42<00:51,  1.06it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:50,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:49,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:48,  1.05it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:47,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:46,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:45,  1.04it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:45,  1.04it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:44,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:43,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:42,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:41 | 146/200 [00:42<00:51,  1.05it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:50,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:49,  1.04it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:48,  1.04it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:47,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:47,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:48<00:46,  1.04it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:45,  1.04it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:44,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:43,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:42,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:41 | 146/200 [00:42<00:51,  1.05it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:50,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:49,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:48,  1.05it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:47,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:47,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:48<00:46,  1.04it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:49<00:45,  1.03it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:50<00:44,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:51<00:43,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:52<00:42,  1.02it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:53<00:42Sampling (mamba memory):  80%|████████  | 160/200 [00:54<00:37,  1.06it/s][A[A

Sampling (mamba memory):  80%|████████  | 161/200 [00:55<00:36,  1.06it/s][A[A

 | 146/200 [00:43<00:52,  1.02it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:44<00:51,  1.02it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:45<00:50,  1.02it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:46<00:50,  1.02it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:47<00:49,  1.01it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:48<00:48,  1.01it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:49<00:47,  1.01it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:50<00:46,  1.01it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:51<00:45,  1.01it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:52<00:44,  1.01it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:53<00:43,  1.00it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:54<00:43Sampling (mamba memory):  81%|████████  | 162/200 [00:56<00:35,  1.06it/s][A[A

Sampling (mamba memory):  82%|████████▏ | 163/200 [00:57<00:34,  1.06it/s][A[A

Sampling (mamba memory):  82%|████████▏ | 164/200 [00:58<00:34,  1.05it/s][A[A

Sampling (mamba memory):  82%|████████▎ | 165/200 [00:59<00:33,  1.05it/s][A[A

Sampling (mamba memory):  83%|████████▎ | 166/200 [01:00<00:32,  1.05it/s][A[A

Sampling (mamba memory):  84%|████████▎ | 167/200 [01:01<00:31,  1.04it/s][A[A

Sampling (mamba memory):  84%|████████▍ | 168/200 [01:02<00:30,  1.04it/s][A[A

Sampling (mamba memory):  84%|████████▍ | 169/200 [01:03<00:29,  1.04it/s][A[A

,  1.04it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:52<00:40,  1.04it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:53<00:39,  1.04it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:54<00:38,  1.04it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:55<00:37,  1.04it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:56<00:36,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:57<00:35,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:58<00:34,  1.04it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [00:59<00:33,  1.04it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:00<00:32,  1.04it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:01<00:31,  1.03it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:02<00:30,  1.03it/sSampling (mamba memory):  85%|████████▌ | 170/200 [01:04<00:28,  1.04it/s][A[A

,  1.04it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:53<00:40,  1.04it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:54<00:39,  1.04it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:55<00:38,  1.03it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:56<00:37,  1.03it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:57<00:36,  1.03it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:35,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:34,  1.04it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:33,  1.03it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:33,  1.03it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:02<00:32,  1.03it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:03<00:31,  1.02it/s,  1.03it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:53<00:40,  1.03it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:54<00:39,  1.04it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:55<00:38,  1.03it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:56<00:37,  1.04it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:57<00:36,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:35,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:34,  1.03it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:33,  1.03it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:33,  1.03it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:02<00:32,  1.03it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:03<00:31,  1.03it/s,  1.04it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:53<00:40,  1.03it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:54<00:39,  1.03it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:55<00:38,  1.03it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:56<00:37,  1.03it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:57<00:36,  1.03it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:35,  1.03it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:35,  1.03it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:34,  1.03it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:33,  1.02it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:02<00:32,  1.02it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:03<00:31,  1.02it/s,  1.03it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:53<00:40,  1.03it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:54<00:39,  1.03it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:55<00:38,  1.03it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:56<00:37,  1.03it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:57<00:37,  1.03it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:36,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:35,  1.02it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:34,  1.02it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:33,  1.02it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:02<00:32,  1.02it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:03<00:31,  1.02it/sSampling (mamba memory):  86%|████████▌ | 171/200 [01:05<00:27,  1.04it/s][A[A

,  1.02it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:54<00:41,  1.02it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:55<00:40,  1.02it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:56<00:39,  1.02it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:57<00:38,  1.01it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:58<00:37,  1.01it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:59<00:36,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:00<00:35,  1.01it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:01<00:34,  1.01it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:02<00:33,  1.00it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:03<00:32,  1.00it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:04<00:31,  1.00it/sSampling (mamba memory):  86%|████████▌ | 172/200 [01:06<00:26,  1.04it/s][A[A

Sampling (mamba memory):  86%|████████▋ | 173/200 [01:06<00:25,  1.04it/s][A[A

,  1.00s/it]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:55<00:42,  1.01s/it]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:56<00:41,  1.01s/it]Sampling (mamba memory):  80%|████████  | 160/200 [00:57<00:40,  1.01s/it]Sampling (mamba memory):  80%|████████  | 161/200 [00:58<00:39,  1.02s/it]Sampling (mamba memory):  81%|████████  | 162/200 [00:59<00:38,  1.02s/it]Sampling (mamba memory):  82%|████████▏ | 163/200 [01:00<00:37,  1.02s/it]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:01<00:36,  1.03s/it]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:02<00:35,  1.03s/it]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:04<00:34,  1.03s/it]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:05<00:33,  1.03s/it]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:06<00:32,  1.03s/itSampling (mamba memory):  87%|████████▋ | 174/200 [01:07<00:25,  1.04it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 175/200 [01:08<00:24,  1.04it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 176/200 [01:09<00:23,  1.04it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 177/200 [01:10<00:22,  1.04it/s][A[A

Sampling (mamba memory):  89%|████████▉ | 178/200 [01:11<00:21,  1.04it/s][A[A

Sampling (mamba memory):  90%|████████▉ | 179/200 [01:12<00:20,  1.04it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:13<00:19,  1.03it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:03<00:30,  1.03it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:04<00:29,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:05<00:28,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:06<00:27,  1.03it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:07<00:26,  1.02it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:08<00:25,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:09<00:24,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:10<00:23,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:11<00:22,  1.02it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:12<00:21,  1.01it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:13<00:20,  1.01it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:14<00:18,  1.02it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:04<00:30,  1.03it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:05<00:29,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:05<00:28,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:06<00:27,  1.02it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:07<00:26,  1.02it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:08<00:25,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:09<00:24,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:10<00:23,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:11<00:22,  1.01it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:12<00:21,  1.01it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:13<00:20,  1.01it/s]]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:04<00:30,  1.03it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:05<00:29,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:06<00:28,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:07<00:27,  1.02it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:08<00:26,  1.02it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:09<00:25,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:09<00:24,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:10<00:23,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:11<00:22,  1.02it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:12<00:21,  1.02it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:13<00:20,  1.02it/s]]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:04<00:30,  1.02it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:05<00:29,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:06<00:28,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:07<00:27,  1.02it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:08<00:26,  1.02it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:09<00:25,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:10<00:24,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:11<00:23,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:12<00:22,  1.01it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:13<00:21,  1.01it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:14<00:20,  1.01it/s]]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:04<00:30,  1.02it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:05<00:29,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:06<00:28,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:07<00:27,  1.02it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:08<00:26,  1.01it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:09<00:25,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:10<00:24,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:11<00:23,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:12<00:22,  1.01it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:13<00:21,  1.01it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:14<00:20,  1.00it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:15<00:17,  1.01it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:05<00:30,  1.00it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:06<00:30,  1.00s/it]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:07<00:29,  1.00s/it]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:08<00:28,  1.00s/it]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:09<00:27,  1.01s/it]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:10<00:26,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:11<00:25,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:12<00:24,  1.02s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:13<00:23,  1.02s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:14<00:22,  1.02s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:15<00:21,  1.02s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:16<00:16,  1.01it/s][A[A

Sampling (mamba memory):  92%|█████████▏| 184/200 [01:17<00:15,  1.01it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:07<00:31,  1.03s/it]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:08<00:30,  1.03s/it]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:09<00:29,  1.03s/it]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:10<00:29,  1.04s/it]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:11<00:28,  1.04s/it]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:12<00:27,  1.04s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:13<00:26,  1.04s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:14<00:25,  1.05s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:15<00:24,  1.05s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:16<00:22,  1.05s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:17<00:21,  1.04s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:18<00:14,  1.00it/s][A[A

Sampling (mamba memory):  93%|█████████▎| 186/200 [01:19<00:14,  1.00s/it][A[A

Sampling (mamba memory):  94%|█████████▎| 187/200 [01:20<00:13,  1.01s/it][A[A

Sampling (mamba memory):  94%|█████████▍| 188/200 [01:21<00:12,  1.01s/it][A[A

Sampling (mamba memory):  94%|█████████▍| 189/200 [01:22<00:11,  1.01s/it][A[A

Sampling (mamba memory):  95%|█████████▌| 190/200 [01:23<00:10,  1.01s/it][A[A

Sampling (mamba memory):  96%|█████████▌| 191/200 [01:24<00:09,  1.01s/it][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:14<00:19,  1.01it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:15<00:18,  1.01it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:16<00:17,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:17<00:16,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:17<00:15,  1.01it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:18<00:14,  1.01it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:20<00:13,  1.00it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:21<00:12,  1.00it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:22<00:12,  1.00s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:23<00:11,  1.00s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:24<00Sampling (mamba memory):  96%|█████████▌| 192/200 [01:25<00:08,  1.01s/it][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:14<00:19,  1.02it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:15<00:18,  1.02it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:16<00:17,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:17<00:16,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:18<00:15,  1.01it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:19<00:14,  1.01it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:20<00:13,  1.01it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:21<00:12,  1.00it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:22<00:11,  1.00it/s]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:23<00:11,  1.00s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:24<00Sampling (mamba memory):  90%|█████████ | 180/200 [01:14<00:19,  1.01it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:15<00:18,  1.00it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:16<00:17,  1.00it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:17<00:17,  1.00s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:18<00:16,  1.00s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:19<00:15,  1.01s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:20<00:14,  1.01s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:21<00:13,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:22<00:12,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:24<00:11,  1.02s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:25<00Sampling (mamba memory):  90%|█████████ | 180/200 [01:15<00:19,  1.00it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:16<00:18,  1.00it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:17<00:18,  1.00s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:18<00:17,  1.00s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:19<00:16,  1.00s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:20<00:15,  1.01s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:21<00:14,  1.01s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:22<00:13,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:23<00:12,  1.02s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:24<00:11,  1.02s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:25<00Sampling (mamba memory):  90%|█████████ | 180/200 [01:15<00:19,  1.01it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:16<00:18,  1.01it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:17<00:17,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:18<00:16,  1.00it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:19<00:15,  1.00it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:20<00:14,  1.00it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:21<00:14,  1.00s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:22<00:13,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:23<00:12,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:24<00:11,  1.02s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:25<00Sampling (mamba memory):  96%|█████████▋| 193/200 [01:26<00:07,  1.01s/it][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:16<00:20,  1.03s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:17<00:19,  1.03s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:18<00:18,  1.03s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:19<00:17,  1.03s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:20<00:16,  1.03s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:21<00:15,  1.03s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:22<00:14,  1.03s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:23<00:13,  1.03s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:24<00:12,  1.03s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:25<00:11,  1.04s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:26<00Sampling (mamba memory):  97%|█████████▋| 194/200 [01:27<00:06,  1.01s/it][A[A

Sampling (mamba memory):  98%|█████████▊| 195/200 [01:28<00:05,  1.01s/it][A[A

Sampling (mamba memory):  98%|█████████▊| 196/200 [01:29<00:04,  1.01s/it][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:18<00:20,  1.04s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:19<00:19,  1.04s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:20<00:18,  1.04s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:21<00:17,  1.05s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:22<00:16,  1.05s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:23<00:15,  1.05s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:24<00:14,  1.06s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:25<00:13,  1.06s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:27<00:12,  1.06s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:28<00:11,  1.06s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:29<00Sampling (mamba memory):  98%|█████████▊| 197/200 [01:30<00:03,  1.02s/it][A[A

Sampling (mamba memory):  99%|█████████▉| 198/200 [01:31<00:02,  1.02s/it][A[A

Sampling (mamba memory): 100%|█████████▉| 199/200 [01:32<00:01,  1.02s/it][A[A

:10,  1.01s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:25<00:09,  1.01s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:26<00:08,  1.01s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:27<00:07,  1.01s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:28<00:06,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:29<00:05,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:30<00:04,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:31<00:03,  1.01s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:32<00:02,  1.01s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:33<00:01,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:34<00:00,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:39<00:00,  1.01it/s]
Sampling (mamba memory): 100%|██████████| 200/200 [01:34<00:00,  1.02s/it][A[ASampling (mamba memory): 100%|██████████| 200/200 [01:41<00:00,  1.02s/it]
Validation DataLoader 0:   0%|          | 0/1 [00:00<?, ?it/s][A
:10,  1.00s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:25<00:09,  1.01s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:26<00:08,  1.01s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:27<00:07,  1.01s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:28<00:06,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:29<00:05,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:30<00:04,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:31<00:03,  1.01s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:32<00:02,  1.01s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:34<00:01,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:35<00:00,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:39<00:00,  1.00it/s]
:10,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:26<00:09,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:27<00:08,  1.02s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:28<00:07,  1.02s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:29<00:06,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:30<00:05,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:31<00:04,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:32<00:03,  1.01s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:33<00:02,  1.01s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:34<00:01,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:35<00:00,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:40<00:00,  1.00s/it]
:10,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:26<00:09,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:27<00:08,  1.02s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:28<00:07,  1.02s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:29<00:06,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:30<00:05,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:31<00:04,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:32<00:03,  1.03s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:33<00:02,  1.03s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:34<00:01,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:35<00:00,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:40<00:00,  1.01s/it]
:10,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:26<00:09,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:27<00:08,  1.02s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:28<00:07,  1.03s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:29<00:06,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:30<00:05,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:31<00:04,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:32<00:03,  1.03s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:33<00:02,  1.03s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:34<00:01,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:35<00:00,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:41<00:00,  1.01s/it]
:10,  1.04s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:27<00:09,  1.04s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:28<00:08,  1.04s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:29<00:07,  1.04s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:30<00:06,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:31<00:05,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:33<00:04,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:34<00:03,  1.04s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:35<00:02,  1.04s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:36<00:01,  1.04s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:37<00:00,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:42<00:00,  1.02s/it]
:10,  1.07s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:30<00:09,  1.07s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:31<00:08,  1.07s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:32<00:07,  1.07s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:33<00:06,  1.07s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:34<00:05,  1.08s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:35<00:04,  1.07s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:36<00:03,  1.07s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:37<00:02,  1.07s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:38<00:01,  1.07s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:39<00:00,  1.07s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:44<00:00,  1.05s/it]
Validation DataLoader 0: 100%|██████████| 1/1 [01:41<00:00,  0.01it/s][A[2026-04-20 14:56:29,562][py.warnings][WARNING] - /proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/pytorch/trainer/connectors/logger_connector/result.py:433: It is recommended to use `self.log('mse', ..., sync_dist=True)` when logging on epoch level in distributed setting to accumulate the metric across devices.

[2026-04-20 14:56:29,569][py.warnings][WARNING] - /proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/pytorch/trainer/connectors/logger_connector/result.py:433: It is recommended to use `self.log('psnr', ..., sync_dist=True)` when logging on epoch level in distributed setting to accumulate the metric across devices.

[2026-04-20 14:56:29,569][py.warnings][WARNING] - /proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/pytorch/trainer/connectors/logger_connector/result.py:433: It is recommended to use `self.log('lpips', ..., sync_dist=True)` when logging on epoch level in distributed setting to accumulate the metric across devices.


[2026-04-20 14:56:30,120][py.warnings][WARNING] - /proj/cvl/users/x_fahkh2/WorldMem_Repro/algorithms/worldmem/models/mamba_memory.py:173: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(enabled=False):

[2026-04-20 14:56:30,129][py.warnings][WARNING] - /proj/cvl/users/x_fahkh2/WorldMem_Repro/algorithms/worldmem/models/mamba_memory.py:173: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(enabled=False):

[2026-04-20 14:56:30,139][py.warnings][WARNING] - /proj/cvl/users/x_fahkh2/WorldMem_Repro/algorithms/worldmem/models/mamba_memory.py:173: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(enabled=False):

[2026-04-20 14:56:30,252][py.warnings][WARNING] - /proj/cvl/users/x_fahkh2/WorldMem_Repro/algorithms/worldmem/models/mamba_memory.py:173: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(enabled=False):

[2026-04-20 14:56:30,270][py.warnings][WARNING] - /proj/cvl/users/x_fahkh2/WorldMem_Repro/algorithms/worldmem/models/mamba_memory.py:173: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(enabled=False):

[2026-04-20 14:56:30,275][py.warnings][WARNING] - /proj/cvl/users/x_fahkh2/WorldMem_Repro/algorithms/worldmem/models/mamba_memory.py:173: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(enabled=False):

[2026-04-20 14:56:30,567][py.warnings][WARNING] - /proj/cvl/users/x_fahkh2/WorldMem_Repro/algorithms/worldmem/models/mamba_memory.py:173: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(enabled=False):

                                                                      [AEpoch 0:   1%|          | 2500/203307 [2:56:36<236:26:11,  0.24it/s, v_num=t5e6, training/loss=0.108][2026-04-20 14:56:30,834][py.warnings][WARNING] - /proj/cvl/users/x_fahkh2/WorldMem_Repro/algorithms/worldmem/models/mamba_memory.py:173: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(enabled=False):

Epoch 0:   1%|          | 2501/203307 [2:56:41<236:26:32,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|          | 2501/203307 [2:56:41<236:26:33,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2502/203307 [2:56:45<236:25:54,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2502/203307 [2:56:45<236:25:55,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2503/203307 [2:56:49<236:25:36,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2503/203307 [2:56:49<236:25:37,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2504/203307 [2:56:54<236:26:11,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2504/203307 [2:56:54<236:26:11,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2505/203307 [2:56:58<236:25:52,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2505/203307 [2:56:58<236:25:52,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2506/203307 [2:57:02<236:25:27,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2506/203307 [2:57:02<236:25:27,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2507/203307 [2:57:06<236:24:58,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2507/203307 [2:57:06<236:24:58,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2508/203307 [2:57:09<236:23:59,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2508/203307 [2:57:09<236:23:59,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2509/203307 [2:57:14<236:24:48,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2509/203307 [2:57:14<236:24:48,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2510/203307 [2:57:18<236:24:55,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2510/203307 [2:57:18<236:24:56,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2511/203307 [2:57:22<236:24:38,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2511/203307 [2:57:22<236:24:38,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2512/203307 [2:57:27<236:25:01,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2512/203307 [2:57:27<236:25:01,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2513/203307 [2:57:31<236:24:34,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2513/203307 [2:57:31<236:24:34,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2514/203307 [2:57:35<236:23:58,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2514/203307 [2:57:35<236:23:58,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2515/203307 [2:57:39<236:23:48,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2515/203307 [2:57:39<236:23:48,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2516/203307 [2:57:43<236:23:25,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2516/203307 [2:57:43<236:23:25,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2517/203307 [2:57:48<236:24:05,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2517/203307 [2:57:48<236:24:05,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2518/203307 [2:57:52<236:23:59,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2518/203307 [2:57:52<236:23:59,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2519/203307 [2:57:56<236:23:42,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2519/203307 [2:57:56<236:23:42,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2520/203307 [2:58:01<236:24:04,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2520/203307 [2:58:01<236:24:04,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2521/203307 [2:58:05<236:23:42,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|          | 2521/203307 [2:58:05<236:23:42,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2522/203307 [2:58:09<236:23:18,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2522/203307 [2:58:09<236:23:19,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2523/203307 [2:58:13<236:23:03,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2523/203307 [2:58:13<236:23:03,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2524/203307 [2:58:17<236:22:37,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2524/203307 [2:58:17<236:22:37,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2525/203307 [2:58:22<236:23:28,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2525/203307 [2:58:22<236:23:28,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2526/203307 [2:58:26<236:23:01,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2526/203307 [2:58:26<236:23:01,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2527/203307 [2:58:30<236:23:35,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2527/203307 [2:58:30<236:23:35,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2528/203307 [2:58:35<236:24:10,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2528/203307 [2:58:35<236:24:10,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2529/203307 [2:58:39<236:23:47,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2529/203307 [2:58:39<236:23:47,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2530/203307 [2:58:43<236:23:19,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2530/203307 [2:58:43<236:23:19,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2531/203307 [2:58:47<236:23:08,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2531/203307 [2:58:47<236:23:08,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2532/203307 [2:58:51<236:22:40,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2532/203307 [2:58:51<236:22:40,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2533/203307 [2:58:56<236:23:21,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2533/203307 [2:58:56<236:23:21,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2534/203307 [2:59:00<236:23:00,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2534/203307 [2:59:00<236:23:00,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2535/203307 [2:59:04<236:22:52,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2535/203307 [2:59:04<236:22:52,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2536/203307 [2:59:09<236:23:20,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2536/203307 [2:59:09<236:23:20,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2537/203307 [2:59:13<236:23:06,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2537/203307 [2:59:13<236:23:06,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2538/203307 [2:59:17<236:22:36,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2538/203307 [2:59:17<236:22:37,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2539/203307 [2:59:21<236:22:24,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2539/203307 [2:59:21<236:22:25,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2540/203307 [2:59:25<236:21:57,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2540/203307 [2:59:25<236:21:58,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2541/203307 [2:59:29<236:21:45,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|          | 2541/203307 [2:59:29<236:21:45,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2542/203307 [2:59:34<236:22:26,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2542/203307 [2:59:34<236:22:26,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2543/203307 [2:59:38<236:22:23,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2543/203307 [2:59:38<236:22:23,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2544/203307 [2:59:42<236:21:58,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2544/203307 [2:59:42<236:21:59,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2545/203307 [2:59:47<236:22:25,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2545/203307 [2:59:47<236:22:25,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2546/203307 [2:59:51<236:22:12,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2546/203307 [2:59:51<236:22:12,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2547/203307 [2:59:55<236:21:58,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2547/203307 [2:59:55<236:21:58,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2548/203307 [2:59:59<236:21:38,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2548/203307 [2:59:59<236:21:38,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2549/203307 [3:00:03<236:21:15,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2549/203307 [3:00:03<236:21:15,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2550/203307 [3:00:08<236:21:52,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2550/203307 [3:00:08<236:21:52,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2551/203307 [3:00:12<236:21:39,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2551/203307 [3:00:12<236:21:39,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2552/203307 [3:00:16<236:21:15,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2552/203307 [3:00:16<236:21:15,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2553/203307 [3:00:20<236:21:36,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2553/203307 [3:00:20<236:21:36,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2554/203307 [3:00:24<236:21:04,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2554/203307 [3:00:24<236:21:05,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2555/203307 [3:00:29<236:21:33,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2555/203307 [3:00:29<236:21:33,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2556/203307 [3:00:33<236:21:04,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2556/203307 [3:00:33<236:21:04,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2557/203307 [3:00:37<236:20:45,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2557/203307 [3:00:37<236:20:45,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2558/203307 [3:00:42<236:21:12,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2558/203307 [3:00:42<236:21:12,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2559/203307 [3:00:46<236:21:00,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2559/203307 [3:00:46<236:21:01,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2560/203307 [3:00:50<236:20:36,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2560/203307 [3:00:50<236:20:36,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2561/203307 [3:00:54<236:21:06,  0.24it/s, v_num=t5e6, training/loss=0.119]Epoch 0:   1%|▏         | 2561/203307 [3:00:54<236:21:07,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2562/203307 [3:00:58<236:20:33,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2562/203307 [3:00:58<236:20:33,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2563/203307 [3:01:02<236:20:20,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2563/203307 [3:01:02<236:20:20,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2564/203307 [3:01:07<236:20:12,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2564/203307 [3:01:07<236:20:13,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2565/203307 [3:01:10<236:19:45,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2565/203307 [3:01:11<236:19:46,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2566/203307 [3:01:15<236:19:25,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2566/203307 [3:01:15<236:19:25,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2567/203307 [3:01:20<236:20:26,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2567/203307 [3:01:20<236:20:26,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2568/203307 [3:01:23<236:19:46,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2568/203307 [3:01:23<236:19:47,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2569/203307 [3:01:27<236:19:20,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2569/203307 [3:01:27<236:19:20,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2570/203307 [3:01:32<236:19:44,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2570/203307 [3:01:32<236:19:44,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2571/203307 [3:01:36<236:19:29,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2571/203307 [3:01:36<236:19:29,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2572/203307 [3:01:40<236:18:59,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2572/203307 [3:01:40<236:18:59,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2573/203307 [3:01:44<236:18:52,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2573/203307 [3:01:44<236:18:52,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2574/203307 [3:01:48<236:18:21,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2574/203307 [3:01:48<236:18:22,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2575/203307 [3:01:53<236:18:51,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2575/203307 [3:01:53<236:18:51,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2576/203307 [3:01:57<236:18:23,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2576/203307 [3:01:57<236:18:23,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2577/203307 [3:02:01<236:18:02,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2577/203307 [3:02:01<236:18:02,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2578/203307 [3:02:05<236:18:29,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2578/203307 [3:02:05<236:18:29,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2579/203307 [3:02:09<236:18:19,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2579/203307 [3:02:09<236:18:19,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2580/203307 [3:02:14<236:17:58,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2580/203307 [3:02:14<236:17:58,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2581/203307 [3:02:18<236:17:38,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   1%|▏         | 2581/203307 [3:02:18<236:17:38,  0.24it/s, v_num=t5e6, training/loss=0.109] Epoch 0:   1%|▏         | 2582/203307 [3:02:22<236:17:32,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2582/203307 [3:02:22<236:17:32,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2583/203307 [3:02:27<236:18:17,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2583/203307 [3:02:27<236:18:17,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2584/203307 [3:02:31<236:17:56,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2584/203307 [3:02:31<236:17:56,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2585/203307 [3:02:34<236:17:19,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2585/203307 [3:02:34<236:17:19,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2586/203307 [3:02:39<236:17:45,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2586/203307 [3:02:39<236:17:46,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2587/203307 [3:02:43<236:17:31,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2587/203307 [3:02:43<236:17:31,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2588/203307 [3:02:47<236:16:59,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2588/203307 [3:02:47<236:16:59,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2589/203307 [3:02:51<236:16:37,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2589/203307 [3:02:51<236:16:37,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2590/203307 [3:02:55<236:16:18,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2590/203307 [3:02:55<236:16:18,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2591/203307 [3:03:00<236:16:45,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2591/203307 [3:03:00<236:16:45,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2592/203307 [3:03:04<236:17:08,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2592/203307 [3:03:04<236:17:08,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2593/203307 [3:03:08<236:16:36,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2593/203307 [3:03:08<236:16:36,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2594/203307 [3:03:12<236:16:13,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2594/203307 [3:03:12<236:16:13,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2595/203307 [3:03:17<236:16:52,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2595/203307 [3:03:17<236:16:52,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2596/203307 [3:03:21<236:16:26,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2596/203307 [3:03:21<236:16:26,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2597/203307 [3:03:25<236:16:08,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2597/203307 [3:03:25<236:16:08,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2598/203307 [3:03:29<236:15:51,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2598/203307 [3:03:29<236:15:51,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2599/203307 [3:03:33<236:15:40,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2599/203307 [3:03:33<236:15:40,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2600/203307 [3:03:38<236:16:13,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2600/203307 [3:03:38<236:16:13,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2601/203307 [3:03:42<236:15:52,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   1%|▏         | 2601/203307 [3:03:42<236:15:53,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2602/203307 [3:03:46<236:15:25,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2602/203307 [3:03:46<236:15:25,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2603/203307 [3:03:51<236:16:03,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2603/203307 [3:03:51<236:16:03,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2604/203307 [3:03:55<236:15:35,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2604/203307 [3:03:55<236:15:35,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2605/203307 [3:03:59<236:15:16,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2605/203307 [3:03:59<236:15:16,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2606/203307 [3:04:03<236:14:52,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2606/203307 [3:04:03<236:14:53,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2607/203307 [3:04:07<236:14:46,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2607/203307 [3:04:07<236:14:46,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2608/203307 [3:04:12<236:15:14,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2608/203307 [3:04:12<236:15:14,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2609/203307 [3:04:16<236:15:06,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2609/203307 [3:04:16<236:15:07,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2610/203307 [3:04:20<236:14:44,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2610/203307 [3:04:20<236:14:44,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2611/203307 [3:04:25<236:15:26,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2611/203307 [3:04:25<236:15:26,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2612/203307 [3:04:29<236:15:01,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2612/203307 [3:04:29<236:15:01,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2613/203307 [3:04:33<236:14:39,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2613/203307 [3:04:33<236:14:40,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2614/203307 [3:04:37<236:14:18,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2614/203307 [3:04:37<236:14:18,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2615/203307 [3:04:41<236:14:03,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2615/203307 [3:04:41<236:14:03,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2616/203307 [3:04:45<236:13:40,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2616/203307 [3:04:45<236:13:40,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2617/203307 [3:04:49<236:14:11,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2617/203307 [3:04:49<236:14:11,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2618/203307 [3:04:54<236:14:00,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2618/203307 [3:04:54<236:14:00,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2619/203307 [3:04:58<236:13:52,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2619/203307 [3:04:58<236:13:52,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2620/203307 [3:05:02<236:14:20,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2620/203307 [3:05:02<236:14:20,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2621/203307 [3:05:06<236:13:52,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2621/203307 [3:05:06<236:13:52,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2622/203307 [3:05:10<236:13:30,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2622/203307 [3:05:10<236:13:30,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2623/203307 [3:05:15<236:13:25,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2623/203307 [3:05:15<236:13:25,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2624/203307 [3:05:18<236:12:58,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2624/203307 [3:05:18<236:12:58,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2625/203307 [3:05:23<236:13:34,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2625/203307 [3:05:23<236:13:34,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2626/203307 [3:05:27<236:13:11,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2626/203307 [3:05:27<236:13:11,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2627/203307 [3:05:32<236:13:35,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2627/203307 [3:05:32<236:13:35,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2628/203307 [3:05:36<236:13:54,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2628/203307 [3:05:36<236:13:55,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2629/203307 [3:05:40<236:13:31,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2629/203307 [3:05:40<236:13:31,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2630/203307 [3:05:44<236:13:06,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2630/203307 [3:05:44<236:13:06,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2631/203307 [3:05:49<236:13:00,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2631/203307 [3:05:49<236:13:00,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2632/203307 [3:05:52<236:12:29,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2632/203307 [3:05:52<236:12:29,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2633/203307 [3:05:57<236:13:03,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2633/203307 [3:05:57<236:13:04,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2634/203307 [3:06:01<236:12:35,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2634/203307 [3:06:01<236:12:35,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2635/203307 [3:06:05<236:12:25,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2635/203307 [3:06:05<236:12:25,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2636/203307 [3:06:10<236:13:03,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2636/203307 [3:06:10<236:13:03,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2637/203307 [3:06:14<236:12:46,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2637/203307 [3:06:14<236:12:46,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2638/203307 [3:06:18<236:12:19,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2638/203307 [3:06:18<236:12:19,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2639/203307 [3:06:22<236:12:07,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2639/203307 [3:06:22<236:12:07,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2640/203307 [3:06:26<236:11:38,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2640/203307 [3:06:26<236:11:38,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2641/203307 [3:06:30<236:11:13,  0.24it/s, v_num=t5e6, training/loss=0.115]Epoch 0:   1%|▏         | 2641/203307 [3:06:30<236:11:13,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2642/203307 [3:06:35<236:11:44,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2642/203307 [3:06:35<236:11:44,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2643/203307 [3:06:39<236:11:29,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2643/203307 [3:06:39<236:11:29,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2644/203307 [3:06:43<236:11:02,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2644/203307 [3:06:43<236:11:02,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2645/203307 [3:06:47<236:11:24,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2645/203307 [3:06:47<236:11:24,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2646/203307 [3:06:51<236:10:54,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2646/203307 [3:06:51<236:10:55,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2647/203307 [3:06:55<236:10:35,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2647/203307 [3:06:55<236:10:35,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2648/203307 [3:06:59<236:10:09,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2648/203307 [3:06:59<236:10:10,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2649/203307 [3:07:03<236:09:47,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2649/203307 [3:07:03<236:09:47,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2650/203307 [3:07:08<236:10:14,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2650/203307 [3:07:08<236:10:15,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2651/203307 [3:07:12<236:10:01,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2651/203307 [3:07:12<236:10:02,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2652/203307 [3:07:16<236:09:34,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2652/203307 [3:07:16<236:09:34,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2653/203307 [3:07:21<236:10:02,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2653/203307 [3:07:21<236:10:03,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2654/203307 [3:07:25<236:09:55,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2654/203307 [3:07:25<236:09:55,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2655/203307 [3:07:29<236:09:40,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2655/203307 [3:07:29<236:09:40,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2656/203307 [3:07:33<236:09:16,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2656/203307 [3:07:33<236:09:17,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2657/203307 [3:07:37<236:09:04,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2657/203307 [3:07:37<236:09:04,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2658/203307 [3:07:42<236:09:28,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2658/203307 [3:07:42<236:09:28,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2659/203307 [3:07:46<236:09:08,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2659/203307 [3:07:46<236:09:08,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2660/203307 [3:07:50<236:08:42,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2660/203307 [3:07:50<236:08:42,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2661/203307 [3:07:54<236:09:15,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 2661/203307 [3:07:54<236:09:15,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2662/203307 [3:07:58<236:08:48,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2662/203307 [3:07:58<236:08:48,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2663/203307 [3:08:03<236:09:12,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2663/203307 [3:08:03<236:09:12,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2664/203307 [3:08:07<236:08:45,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2664/203307 [3:08:07<236:08:45,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2665/203307 [3:08:11<236:08:23,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2665/203307 [3:08:11<236:08:23,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2666/203307 [3:08:15<236:07:54,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2666/203307 [3:08:15<236:07:54,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2667/203307 [3:08:20<236:08:39,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2667/203307 [3:08:20<236:08:40,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2668/203307 [3:08:24<236:08:17,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2668/203307 [3:08:24<236:08:17,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2669/203307 [3:08:28<236:08:00,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2669/203307 [3:08:28<236:08:00,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2670/203307 [3:08:32<236:08:21,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2670/203307 [3:08:32<236:08:21,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2671/203307 [3:08:36<236:08:07,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2671/203307 [3:08:36<236:08:07,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2672/203307 [3:08:41<236:08:04,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2672/203307 [3:08:41<236:08:04,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2673/203307 [3:08:45<236:07:48,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2673/203307 [3:08:45<236:07:48,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2674/203307 [3:08:49<236:07:20,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2674/203307 [3:08:49<236:07:20,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2675/203307 [3:08:54<236:08:02,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2675/203307 [3:08:54<236:08:02,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2676/203307 [3:08:57<236:07:36,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2676/203307 [3:08:57<236:07:36,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2677/203307 [3:09:01<236:07:13,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2677/203307 [3:09:01<236:07:14,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2678/203307 [3:09:06<236:07:38,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2678/203307 [3:09:06<236:07:39,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2679/203307 [3:09:10<236:07:27,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2679/203307 [3:09:10<236:07:27,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2680/203307 [3:09:14<236:07:04,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2680/203307 [3:09:14<236:07:04,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2681/203307 [3:09:18<236:06:56,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2681/203307 [3:09:18<236:06:56,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2682/203307 [3:09:22<236:06:29,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2682/203307 [3:09:22<236:06:29,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2683/203307 [3:09:27<236:07:11,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2683/203307 [3:09:27<236:07:12,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2684/203307 [3:09:31<236:06:44,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2684/203307 [3:09:31<236:06:45,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2685/203307 [3:09:35<236:06:22,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2685/203307 [3:09:35<236:06:22,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2686/203307 [3:09:40<236:06:43,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2686/203307 [3:09:40<236:06:43,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2687/203307 [3:09:44<236:06:26,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2687/203307 [3:09:44<236:06:26,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2688/203307 [3:09:48<236:05:57,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2688/203307 [3:09:48<236:05:57,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2689/203307 [3:09:52<236:05:30,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2689/203307 [3:09:52<236:05:30,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2690/203307 [3:09:56<236:05:19,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2690/203307 [3:09:56<236:05:19,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2691/203307 [3:10:00<236:05:02,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2691/203307 [3:10:00<236:05:02,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2692/203307 [3:10:04<236:05:28,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2692/203307 [3:10:04<236:05:28,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2693/203307 [3:10:08<236:04:59,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2693/203307 [3:10:08<236:04:59,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2694/203307 [3:10:13<236:04:47,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2694/203307 [3:10:13<236:04:47,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2695/203307 [3:10:17<236:05:15,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2695/203307 [3:10:17<236:05:15,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2696/203307 [3:10:21<236:04:46,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2696/203307 [3:10:21<236:04:47,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2697/203307 [3:10:25<236:04:16,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2697/203307 [3:10:25<236:04:16,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2698/203307 [3:10:29<236:03:59,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2698/203307 [3:10:29<236:03:59,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2699/203307 [3:10:33<236:03:51,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2699/203307 [3:10:33<236:03:52,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2700/203307 [3:10:38<236:04:15,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2700/203307 [3:10:38<236:04:15,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2701/203307 [3:10:42<236:04:03,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   1%|▏         | 2701/203307 [3:10:42<236:04:03,  0.24it/s, v_num=t5e6, training/loss=0.105] Epoch 0:   1%|▏         | 2702/203307 [3:10:46<236:03:34,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2702/203307 [3:10:46<236:03:35,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2703/203307 [3:10:50<236:03:53,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2703/203307 [3:10:50<236:03:53,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2704/203307 [3:10:54<236:03:26,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2704/203307 [3:10:54<236:03:26,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2705/203307 [3:10:58<236:03:02,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2705/203307 [3:10:58<236:03:02,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2706/203307 [3:11:02<236:02:33,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2706/203307 [3:11:02<236:02:33,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2707/203307 [3:11:06<236:02:13,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2707/203307 [3:11:06<236:02:13,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2708/203307 [3:11:11<236:02:38,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2708/203307 [3:11:11<236:02:39,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2709/203307 [3:11:15<236:02:11,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2709/203307 [3:11:15<236:02:12,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2710/203307 [3:11:19<236:01:53,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2710/203307 [3:11:19<236:01:54,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2711/203307 [3:11:23<236:02:15,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2711/203307 [3:11:23<236:02:15,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2712/203307 [3:11:27<236:01:47,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2712/203307 [3:11:27<236:01:47,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2713/203307 [3:11:31<236:01:28,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2713/203307 [3:11:31<236:01:29,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2714/203307 [3:11:35<236:01:01,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2714/203307 [3:11:35<236:01:02,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2715/203307 [3:11:39<236:00:34,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2715/203307 [3:11:39<236:00:34,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2716/203307 [3:11:43<236:00:07,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2716/203307 [3:11:43<236:00:07,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2717/203307 [3:11:48<236:00:41,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2717/203307 [3:11:48<236:00:42,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2718/203307 [3:11:52<236:00:09,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2718/203307 [3:11:52<236:00:09,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2719/203307 [3:11:56<235:59:40,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2719/203307 [3:11:56<235:59:40,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2720/203307 [3:12:00<236:00:03,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2720/203307 [3:12:00<236:00:04,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2721/203307 [3:12:04<235:59:39,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2721/203307 [3:12:04<235:59:39,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2722/203307 [3:12:08<235:59:13,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2722/203307 [3:12:08<235:59:13,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2723/203307 [3:12:12<235:58:50,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2723/203307 [3:12:12<235:58:50,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2724/203307 [3:12:16<235:58:27,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2724/203307 [3:12:16<235:58:27,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2725/203307 [3:12:21<235:58:54,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2725/203307 [3:12:21<235:58:54,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2726/203307 [3:12:25<235:58:51,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2726/203307 [3:12:25<235:58:51,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2727/203307 [3:12:29<235:58:35,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2727/203307 [3:12:29<235:58:35,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2728/203307 [3:12:34<235:58:57,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2728/203307 [3:12:34<235:58:57,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2729/203307 [3:12:38<235:58:27,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2729/203307 [3:12:38<235:58:27,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2730/203307 [3:12:42<235:58:05,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2730/203307 [3:12:42<235:58:05,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2731/203307 [3:12:46<235:57:49,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2731/203307 [3:12:46<235:57:49,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2732/203307 [3:12:50<235:57:23,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2732/203307 [3:12:50<235:57:23,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2733/203307 [3:12:54<235:57:52,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2733/203307 [3:12:54<235:57:52,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2734/203307 [3:12:58<235:57:21,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2734/203307 [3:12:58<235:57:21,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2735/203307 [3:13:03<235:57:37,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2735/203307 [3:13:03<235:57:38,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2736/203307 [3:13:07<235:58:03,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2736/203307 [3:13:07<235:58:03,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2737/203307 [3:13:11<235:57:42,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2737/203307 [3:13:11<235:57:43,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2738/203307 [3:13:15<235:57:14,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2738/203307 [3:13:15<235:57:14,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2739/203307 [3:13:19<235:57:01,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2739/203307 [3:13:19<235:57:01,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2740/203307 [3:13:23<235:56:32,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2740/203307 [3:13:23<235:56:32,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2741/203307 [3:13:27<235:56:15,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   1%|▏         | 2741/203307 [3:13:27<235:56:15,  0.24it/s, v_num=t5e6, training/loss=0.106] Epoch 0:   1%|▏         | 2742/203307 [3:13:32<235:56:40,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2742/203307 [3:13:32<235:56:40,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2743/203307 [3:13:36<235:56:20,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2743/203307 [3:13:36<235:56:20,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2744/203307 [3:13:40<235:56:19,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2744/203307 [3:13:40<235:56:19,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2745/203307 [3:13:45<235:56:46,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2745/203307 [3:13:45<235:56:46,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2746/203307 [3:13:49<235:56:18,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2746/203307 [3:13:49<235:56:18,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2747/203307 [3:13:53<235:56:05,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2747/203307 [3:13:53<235:56:05,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2748/203307 [3:13:57<235:55:44,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2748/203307 [3:13:57<235:55:44,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2749/203307 [3:14:01<235:55:22,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2749/203307 [3:14:01<235:55:22,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2750/203307 [3:14:06<235:55:48,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2750/203307 [3:14:06<235:55:48,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2751/203307 [3:14:10<235:55:37,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2751/203307 [3:14:10<235:55:38,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2752/203307 [3:14:14<235:56:10,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2752/203307 [3:14:14<235:56:10,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2753/203307 [3:14:19<235:55:51,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2753/203307 [3:14:19<235:55:51,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2754/203307 [3:14:22<235:55:21,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2754/203307 [3:14:22<235:55:21,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2755/203307 [3:14:27<235:55:08,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2755/203307 [3:14:27<235:55:08,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2756/203307 [3:14:30<235:54:36,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2756/203307 [3:14:30<235:54:36,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2757/203307 [3:14:34<235:54:14,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2757/203307 [3:14:34<235:54:14,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2758/203307 [3:14:39<235:54:48,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2758/203307 [3:14:39<235:54:48,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2759/203307 [3:14:43<235:54:35,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2759/203307 [3:14:43<235:54:35,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2760/203307 [3:14:47<235:54:07,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2760/203307 [3:14:47<235:54:07,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2761/203307 [3:14:52<235:54:31,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2761/203307 [3:14:52<235:54:31,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2762/203307 [3:14:56<235:54:04,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2762/203307 [3:14:56<235:54:04,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2763/203307 [3:15:00<235:53:45,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2763/203307 [3:15:00<235:53:45,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2764/203307 [3:15:04<235:53:19,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2764/203307 [3:15:04<235:53:20,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2765/203307 [3:15:08<235:52:51,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2765/203307 [3:15:08<235:52:51,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2766/203307 [3:15:12<235:52:28,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2766/203307 [3:15:12<235:52:28,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2767/203307 [3:15:16<235:53:10,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2767/203307 [3:15:16<235:53:10,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2768/203307 [3:15:20<235:52:45,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2768/203307 [3:15:20<235:52:45,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2769/203307 [3:15:24<235:52:20,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2769/203307 [3:15:24<235:52:21,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2770/203307 [3:15:29<235:52:31,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2770/203307 [3:15:29<235:52:31,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2771/203307 [3:15:33<235:52:13,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2771/203307 [3:15:33<235:52:13,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2772/203307 [3:15:37<235:51:32,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2772/203307 [3:15:37<235:51:32,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2773/203307 [3:15:41<235:51:20,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2773/203307 [3:15:41<235:51:20,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2774/203307 [3:15:44<235:50:42,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2774/203307 [3:15:44<235:50:42,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2775/203307 [3:15:49<235:51:36,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2775/203307 [3:15:49<235:51:36,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2776/203307 [3:15:53<235:51:13,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2776/203307 [3:15:53<235:51:13,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2777/203307 [3:15:57<235:50:46,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2777/203307 [3:15:57<235:50:47,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2778/203307 [3:16:02<235:51:11,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2778/203307 [3:16:02<235:51:11,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2779/203307 [3:16:06<235:50:58,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2779/203307 [3:16:06<235:50:59,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2780/203307 [3:16:10<235:50:50,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2780/203307 [3:16:10<235:50:51,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2781/203307 [3:16:14<235:50:27,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 2781/203307 [3:16:14<235:50:27,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2782/203307 [3:16:18<235:50:09,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2782/203307 [3:16:18<235:50:09,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2783/203307 [3:16:23<235:51:04,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2783/203307 [3:16:23<235:51:04,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2784/203307 [3:16:27<235:50:29,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2784/203307 [3:16:27<235:50:30,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2785/203307 [3:16:31<235:50:10,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2785/203307 [3:16:31<235:50:11,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2786/203307 [3:16:36<235:50:17,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2786/203307 [3:16:36<235:50:17,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2787/203307 [3:16:40<235:50:09,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2787/203307 [3:16:40<235:50:09,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2788/203307 [3:16:44<235:50:03,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2788/203307 [3:16:44<235:50:04,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2789/203307 [3:16:48<235:49:53,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2789/203307 [3:16:48<235:49:53,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2790/203307 [3:16:52<235:49:38,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2790/203307 [3:16:52<235:49:38,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2791/203307 [3:16:56<235:49:30,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2791/203307 [3:16:56<235:49:31,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2792/203307 [3:17:01<235:50:07,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2792/203307 [3:17:01<235:50:08,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2793/203307 [3:17:05<235:49:50,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2793/203307 [3:17:05<235:49:50,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2794/203307 [3:17:09<235:49:29,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2794/203307 [3:17:09<235:49:29,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2795/203307 [3:17:14<235:50:04,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2795/203307 [3:17:14<235:50:04,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2796/203307 [3:17:18<235:49:40,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2796/203307 [3:17:18<235:49:40,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2797/203307 [3:17:22<235:49:32,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2797/203307 [3:17:22<235:49:32,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2798/203307 [3:17:26<235:49:09,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2798/203307 [3:17:26<235:49:10,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2799/203307 [3:17:30<235:48:58,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2799/203307 [3:17:30<235:48:58,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2800/203307 [3:17:35<235:49:28,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2800/203307 [3:17:35<235:49:29,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2801/203307 [3:17:39<235:49:02,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2801/203307 [3:17:39<235:49:02,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2802/203307 [3:17:43<235:48:36,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2802/203307 [3:17:43<235:48:36,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2803/203307 [3:17:48<235:49:12,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2803/203307 [3:17:48<235:49:12,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2804/203307 [3:17:52<235:48:49,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2804/203307 [3:17:52<235:48:50,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2805/203307 [3:17:56<235:48:30,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2805/203307 [3:17:56<235:48:31,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2806/203307 [3:18:00<235:48:11,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2806/203307 [3:18:00<235:48:11,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2807/203307 [3:18:04<235:48:35,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2807/203307 [3:18:04<235:48:35,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2808/203307 [3:18:09<235:49:00,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2808/203307 [3:18:09<235:49:01,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2809/203307 [3:18:13<235:48:35,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2809/203307 [3:18:13<235:48:35,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2810/203307 [3:18:17<235:48:19,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2810/203307 [3:18:17<235:48:19,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2811/203307 [3:18:22<235:48:53,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2811/203307 [3:18:22<235:48:53,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2812/203307 [3:18:26<235:48:36,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2812/203307 [3:18:26<235:48:36,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2813/203307 [3:18:30<235:48:15,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2813/203307 [3:18:30<235:48:15,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2814/203307 [3:18:34<235:47:54,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2814/203307 [3:18:34<235:47:54,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2815/203307 [3:18:38<235:47:35,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2815/203307 [3:18:38<235:47:36,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2816/203307 [3:18:42<235:47:23,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2816/203307 [3:18:42<235:47:24,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2817/203307 [3:18:47<235:47:59,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2817/203307 [3:18:47<235:48:00,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2818/203307 [3:18:51<235:47:40,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2818/203307 [3:18:51<235:47:40,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2819/203307 [3:18:55<235:47:30,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2819/203307 [3:18:55<235:47:31,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2820/203307 [3:18:59<235:47:44,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2820/203307 [3:18:59<235:47:45,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2821/203307 [3:19:03<235:47:22,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2821/203307 [3:19:03<235:47:22,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2822/203307 [3:19:07<235:46:47,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2822/203307 [3:19:07<235:46:47,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2823/203307 [3:19:11<235:46:34,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2823/203307 [3:19:11<235:46:34,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2824/203307 [3:19:15<235:46:04,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2824/203307 [3:19:15<235:46:04,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2825/203307 [3:19:20<235:46:36,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2825/203307 [3:19:20<235:46:36,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2826/203307 [3:19:24<235:46:27,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2826/203307 [3:19:24<235:46:27,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2827/203307 [3:19:28<235:46:13,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2827/203307 [3:19:28<235:46:13,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2828/203307 [3:19:33<235:46:34,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2828/203307 [3:19:33<235:46:35,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2829/203307 [3:19:37<235:46:19,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2829/203307 [3:19:37<235:46:20,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2830/203307 [3:19:41<235:45:55,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2830/203307 [3:19:41<235:45:56,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2831/203307 [3:19:45<235:45:50,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2831/203307 [3:19:45<235:45:50,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2832/203307 [3:19:49<235:45:24,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2832/203307 [3:19:49<235:45:25,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2833/203307 [3:19:54<235:45:51,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2833/203307 [3:19:54<235:45:51,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2834/203307 [3:19:58<235:45:42,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2834/203307 [3:19:58<235:45:42,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2835/203307 [3:20:02<235:45:29,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2835/203307 [3:20:02<235:45:30,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2836/203307 [3:20:07<235:45:52,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2836/203307 [3:20:07<235:45:52,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2837/203307 [3:20:11<235:45:38,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2837/203307 [3:20:11<235:45:38,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2838/203307 [3:20:15<235:45:10,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2838/203307 [3:20:15<235:45:10,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2839/203307 [3:20:19<235:45:01,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2839/203307 [3:20:19<235:45:02,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2840/203307 [3:20:23<235:44:34,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2840/203307 [3:20:23<235:44:35,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2841/203307 [3:20:27<235:44:12,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   1%|▏         | 2841/203307 [3:20:27<235:44:13,  0.24it/s, v_num=t5e6, training/loss=0.113] Epoch 0:   1%|▏         | 2842/203307 [3:20:31<235:44:42,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2842/203307 [3:20:31<235:44:42,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2843/203307 [3:20:36<235:44:52,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2843/203307 [3:20:36<235:44:53,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2844/203307 [3:20:40<235:44:26,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2844/203307 [3:20:40<235:44:27,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2845/203307 [3:20:44<235:44:50,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2845/203307 [3:20:44<235:44:51,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2846/203307 [3:20:48<235:44:21,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2846/203307 [3:20:48<235:44:21,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2847/203307 [3:20:52<235:44:14,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2847/203307 [3:20:52<235:44:14,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2848/203307 [3:20:56<235:43:54,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2848/203307 [3:20:56<235:43:55,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2849/203307 [3:21:00<235:43:36,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2849/203307 [3:21:00<235:43:36,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2850/203307 [3:21:05<235:44:01,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2850/203307 [3:21:05<235:44:01,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2851/203307 [3:21:09<235:43:50,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2851/203307 [3:21:09<235:43:51,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2852/203307 [3:21:13<235:43:39,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2852/203307 [3:21:13<235:43:40,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2853/203307 [3:21:18<235:44:07,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2853/203307 [3:21:18<235:44:08,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2854/203307 [3:21:22<235:43:46,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2854/203307 [3:21:22<235:43:46,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2855/203307 [3:21:26<235:43:41,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2855/203307 [3:21:26<235:43:42,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2856/203307 [3:21:30<235:43:20,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2856/203307 [3:21:30<235:43:21,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2857/203307 [3:21:34<235:42:57,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2857/203307 [3:21:34<235:42:58,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2858/203307 [3:21:39<235:43:26,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2858/203307 [3:21:39<235:43:27,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2859/203307 [3:21:43<235:43:12,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2859/203307 [3:21:43<235:43:13,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2860/203307 [3:21:47<235:42:50,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2860/203307 [3:21:47<235:42:51,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2861/203307 [3:21:52<235:43:11,  0.24it/s, v_num=t5e6, training/loss=0.113]Epoch 0:   1%|▏         | 2861/203307 [3:21:52<235:43:12,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2862/203307 [3:21:56<235:42:50,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2862/203307 [3:21:56<235:42:51,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2863/203307 [3:22:00<235:42:37,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2863/203307 [3:22:00<235:42:37,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2864/203307 [3:22:04<235:42:18,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2864/203307 [3:22:04<235:42:19,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2865/203307 [3:22:08<235:41:43,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2865/203307 [3:22:08<235:41:44,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2866/203307 [3:22:12<235:41:22,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2866/203307 [3:22:12<235:41:23,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2867/203307 [3:22:17<235:42:12,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2867/203307 [3:22:17<235:42:13,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2868/203307 [3:22:21<235:41:57,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2868/203307 [3:22:21<235:41:58,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2869/203307 [3:22:24<235:41:20,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2869/203307 [3:22:24<235:41:21,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2870/203307 [3:22:29<235:42:07,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2870/203307 [3:22:29<235:42:07,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2871/203307 [3:22:33<235:41:53,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2871/203307 [3:22:33<235:41:55,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2872/203307 [3:22:37<235:41:37,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2872/203307 [3:22:37<235:41:38,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2873/203307 [3:22:41<235:41:08,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2873/203307 [3:22:41<235:41:10,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2874/203307 [3:22:45<235:40:41,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2874/203307 [3:22:45<235:40:42,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2875/203307 [3:22:50<235:41:16,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2875/203307 [3:22:50<235:41:16,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2876/203307 [3:22:54<235:40:53,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2876/203307 [3:22:54<235:40:55,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2877/203307 [3:22:58<235:40:27,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2877/203307 [3:22:58<235:40:27,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2878/203307 [3:23:03<235:40:48,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2878/203307 [3:23:03<235:40:48,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2879/203307 [3:23:07<235:41:29,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2879/203307 [3:23:07<235:41:30,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2880/203307 [3:23:11<235:41:01,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2880/203307 [3:23:11<235:41:01,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2881/203307 [3:23:15<235:40:24,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   1%|▏         | 2881/203307 [3:23:15<235:40:25,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2882/203307 [3:23:19<235:39:50,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2882/203307 [3:23:19<235:39:50,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2883/203307 [3:23:24<235:40:38,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2883/203307 [3:23:24<235:40:38,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2884/203307 [3:23:28<235:40:14,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2884/203307 [3:23:28<235:40:15,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2885/203307 [3:23:32<235:39:41,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2885/203307 [3:23:32<235:39:41,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2886/203307 [3:23:36<235:40:01,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2886/203307 [3:23:36<235:40:01,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2887/203307 [3:23:40<235:39:50,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2887/203307 [3:23:40<235:39:50,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2888/203307 [3:23:45<235:39:59,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2888/203307 [3:23:45<235:39:59,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2889/203307 [3:23:49<235:39:27,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2889/203307 [3:23:49<235:39:27,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2890/203307 [3:23:52<235:38:57,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2890/203307 [3:23:52<235:38:57,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2891/203307 [3:23:56<235:38:38,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2891/203307 [3:23:56<235:38:38,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2892/203307 [3:24:01<235:39:20,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2892/203307 [3:24:01<235:39:20,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2893/203307 [3:24:05<235:38:56,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2893/203307 [3:24:05<235:38:56,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2894/203307 [3:24:09<235:38:33,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2894/203307 [3:24:09<235:38:33,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2895/203307 [3:24:14<235:39:08,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2895/203307 [3:24:14<235:39:08,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2896/203307 [3:24:18<235:38:53,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2896/203307 [3:24:18<235:38:53,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2897/203307 [3:24:22<235:38:54,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2897/203307 [3:24:22<235:38:54,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2898/203307 [3:24:26<235:38:34,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2898/203307 [3:24:26<235:38:34,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2899/203307 [3:24:31<235:38:25,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2899/203307 [3:24:31<235:38:25,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2900/203307 [3:24:35<235:38:57,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2900/203307 [3:24:35<235:38:58,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2901/203307 [3:24:39<235:38:36,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   1%|▏         | 2901/203307 [3:24:39<235:38:37,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2902/203307 [3:24:43<235:38:16,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2902/203307 [3:24:43<235:38:16,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2903/203307 [3:24:48<235:38:54,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2903/203307 [3:24:48<235:38:54,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2904/203307 [3:24:52<235:38:31,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2904/203307 [3:24:52<235:38:31,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2905/203307 [3:24:56<235:38:05,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2905/203307 [3:24:56<235:38:05,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2906/203307 [3:25:00<235:38:04,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2906/203307 [3:25:00<235:38:05,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2907/203307 [3:25:05<235:37:52,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2907/203307 [3:25:05<235:37:52,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2908/203307 [3:25:09<235:38:24,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2908/203307 [3:25:09<235:38:25,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2909/203307 [3:25:13<235:38:06,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2909/203307 [3:25:13<235:38:06,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2910/203307 [3:25:17<235:37:51,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2910/203307 [3:25:17<235:37:52,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2911/203307 [3:25:22<235:38:14,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2911/203307 [3:25:22<235:38:14,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2912/203307 [3:25:26<235:37:53,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2912/203307 [3:25:26<235:37:53,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2913/203307 [3:25:30<235:37:38,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2913/203307 [3:25:30<235:37:38,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2914/203307 [3:25:34<235:37:13,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2914/203307 [3:25:34<235:37:14,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2915/203307 [3:25:39<235:37:30,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2915/203307 [3:25:39<235:37:31,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2916/203307 [3:25:42<235:37:04,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2916/203307 [3:25:43<235:37:05,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2917/203307 [3:25:47<235:37:40,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2917/203307 [3:25:47<235:37:41,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2918/203307 [3:25:51<235:37:14,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2918/203307 [3:25:51<235:37:15,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2919/203307 [3:25:55<235:37:05,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2919/203307 [3:25:55<235:37:05,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2920/203307 [3:26:00<235:37:27,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2920/203307 [3:26:00<235:37:28,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2921/203307 [3:26:04<235:37:09,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   1%|▏         | 2921/203307 [3:26:04<235:37:10,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2922/203307 [3:26:08<235:36:55,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2922/203307 [3:26:08<235:36:56,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2923/203307 [3:26:12<235:36:52,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2923/203307 [3:26:12<235:36:52,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2924/203307 [3:26:17<235:36:50,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2924/203307 [3:26:17<235:36:51,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2925/203307 [3:26:21<235:37:28,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2925/203307 [3:26:21<235:37:28,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2926/203307 [3:26:26<235:37:10,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2926/203307 [3:26:26<235:37:10,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2927/203307 [3:26:30<235:37:00,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2927/203307 [3:26:30<235:37:00,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2928/203307 [3:26:34<235:37:23,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2928/203307 [3:26:34<235:37:23,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2929/203307 [3:26:38<235:37:06,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2929/203307 [3:26:38<235:37:07,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2930/203307 [3:26:42<235:36:46,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2930/203307 [3:26:42<235:36:47,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2931/203307 [3:26:47<235:36:37,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2931/203307 [3:26:47<235:36:38,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2932/203307 [3:26:50<235:36:15,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2932/203307 [3:26:50<235:36:15,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2933/203307 [3:26:55<235:36:54,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2933/203307 [3:26:55<235:36:55,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2934/203307 [3:26:59<235:36:35,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2934/203307 [3:26:59<235:36:35,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2935/203307 [3:27:03<235:36:20,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2935/203307 [3:27:03<235:36:20,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2936/203307 [3:27:08<235:36:47,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2936/203307 [3:27:08<235:36:48,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2937/203307 [3:27:12<235:36:29,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2937/203307 [3:27:12<235:36:30,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2938/203307 [3:27:16<235:36:05,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2938/203307 [3:27:16<235:36:06,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2939/203307 [3:27:20<235:35:44,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2939/203307 [3:27:20<235:35:45,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2940/203307 [3:27:24<235:35:19,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2940/203307 [3:27:24<235:35:20,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2941/203307 [3:27:28<235:35:04,  0.24it/s, v_num=t5e6, training/loss=0.118]Epoch 0:   1%|▏         | 2941/203307 [3:27:28<235:35:04,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2942/203307 [3:27:33<235:35:53,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2942/203307 [3:27:33<235:35:53,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2943/203307 [3:27:37<235:35:39,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2943/203307 [3:27:37<235:35:39,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2944/203307 [3:27:41<235:35:18,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2944/203307 [3:27:41<235:35:19,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2945/203307 [3:27:46<235:35:44,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2945/203307 [3:27:46<235:35:44,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2946/203307 [3:27:50<235:35:22,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2946/203307 [3:27:50<235:35:23,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2947/203307 [3:27:54<235:35:06,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2947/203307 [3:27:54<235:35:06,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2948/203307 [3:27:58<235:34:57,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2948/203307 [3:27:58<235:34:57,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2949/203307 [3:28:02<235:34:33,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2949/203307 [3:28:02<235:34:33,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2950/203307 [3:28:07<235:35:01,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2950/203307 [3:28:07<235:35:02,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2951/203307 [3:28:11<235:35:34,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2951/203307 [3:28:12<235:35:35,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2952/203307 [3:28:15<235:35:09,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2952/203307 [3:28:15<235:35:10,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2953/203307 [3:28:20<235:35:27,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2953/203307 [3:28:20<235:35:28,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2954/203307 [3:28:24<235:35:00,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2954/203307 [3:28:24<235:35:01,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2955/203307 [3:28:28<235:34:48,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2955/203307 [3:28:28<235:34:49,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2956/203307 [3:28:32<235:34:32,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2956/203307 [3:28:32<235:34:32,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2957/203307 [3:28:36<235:34:17,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2957/203307 [3:28:36<235:34:18,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2958/203307 [3:28:41<235:34:44,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2958/203307 [3:28:41<235:34:44,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2959/203307 [3:28:45<235:34:42,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2959/203307 [3:28:45<235:34:43,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2960/203307 [3:28:49<235:34:39,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2960/203307 [3:28:49<235:34:39,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2961/203307 [3:28:54<235:34:57,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   1%|▏         | 2961/203307 [3:28:54<235:34:57,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2962/203307 [3:28:58<235:34:28,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2962/203307 [3:28:58<235:34:28,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2963/203307 [3:29:02<235:34:17,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2963/203307 [3:29:02<235:34:18,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2964/203307 [3:29:06<235:33:54,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2964/203307 [3:29:06<235:33:55,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2965/203307 [3:29:10<235:33:32,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2965/203307 [3:29:10<235:33:32,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2966/203307 [3:29:14<235:33:03,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2966/203307 [3:29:14<235:33:04,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2967/203307 [3:29:19<235:33:56,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2967/203307 [3:29:19<235:33:56,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2968/203307 [3:29:23<235:33:30,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2968/203307 [3:29:23<235:33:31,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2969/203307 [3:29:27<235:33:31,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2969/203307 [3:29:27<235:33:32,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2970/203307 [3:29:31<235:33:42,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2970/203307 [3:29:31<235:33:43,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2971/203307 [3:29:36<235:33:30,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2971/203307 [3:29:36<235:33:31,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2972/203307 [3:29:40<235:33:06,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2972/203307 [3:29:40<235:33:07,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2973/203307 [3:29:44<235:32:55,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2973/203307 [3:29:44<235:32:56,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2974/203307 [3:29:47<235:32:22,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2974/203307 [3:29:47<235:32:22,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2975/203307 [3:29:52<235:32:55,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2975/203307 [3:29:52<235:32:56,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2976/203307 [3:29:56<235:32:43,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2976/203307 [3:29:56<235:32:43,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2977/203307 [3:30:00<235:32:23,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2977/203307 [3:30:00<235:32:23,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2978/203307 [3:30:05<235:32:29,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2978/203307 [3:30:05<235:32:29,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2979/203307 [3:30:09<235:32:22,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2979/203307 [3:30:09<235:32:23,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2980/203307 [3:30:13<235:32:01,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2980/203307 [3:30:13<235:32:02,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2981/203307 [3:30:17<235:31:40,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   1%|▏         | 2981/203307 [3:30:17<235:31:41,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2982/203307 [3:30:21<235:31:02,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2982/203307 [3:30:21<235:31:02,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2983/203307 [3:30:25<235:31:37,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2983/203307 [3:30:25<235:31:38,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2984/203307 [3:30:29<235:31:14,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2984/203307 [3:30:29<235:31:15,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2985/203307 [3:30:33<235:30:58,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2985/203307 [3:30:33<235:30:59,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2986/203307 [3:30:38<235:31:05,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2986/203307 [3:30:38<235:31:06,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2987/203307 [3:30:42<235:31:22,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2987/203307 [3:30:42<235:31:22,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2988/203307 [3:30:46<235:30:48,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2988/203307 [3:30:46<235:30:49,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2989/203307 [3:30:50<235:30:42,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2989/203307 [3:30:50<235:30:42,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2990/203307 [3:30:54<235:30:07,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2990/203307 [3:30:54<235:30:08,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2991/203307 [3:30:58<235:29:47,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2991/203307 [3:30:58<235:29:47,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2992/203307 [3:31:03<235:30:14,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2992/203307 [3:31:03<235:30:15,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2993/203307 [3:31:07<235:29:58,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2993/203307 [3:31:07<235:29:58,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2994/203307 [3:31:11<235:29:21,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2994/203307 [3:31:11<235:29:21,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2995/203307 [3:31:15<235:29:39,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2995/203307 [3:31:15<235:29:40,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2996/203307 [3:31:19<235:29:32,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2996/203307 [3:31:19<235:29:32,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2997/203307 [3:31:24<235:29:20,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2997/203307 [3:31:24<235:29:21,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2998/203307 [3:31:27<235:28:45,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2998/203307 [3:31:27<235:28:45,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2999/203307 [3:31:31<235:28:28,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 2999/203307 [3:31:31<235:28:28,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 3000/203307 [3:31:36<235:28:44,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 3000/203307 [3:31:36<235:28:44,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 3001/203307 [3:31:40<235:28:27,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 3001/203307 [3:31:40<235:28:28,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3002/203307 [3:31:44<235:27:50,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3002/203307 [3:31:44<235:27:51,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3003/203307 [3:31:48<235:28:11,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3003/203307 [3:31:48<235:28:11,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3004/203307 [3:31:52<235:27:36,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3004/203307 [3:31:52<235:27:36,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3005/203307 [3:31:56<235:27:34,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3005/203307 [3:31:56<235:27:35,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3006/203307 [3:32:00<235:27:04,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3006/203307 [3:32:00<235:27:05,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3007/203307 [3:32:04<235:26:43,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3007/203307 [3:32:04<235:26:43,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3008/203307 [3:32:09<235:27:01,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3008/203307 [3:32:09<235:27:01,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3009/203307 [3:32:13<235:26:48,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3009/203307 [3:32:13<235:26:49,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3010/203307 [3:32:17<235:26:17,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3010/203307 [3:32:17<235:26:17,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3011/203307 [3:32:21<235:26:41,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3011/203307 [3:32:21<235:26:42,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3012/203307 [3:32:25<235:26:13,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3012/203307 [3:32:25<235:26:14,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3013/203307 [3:32:29<235:25:58,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3013/203307 [3:32:29<235:25:58,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3014/203307 [3:32:34<235:25:58,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3014/203307 [3:32:34<235:25:59,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3015/203307 [3:32:38<235:25:47,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3015/203307 [3:32:38<235:25:47,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3016/203307 [3:32:41<235:25:09,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3016/203307 [3:32:41<235:25:09,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3017/203307 [3:32:46<235:25:42,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3017/203307 [3:32:46<235:25:43,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3018/203307 [3:32:50<235:25:03,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3018/203307 [3:32:50<235:25:04,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3019/203307 [3:32:54<235:24:41,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3019/203307 [3:32:54<235:24:42,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3020/203307 [3:32:58<235:24:43,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3020/203307 [3:32:58<235:24:43,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3021/203307 [3:33:02<235:24:26,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   1%|▏         | 3021/203307 [3:33:02<235:24:27,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3022/203307 [3:33:06<235:23:45,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3022/203307 [3:33:06<235:23:46,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3023/203307 [3:33:10<235:24:02,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3023/203307 [3:33:10<235:24:02,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3024/203307 [3:33:14<235:23:19,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3024/203307 [3:33:14<235:23:20,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3025/203307 [3:33:19<235:23:45,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3025/203307 [3:33:19<235:23:46,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3026/203307 [3:33:23<235:23:54,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3026/203307 [3:33:23<235:23:55,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3027/203307 [3:33:27<235:23:30,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3027/203307 [3:33:27<235:23:31,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3028/203307 [3:33:31<235:23:30,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3028/203307 [3:33:31<235:23:31,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3029/203307 [3:33:35<235:23:11,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3029/203307 [3:33:35<235:23:11,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3030/203307 [3:33:39<235:22:29,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3030/203307 [3:33:39<235:22:30,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3031/203307 [3:33:43<235:22:14,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3031/203307 [3:33:43<235:22:15,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3032/203307 [3:33:47<235:22:15,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3032/203307 [3:33:47<235:22:16,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3033/203307 [3:33:52<235:22:45,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3033/203307 [3:33:52<235:22:46,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3034/203307 [3:33:57<235:22:59,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3034/203307 [3:33:57<235:23:00,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3035/203307 [3:34:01<235:22:41,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3035/203307 [3:34:01<235:22:41,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3036/203307 [3:34:05<235:22:44,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3036/203307 [3:34:05<235:22:44,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3037/203307 [3:34:09<235:22:26,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3037/203307 [3:34:09<235:22:27,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3038/203307 [3:34:13<235:21:52,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3038/203307 [3:34:13<235:21:53,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3039/203307 [3:34:17<235:21:34,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3039/203307 [3:34:17<235:21:35,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3040/203307 [3:34:21<235:20:57,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3040/203307 [3:34:21<235:20:58,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3041/203307 [3:34:25<235:21:01,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   1%|▏         | 3041/203307 [3:34:25<235:21:01,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 3042/203307 [3:34:30<235:21:17,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 3042/203307 [3:34:30<235:21:18,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 3043/203307 [3:34:34<235:21:44,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 3043/203307 [3:34:34<235:21:45,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 3044/203307 [3:34:38<235:21:13,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 3044/203307 [3:34:38<235:21:13,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 3045/203307 [3:34:43<235:21:38,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 3045/203307 [3:34:43<235:21:38,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 3046/203307 [3:34:46<235:21:01,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 3046/203307 [3:34:46<235:21:02,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 3047/203307 [3:34:51<235:20:44,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 3047/203307 [3:34:51<235:20:45,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 3048/203307 [3:34:54<235:20:15,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 3048/203307 [3:34:54<235:20:15,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 3049/203307 [3:34:58<235:19:55,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   1%|▏         | 3049/203307 [3:34:58<235:19:56,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3050/203307 [3:35:03<235:20:01,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3050/203307 [3:35:03<235:20:02,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3051/203307 [3:35:07<235:19:43,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3051/203307 [3:35:07<235:19:44,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3052/203307 [3:35:11<235:19:51,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3052/203307 [3:35:11<235:19:52,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3053/203307 [3:35:16<235:20:15,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3053/203307 [3:35:16<235:20:15,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3054/203307 [3:35:20<235:19:43,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3054/203307 [3:35:20<235:19:43,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3055/203307 [3:35:24<235:19:25,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3055/203307 [3:35:24<235:19:25,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3056/203307 [3:35:27<235:18:53,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3056/203307 [3:35:27<235:18:54,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3057/203307 [3:35:32<235:18:39,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3057/203307 [3:35:32<235:18:40,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3058/203307 [3:35:36<235:18:56,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3058/203307 [3:35:36<235:18:57,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3059/203307 [3:35:41<235:19:12,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3059/203307 [3:35:41<235:19:13,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3060/203307 [3:35:45<235:19:20,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3060/203307 [3:35:45<235:19:20,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3061/203307 [3:35:50<235:19:47,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3061/203307 [3:35:50<235:19:47,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3062/203307 [3:35:54<235:19:14,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3062/203307 [3:35:54<235:19:14,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3063/203307 [3:35:58<235:18:57,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3063/203307 [3:35:58<235:18:57,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3064/203307 [3:36:01<235:18:27,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3064/203307 [3:36:01<235:18:28,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3065/203307 [3:36:05<235:18:11,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3065/203307 [3:36:05<235:18:11,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3066/203307 [3:36:09<235:17:34,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3066/203307 [3:36:09<235:17:35,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3067/203307 [3:36:14<235:17:58,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3067/203307 [3:36:14<235:17:59,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3068/203307 [3:36:18<235:17:57,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3068/203307 [3:36:18<235:17:57,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3069/203307 [3:36:23<235:18:24,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3069/203307 [3:36:23<235:18:25,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3070/203307 [3:36:27<235:18:32,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3070/203307 [3:36:27<235:18:32,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3071/203307 [3:36:31<235:18:11,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3071/203307 [3:36:31<235:18:11,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3072/203307 [3:36:35<235:17:34,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3072/203307 [3:36:35<235:17:35,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3073/203307 [3:36:39<235:17:17,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3073/203307 [3:36:39<235:17:18,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3074/203307 [3:36:43<235:16:44,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3074/203307 [3:36:43<235:16:44,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3075/203307 [3:36:47<235:17:09,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3075/203307 [3:36:47<235:17:09,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3076/203307 [3:36:51<235:16:33,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3076/203307 [3:36:51<235:16:34,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3077/203307 [3:36:55<235:16:29,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3077/203307 [3:36:55<235:16:29,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3078/203307 [3:37:00<235:16:41,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3078/203307 [3:37:00<235:16:42,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3079/203307 [3:37:04<235:16:20,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3079/203307 [3:37:04<235:16:21,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3080/203307 [3:37:08<235:15:47,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3080/203307 [3:37:08<235:15:48,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3081/203307 [3:37:12<235:15:25,  0.24it/s, v_num=t5e6, training/loss=0.120]Epoch 0:   2%|▏         | 3081/203307 [3:37:12<235:15:26,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3082/203307 [3:37:16<235:14:56,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3082/203307 [3:37:16<235:14:57,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3083/203307 [3:37:20<235:15:23,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3083/203307 [3:37:20<235:15:23,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3084/203307 [3:37:24<235:14:53,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3084/203307 [3:37:24<235:14:53,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3085/203307 [3:37:28<235:14:36,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3085/203307 [3:37:28<235:14:37,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3086/203307 [3:37:33<235:14:53,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3086/203307 [3:37:33<235:14:54,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3087/203307 [3:37:37<235:14:34,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3087/203307 [3:37:37<235:14:34,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3088/203307 [3:37:40<235:14:04,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3088/203307 [3:37:40<235:14:04,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3089/203307 [3:37:45<235:13:53,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3089/203307 [3:37:45<235:13:53,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3090/203307 [3:37:48<235:13:18,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3090/203307 [3:37:48<235:13:19,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3091/203307 [3:37:52<235:12:59,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3091/203307 [3:37:52<235:13:00,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3092/203307 [3:37:57<235:13:21,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3092/203307 [3:37:57<235:13:22,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3093/203307 [3:38:01<235:13:03,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3093/203307 [3:38:01<235:13:03,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3094/203307 [3:38:05<235:12:35,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3094/203307 [3:38:05<235:12:36,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3095/203307 [3:38:10<235:13:14,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3095/203307 [3:38:10<235:13:14,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3096/203307 [3:38:14<235:12:41,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3096/203307 [3:38:14<235:12:41,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3097/203307 [3:38:18<235:12:26,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3097/203307 [3:38:18<235:12:27,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3098/203307 [3:38:21<235:11:50,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3098/203307 [3:38:21<235:11:50,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3099/203307 [3:38:25<235:11:27,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3099/203307 [3:38:25<235:11:28,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3100/203307 [3:38:30<235:11:42,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3100/203307 [3:38:30<235:11:42,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3101/203307 [3:38:34<235:11:25,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3101/203307 [3:38:34<235:11:25,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3102/203307 [3:38:38<235:10:52,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3102/203307 [3:38:38<235:10:53,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3103/203307 [3:38:42<235:11:11,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3103/203307 [3:38:42<235:11:12,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3104/203307 [3:38:47<235:11:25,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3104/203307 [3:38:47<235:11:26,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3105/203307 [3:38:51<235:11:04,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3105/203307 [3:38:51<235:11:04,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3106/203307 [3:38:54<235:10:32,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3106/203307 [3:38:55<235:10:32,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3107/203307 [3:38:59<235:10:14,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3107/203307 [3:38:59<235:10:15,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3108/203307 [3:39:03<235:10:31,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3108/203307 [3:39:03<235:10:31,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3109/203307 [3:39:07<235:10:13,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3109/203307 [3:39:07<235:10:13,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3110/203307 [3:39:11<235:09:40,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3110/203307 [3:39:11<235:09:40,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3111/203307 [3:39:15<235:09:59,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3111/203307 [3:39:15<235:10:00,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3112/203307 [3:39:20<235:10:15,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3112/203307 [3:39:20<235:10:15,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3113/203307 [3:39:24<235:10:13,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3113/203307 [3:39:24<235:10:13,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3114/203307 [3:39:28<235:09:39,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3114/203307 [3:39:28<235:09:39,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3115/203307 [3:39:32<235:09:19,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3115/203307 [3:39:32<235:09:19,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3116/203307 [3:39:36<235:08:43,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3116/203307 [3:39:36<235:08:44,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3117/203307 [3:39:40<235:09:10,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3117/203307 [3:39:40<235:09:11,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3118/203307 [3:39:44<235:08:32,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3118/203307 [3:39:44<235:08:32,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3119/203307 [3:39:48<235:08:10,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3119/203307 [3:39:48<235:08:10,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3120/203307 [3:39:53<235:08:17,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3120/203307 [3:39:53<235:08:18,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3121/203307 [3:39:57<235:08:45,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3121/203307 [3:39:57<235:08:45,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3122/203307 [3:40:02<235:08:42,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3122/203307 [3:40:02<235:08:43,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3123/203307 [3:40:05<235:08:20,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3123/203307 [3:40:05<235:08:21,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3124/203307 [3:40:09<235:07:41,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3124/203307 [3:40:09<235:07:42,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3125/203307 [3:40:14<235:08:11,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3125/203307 [3:40:14<235:08:12,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3126/203307 [3:40:18<235:07:40,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3126/203307 [3:40:18<235:07:41,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3127/203307 [3:40:22<235:07:22,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3127/203307 [3:40:22<235:07:22,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3128/203307 [3:40:26<235:07:24,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3128/203307 [3:40:26<235:07:24,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3129/203307 [3:40:30<235:07:12,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3129/203307 [3:40:30<235:07:13,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3130/203307 [3:40:35<235:07:25,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3130/203307 [3:40:35<235:07:25,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3131/203307 [3:40:39<235:07:39,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3131/203307 [3:40:39<235:07:40,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3132/203307 [3:40:43<235:06:59,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3132/203307 [3:40:43<235:07:00,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3133/203307 [3:40:48<235:07:28,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3133/203307 [3:40:48<235:07:29,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3134/203307 [3:40:51<235:06:55,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3134/203307 [3:40:51<235:06:55,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3135/203307 [3:40:55<235:06:35,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3135/203307 [3:40:55<235:06:36,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3136/203307 [3:41:00<235:06:38,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3136/203307 [3:41:00<235:06:39,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3137/203307 [3:41:04<235:06:19,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3137/203307 [3:41:04<235:06:20,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3138/203307 [3:41:08<235:06:24,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3138/203307 [3:41:08<235:06:24,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3139/203307 [3:41:12<235:06:03,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3139/203307 [3:41:12<235:06:04,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3140/203307 [3:41:16<235:05:54,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3140/203307 [3:41:16<235:05:55,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3141/203307 [3:41:20<235:05:39,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3141/203307 [3:41:20<235:05:39,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3142/203307 [3:41:25<235:05:57,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3142/203307 [3:41:25<235:05:57,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3143/203307 [3:41:29<235:05:39,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3143/203307 [3:41:29<235:05:39,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3144/203307 [3:41:33<235:05:11,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3144/203307 [3:41:33<235:05:11,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3145/203307 [3:41:37<235:05:29,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3145/203307 [3:41:37<235:05:29,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3146/203307 [3:41:41<235:04:57,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3146/203307 [3:41:41<235:04:58,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3147/203307 [3:41:46<235:05:25,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3147/203307 [3:41:46<235:05:25,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3148/203307 [3:41:50<235:04:49,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3148/203307 [3:41:50<235:04:50,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3149/203307 [3:41:54<235:04:45,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3149/203307 [3:41:54<235:04:45,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3150/203307 [3:41:58<235:04:55,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3150/203307 [3:41:58<235:04:56,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3151/203307 [3:42:02<235:04:38,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3151/203307 [3:42:02<235:04:39,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3152/203307 [3:42:06<235:04:11,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3152/203307 [3:42:06<235:04:12,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3153/203307 [3:42:11<235:04:31,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3153/203307 [3:42:11<235:04:32,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3154/203307 [3:42:14<235:03:52,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3154/203307 [3:42:14<235:03:53,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3155/203307 [3:42:18<235:03:36,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3155/203307 [3:42:18<235:03:37,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3156/203307 [3:42:23<235:03:50,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3156/203307 [3:42:23<235:03:50,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3157/203307 [3:42:27<235:03:25,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3157/203307 [3:42:27<235:03:26,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3158/203307 [3:42:31<235:03:41,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3158/203307 [3:42:31<235:03:41,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3159/203307 [3:42:35<235:03:24,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3159/203307 [3:42:35<235:03:25,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3160/203307 [3:42:39<235:02:54,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3160/203307 [3:42:39<235:02:54,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3161/203307 [3:42:44<235:03:19,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 3161/203307 [3:42:44<235:03:19,  0.24it/s, v_num=t5e6, training/loss=0.103] Epoch 0:   2%|▏         | 3162/203307 [3:42:48<235:02:53,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3162/203307 [3:42:48<235:02:53,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3163/203307 [3:42:52<235:02:30,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3163/203307 [3:42:52<235:02:30,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3164/203307 [3:42:56<235:02:45,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3164/203307 [3:42:56<235:02:45,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3165/203307 [3:43:00<235:02:31,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3165/203307 [3:43:00<235:02:32,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3166/203307 [3:43:04<235:01:59,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3166/203307 [3:43:04<235:01:59,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3167/203307 [3:43:09<235:02:24,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3167/203307 [3:43:09<235:02:25,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3168/203307 [3:43:13<235:01:50,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3168/203307 [3:43:13<235:01:51,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3169/203307 [3:43:17<235:01:35,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3169/203307 [3:43:17<235:01:36,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3170/203307 [3:43:21<235:01:42,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3170/203307 [3:43:21<235:01:43,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3171/203307 [3:43:25<235:01:27,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3171/203307 [3:43:25<235:01:28,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3172/203307 [3:43:29<235:00:58,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3172/203307 [3:43:29<235:00:58,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3173/203307 [3:43:34<235:01:28,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3173/203307 [3:43:34<235:01:29,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3174/203307 [3:43:38<235:00:57,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3174/203307 [3:43:38<235:00:57,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3175/203307 [3:43:42<235:01:15,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3175/203307 [3:43:42<235:01:16,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3176/203307 [3:43:46<235:01:14,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3176/203307 [3:43:46<235:01:14,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3177/203307 [3:43:50<235:00:59,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3177/203307 [3:43:50<235:01:00,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3178/203307 [3:43:55<235:01:04,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3178/203307 [3:43:55<235:01:05,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3179/203307 [3:43:59<235:00:44,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3179/203307 [3:43:59<235:00:45,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3180/203307 [3:44:03<235:00:11,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3180/203307 [3:44:03<235:00:12,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3181/203307 [3:44:07<235:00:00,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3181/203307 [3:44:07<235:00:00,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3182/203307 [3:44:11<235:00:12,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3182/203307 [3:44:11<235:00:12,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3183/203307 [3:44:16<235:00:36,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3183/203307 [3:44:16<235:00:37,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3184/203307 [3:44:20<235:00:05,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3184/203307 [3:44:20<235:00:06,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3185/203307 [3:44:24<235:00:10,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3185/203307 [3:44:24<235:00:10,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3186/203307 [3:44:28<235:00:14,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3186/203307 [3:44:28<235:00:14,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3187/203307 [3:44:32<234:59:53,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3187/203307 [3:44:32<234:59:53,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3188/203307 [3:44:36<234:59:24,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3188/203307 [3:44:36<234:59:24,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3189/203307 [3:44:40<234:59:11,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3189/203307 [3:44:40<234:59:11,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3190/203307 [3:44:45<234:59:19,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3190/203307 [3:44:45<234:59:20,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3191/203307 [3:44:49<234:58:58,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3191/203307 [3:44:49<234:58:59,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3192/203307 [3:44:53<234:59:13,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3192/203307 [3:44:53<234:59:14,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3193/203307 [3:44:57<234:59:05,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3193/203307 [3:44:57<234:59:05,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3194/203307 [3:45:02<234:59:03,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3194/203307 [3:45:02<234:59:04,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3195/203307 [3:45:06<234:59:19,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3195/203307 [3:45:06<234:59:20,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3196/203307 [3:45:10<234:58:46,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3196/203307 [3:45:10<234:58:46,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3197/203307 [3:45:14<234:58:36,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3197/203307 [3:45:14<234:58:36,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3198/203307 [3:45:18<234:58:08,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3198/203307 [3:45:18<234:58:09,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3199/203307 [3:45:23<234:58:39,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3199/203307 [3:45:23<234:58:39,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3200/203307 [3:45:27<234:58:47,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3200/203307 [3:45:27<234:58:47,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3201/203307 [3:45:31<234:58:32,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3201/203307 [3:45:31<234:58:33,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3202/203307 [3:45:35<234:57:58,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3202/203307 [3:45:35<234:57:59,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3203/203307 [3:45:40<234:58:19,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3203/203307 [3:45:40<234:58:19,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3204/203307 [3:45:43<234:57:53,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3204/203307 [3:45:43<234:57:53,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3205/203307 [3:45:48<234:57:41,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3205/203307 [3:45:48<234:57:42,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3206/203307 [3:45:51<234:57:05,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3206/203307 [3:45:51<234:57:06,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3207/203307 [3:45:55<234:56:40,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3207/203307 [3:45:55<234:56:41,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3208/203307 [3:46:00<234:56:57,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3208/203307 [3:46:00<234:56:58,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3209/203307 [3:46:04<234:56:44,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3209/203307 [3:46:04<234:56:44,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3210/203307 [3:46:08<234:56:22,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3210/203307 [3:46:08<234:56:22,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3211/203307 [3:46:12<234:56:32,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3211/203307 [3:46:12<234:56:32,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3212/203307 [3:46:16<234:56:24,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3212/203307 [3:46:16<234:56:24,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3213/203307 [3:46:20<234:56:11,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3213/203307 [3:46:20<234:56:12,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3214/203307 [3:46:24<234:55:43,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3214/203307 [3:46:24<234:55:43,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3215/203307 [3:46:28<234:55:23,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3215/203307 [3:46:28<234:55:23,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3216/203307 [3:46:33<234:55:30,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3216/203307 [3:46:33<234:55:31,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3217/203307 [3:46:37<234:55:52,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3217/203307 [3:46:37<234:55:52,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3218/203307 [3:46:41<234:55:24,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3218/203307 [3:46:41<234:55:24,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3219/203307 [3:46:45<234:54:53,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3219/203307 [3:46:45<234:54:54,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3220/203307 [3:46:49<234:55:04,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3220/203307 [3:46:49<234:55:04,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3221/203307 [3:46:54<234:55:05,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3221/203307 [3:46:54<234:55:06,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3222/203307 [3:46:58<234:54:36,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3222/203307 [3:46:58<234:54:36,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3223/203307 [3:47:01<234:54:01,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3223/203307 [3:47:01<234:54:01,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3224/203307 [3:47:05<234:53:24,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3224/203307 [3:47:05<234:53:24,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3225/203307 [3:47:10<234:53:55,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3225/203307 [3:47:10<234:53:55,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3226/203307 [3:47:14<234:53:20,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3226/203307 [3:47:14<234:53:20,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3227/203307 [3:47:17<234:52:44,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3227/203307 [3:47:17<234:52:45,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3228/203307 [3:47:22<234:52:50,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3228/203307 [3:47:22<234:52:51,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3229/203307 [3:47:26<234:52:36,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3229/203307 [3:47:26<234:52:37,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3230/203307 [3:47:30<234:52:38,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3230/203307 [3:47:30<234:52:38,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3231/203307 [3:47:34<234:52:08,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3231/203307 [3:47:34<234:52:08,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3232/203307 [3:47:38<234:51:37,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3232/203307 [3:47:38<234:51:38,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3233/203307 [3:47:42<234:52:05,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3233/203307 [3:47:42<234:52:05,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3234/203307 [3:47:47<234:52:19,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3234/203307 [3:47:47<234:52:19,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3235/203307 [3:47:51<234:51:48,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3235/203307 [3:47:51<234:51:49,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3236/203307 [3:47:55<234:51:52,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3236/203307 [3:47:55<234:51:53,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3237/203307 [3:47:59<234:51:31,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3237/203307 [3:47:59<234:51:32,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3238/203307 [3:48:03<234:51:03,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3238/203307 [3:48:03<234:51:04,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3239/203307 [3:48:07<234:50:58,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3239/203307 [3:48:07<234:50:58,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3240/203307 [3:48:11<234:50:27,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3240/203307 [3:48:11<234:50:28,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3241/203307 [3:48:15<234:50:07,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3241/203307 [3:48:15<234:50:08,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3242/203307 [3:48:19<234:50:25,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3242/203307 [3:48:19<234:50:26,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3243/203307 [3:48:23<234:49:57,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3243/203307 [3:48:23<234:49:57,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3244/203307 [3:48:27<234:49:24,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3244/203307 [3:48:27<234:49:25,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3245/203307 [3:48:32<234:49:44,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3245/203307 [3:48:32<234:49:45,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3246/203307 [3:48:35<234:49:08,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3246/203307 [3:48:35<234:49:08,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3247/203307 [3:48:39<234:48:30,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3247/203307 [3:48:39<234:48:31,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3248/203307 [3:48:43<234:48:30,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3248/203307 [3:48:43<234:48:31,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3249/203307 [3:48:47<234:48:06,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3249/203307 [3:48:47<234:48:06,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3250/203307 [3:48:52<234:48:13,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3250/203307 [3:48:52<234:48:14,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3251/203307 [3:48:56<234:48:21,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3251/203307 [3:48:56<234:48:21,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3252/203307 [3:49:00<234:47:43,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3252/203307 [3:49:00<234:47:43,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3253/203307 [3:49:04<234:47:57,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3253/203307 [3:49:04<234:47:58,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3254/203307 [3:49:08<234:47:27,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3254/203307 [3:49:08<234:47:28,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3255/203307 [3:49:12<234:46:51,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3255/203307 [3:49:12<234:46:52,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3256/203307 [3:49:15<234:46:17,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3256/203307 [3:49:15<234:46:17,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3257/203307 [3:49:20<234:46:12,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3257/203307 [3:49:20<234:46:12,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3258/203307 [3:49:24<234:46:21,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3258/203307 [3:49:24<234:46:21,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3259/203307 [3:49:28<234:45:49,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3259/203307 [3:49:28<234:45:50,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3260/203307 [3:49:32<234:45:59,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3260/203307 [3:49:32<234:46:00,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3261/203307 [3:49:37<234:46:14,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3261/203307 [3:49:37<234:46:15,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3262/203307 [3:49:41<234:45:43,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3262/203307 [3:49:41<234:45:44,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3263/203307 [3:49:45<234:45:16,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3263/203307 [3:49:45<234:45:17,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3264/203307 [3:49:49<234:44:57,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3264/203307 [3:49:49<234:44:57,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3265/203307 [3:49:52<234:44:30,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3265/203307 [3:49:52<234:44:30,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3266/203307 [3:49:57<234:44:27,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3266/203307 [3:49:57<234:44:27,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3267/203307 [3:50:01<234:44:36,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3267/203307 [3:50:01<234:44:37,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3268/203307 [3:50:06<234:44:45,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3268/203307 [3:50:06<234:44:46,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3269/203307 [3:50:09<234:44:26,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3269/203307 [3:50:10<234:44:27,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3270/203307 [3:50:14<234:44:37,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3270/203307 [3:50:14<234:44:37,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3271/203307 [3:50:18<234:44:05,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3271/203307 [3:50:18<234:44:06,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3272/203307 [3:50:22<234:43:40,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3272/203307 [3:50:22<234:43:41,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3273/203307 [3:50:26<234:43:33,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3273/203307 [3:50:26<234:43:33,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3274/203307 [3:50:30<234:43:03,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3274/203307 [3:50:30<234:43:03,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3275/203307 [3:50:34<234:43:13,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3275/203307 [3:50:34<234:43:13,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3276/203307 [3:50:38<234:42:49,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3276/203307 [3:50:38<234:42:50,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3277/203307 [3:50:43<234:43:13,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3277/203307 [3:50:43<234:43:14,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3278/203307 [3:50:47<234:43:12,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3278/203307 [3:50:47<234:43:13,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3279/203307 [3:50:51<234:42:43,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3279/203307 [3:50:51<234:42:43,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3280/203307 [3:50:54<234:42:11,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3280/203307 [3:50:55<234:42:11,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3281/203307 [3:50:59<234:42:00,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   2%|▏         | 3281/203307 [3:50:59<234:42:00,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3282/203307 [3:51:02<234:41:30,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3282/203307 [3:51:02<234:41:30,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3283/203307 [3:51:07<234:41:48,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3283/203307 [3:51:07<234:41:48,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3284/203307 [3:51:11<234:41:41,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3284/203307 [3:51:11<234:41:41,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3285/203307 [3:51:15<234:41:19,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3285/203307 [3:51:15<234:41:19,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3286/203307 [3:51:20<234:41:41,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3286/203307 [3:51:20<234:41:41,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3287/203307 [3:51:24<234:41:14,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3287/203307 [3:51:24<234:41:15,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3288/203307 [3:51:27<234:40:44,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3288/203307 [3:51:27<234:40:44,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3289/203307 [3:51:31<234:40:28,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3289/203307 [3:51:31<234:40:28,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3290/203307 [3:51:35<234:39:59,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3290/203307 [3:51:35<234:40:00,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3291/203307 [3:51:39<234:39:29,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3291/203307 [3:51:39<234:39:29,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3292/203307 [3:51:44<234:39:50,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3292/203307 [3:51:44<234:39:50,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3293/203307 [3:51:48<234:39:46,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3293/203307 [3:51:48<234:39:47,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3294/203307 [3:51:52<234:39:58,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3294/203307 [3:51:52<234:39:58,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3295/203307 [3:51:57<234:40:08,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3295/203307 [3:51:57<234:40:08,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3296/203307 [3:52:01<234:39:37,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3296/203307 [3:52:01<234:39:37,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3297/203307 [3:52:05<234:39:20,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3297/203307 [3:52:05<234:39:21,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3298/203307 [3:52:09<234:38:56,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3298/203307 [3:52:09<234:38:57,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3299/203307 [3:52:12<234:38:28,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3299/203307 [3:52:12<234:38:28,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3300/203307 [3:52:17<234:38:48,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3300/203307 [3:52:17<234:38:48,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3301/203307 [3:52:21<234:38:34,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   2%|▏         | 3301/203307 [3:52:21<234:38:34,  0.24it/s, v_num=t5e6, training/loss=0.103] Epoch 0:   2%|▏         | 3302/203307 [3:52:25<234:38:26,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3302/203307 [3:52:25<234:38:26,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3303/203307 [3:52:30<234:38:40,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3303/203307 [3:52:30<234:38:40,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3304/203307 [3:52:34<234:38:12,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3304/203307 [3:52:34<234:38:12,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3305/203307 [3:52:38<234:37:54,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3305/203307 [3:52:38<234:37:54,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3306/203307 [3:52:41<234:37:21,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3306/203307 [3:52:41<234:37:21,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3307/203307 [3:52:45<234:36:45,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3307/203307 [3:52:45<234:36:46,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3308/203307 [3:52:50<234:36:59,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3308/203307 [3:52:50<234:36:59,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3309/203307 [3:52:54<234:36:45,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3309/203307 [3:52:54<234:36:45,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3310/203307 [3:52:57<234:36:16,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3310/203307 [3:52:57<234:36:17,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3311/203307 [3:53:02<234:36:28,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3311/203307 [3:53:02<234:36:28,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3312/203307 [3:53:06<234:36:38,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3312/203307 [3:53:06<234:36:39,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3313/203307 [3:53:10<234:36:20,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3313/203307 [3:53:10<234:36:21,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3314/203307 [3:53:14<234:35:48,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3314/203307 [3:53:14<234:35:49,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3315/203307 [3:53:18<234:35:27,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3315/203307 [3:53:18<234:35:28,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3316/203307 [3:53:22<234:34:56,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3316/203307 [3:53:22<234:34:57,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3317/203307 [3:53:27<234:35:22,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3317/203307 [3:53:27<234:35:23,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3318/203307 [3:53:30<234:34:55,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3318/203307 [3:53:30<234:34:55,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3319/203307 [3:53:34<234:34:25,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3319/203307 [3:53:34<234:34:26,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3320/203307 [3:53:39<234:34:41,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3320/203307 [3:53:39<234:34:42,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3321/203307 [3:53:43<234:34:26,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3321/203307 [3:53:43<234:34:27,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3322/203307 [3:53:47<234:33:57,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3322/203307 [3:53:47<234:33:58,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3323/203307 [3:53:51<234:33:36,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3323/203307 [3:53:51<234:33:36,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3324/203307 [3:53:54<234:33:06,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3324/203307 [3:53:54<234:33:07,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3325/203307 [3:53:59<234:33:32,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3325/203307 [3:53:59<234:33:33,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3326/203307 [3:54:03<234:33:09,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3326/203307 [3:54:03<234:33:09,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3327/203307 [3:54:07<234:32:39,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3327/203307 [3:54:07<234:32:40,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3328/203307 [3:54:11<234:32:48,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3328/203307 [3:54:11<234:32:48,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3329/203307 [3:54:16<234:33:19,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3329/203307 [3:54:16<234:33:20,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3330/203307 [3:54:20<234:32:49,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3330/203307 [3:54:20<234:32:49,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3331/203307 [3:54:24<234:32:15,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3331/203307 [3:54:24<234:32:16,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3332/203307 [3:54:27<234:31:39,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3332/203307 [3:54:27<234:31:40,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3333/203307 [3:54:32<234:32:06,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3333/203307 [3:54:32<234:32:06,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3334/203307 [3:54:36<234:31:33,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3334/203307 [3:54:36<234:31:33,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3335/203307 [3:54:39<234:30:58,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3335/203307 [3:54:39<234:30:59,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3336/203307 [3:54:44<234:30:58,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3336/203307 [3:54:44<234:30:59,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3337/203307 [3:54:48<234:30:47,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3337/203307 [3:54:48<234:30:47,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3338/203307 [3:54:52<234:30:56,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3338/203307 [3:54:52<234:30:56,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3339/203307 [3:54:56<234:30:21,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3339/203307 [3:54:56<234:30:21,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3340/203307 [3:55:00<234:29:45,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3340/203307 [3:55:00<234:29:46,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3341/203307 [3:55:04<234:29:32,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   2%|▏         | 3341/203307 [3:55:04<234:29:33,  0.24it/s, v_num=t5e6, training/loss=0.101] Epoch 0:   2%|▏         | 3342/203307 [3:55:08<234:29:45,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3342/203307 [3:55:08<234:29:46,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3343/203307 [3:55:12<234:29:15,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3343/203307 [3:55:12<234:29:15,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3344/203307 [3:55:16<234:28:44,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3344/203307 [3:55:16<234:28:44,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3345/203307 [3:55:20<234:29:03,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3345/203307 [3:55:20<234:29:04,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3346/203307 [3:55:25<234:29:14,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3346/203307 [3:55:25<234:29:15,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3347/203307 [3:55:29<234:29:13,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3347/203307 [3:55:29<234:29:14,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3348/203307 [3:55:33<234:28:46,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3348/203307 [3:55:33<234:28:47,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3349/203307 [3:55:37<234:28:31,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3349/203307 [3:55:37<234:28:32,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3350/203307 [3:55:42<234:28:43,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3350/203307 [3:55:42<234:28:44,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3351/203307 [3:55:45<234:28:12,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3351/203307 [3:55:45<234:28:13,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3352/203307 [3:55:49<234:27:41,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3352/203307 [3:55:49<234:27:42,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3353/203307 [3:55:54<234:28:02,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3353/203307 [3:55:54<234:28:02,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3354/203307 [3:55:58<234:27:32,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3354/203307 [3:55:58<234:27:33,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3355/203307 [3:56:02<234:27:43,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3355/203307 [3:56:02<234:27:43,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3356/203307 [3:56:06<234:27:40,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3356/203307 [3:56:06<234:27:40,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3357/203307 [3:56:10<234:27:20,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3357/203307 [3:56:10<234:27:21,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3358/203307 [3:56:15<234:27:33,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3358/203307 [3:56:15<234:27:33,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3359/203307 [3:56:19<234:27:02,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3359/203307 [3:56:19<234:27:02,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3360/203307 [3:56:22<234:26:31,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3360/203307 [3:56:22<234:26:31,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3361/203307 [3:56:27<234:27:01,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3361/203307 [3:56:27<234:27:01,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3362/203307 [3:56:31<234:26:32,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3362/203307 [3:56:31<234:26:33,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3363/203307 [3:56:35<234:26:00,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3363/203307 [3:56:35<234:26:00,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3364/203307 [3:56:39<234:26:14,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3364/203307 [3:56:39<234:26:15,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3365/203307 [3:56:43<234:26:13,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3365/203307 [3:56:43<234:26:14,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3366/203307 [3:56:47<234:25:41,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3366/203307 [3:56:47<234:25:42,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3367/203307 [3:56:52<234:25:56,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3367/203307 [3:56:52<234:25:57,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3368/203307 [3:56:55<234:25:19,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3368/203307 [3:56:55<234:25:19,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3369/203307 [3:56:59<234:25:02,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3369/203307 [3:56:59<234:25:03,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3370/203307 [3:57:04<234:25:08,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3370/203307 [3:57:04<234:25:08,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3371/203307 [3:57:08<234:24:37,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3371/203307 [3:57:08<234:24:38,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3372/203307 [3:57:12<234:24:47,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3372/203307 [3:57:12<234:24:47,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3373/203307 [3:57:16<234:24:31,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3373/203307 [3:57:16<234:24:32,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3374/203307 [3:57:20<234:24:29,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3374/203307 [3:57:20<234:24:30,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3375/203307 [3:57:25<234:24:38,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3375/203307 [3:57:25<234:24:38,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3376/203307 [3:57:29<234:24:07,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3376/203307 [3:57:29<234:24:08,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3377/203307 [3:57:33<234:23:50,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3377/203307 [3:57:33<234:23:51,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3378/203307 [3:57:37<234:23:53,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3378/203307 [3:57:37<234:23:53,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3379/203307 [3:57:41<234:23:19,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3379/203307 [3:57:41<234:23:19,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3380/203307 [3:57:44<234:22:46,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3380/203307 [3:57:44<234:22:47,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3381/203307 [3:57:49<234:23:04,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 3381/203307 [3:57:49<234:23:04,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3382/203307 [3:57:53<234:22:28,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3382/203307 [3:57:53<234:22:29,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3383/203307 [3:57:57<234:22:37,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3383/203307 [3:57:57<234:22:37,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3384/203307 [3:58:01<234:22:04,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3384/203307 [3:58:01<234:22:05,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3385/203307 [3:58:05<234:21:37,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3385/203307 [3:58:05<234:21:38,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3386/203307 [3:58:09<234:21:48,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3386/203307 [3:58:09<234:21:48,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3387/203307 [3:58:13<234:21:14,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3387/203307 [3:58:13<234:21:15,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3388/203307 [3:58:17<234:20:43,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3388/203307 [3:58:17<234:20:43,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3389/203307 [3:58:21<234:20:20,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3389/203307 [3:58:21<234:20:20,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3390/203307 [3:58:25<234:20:36,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3390/203307 [3:58:25<234:20:36,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3391/203307 [3:58:29<234:20:01,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3391/203307 [3:58:29<234:20:01,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3392/203307 [3:58:33<234:20:12,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3392/203307 [3:58:33<234:20:13,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3393/203307 [3:58:37<234:19:41,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3393/203307 [3:58:37<234:19:42,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3394/203307 [3:58:41<234:19:12,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3394/203307 [3:58:41<234:19:13,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3395/203307 [3:58:45<234:19:20,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3395/203307 [3:58:45<234:19:21,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3396/203307 [3:58:49<234:18:47,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3396/203307 [3:58:49<234:18:47,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3397/203307 [3:58:53<234:18:13,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3397/203307 [3:58:53<234:18:13,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3398/203307 [3:58:57<234:18:25,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3398/203307 [3:58:57<234:18:25,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3399/203307 [3:59:01<234:17:52,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3399/203307 [3:59:01<234:17:53,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3400/203307 [3:59:05<234:18:00,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3400/203307 [3:59:05<234:18:01,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3401/203307 [3:59:10<234:18:02,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3401/203307 [3:59:10<234:18:02,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3402/203307 [3:59:13<234:17:30,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3402/203307 [3:59:13<234:17:31,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3403/203307 [3:59:18<234:17:39,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3403/203307 [3:59:18<234:17:40,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3404/203307 [3:59:22<234:17:10,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3404/203307 [3:59:22<234:17:10,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3405/203307 [3:59:25<234:16:42,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3405/203307 [3:59:25<234:16:42,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3406/203307 [3:59:29<234:16:17,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3406/203307 [3:59:29<234:16:17,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3407/203307 [3:59:34<234:16:32,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3407/203307 [3:59:34<234:16:32,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3408/203307 [3:59:38<234:16:40,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3408/203307 [3:59:38<234:16:41,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3409/203307 [3:59:42<234:16:12,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3409/203307 [3:59:42<234:16:12,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3410/203307 [3:59:46<234:16:06,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3410/203307 [3:59:46<234:16:06,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3411/203307 [3:59:51<234:16:15,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3411/203307 [3:59:51<234:16:16,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3412/203307 [3:59:55<234:15:47,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3412/203307 [3:59:55<234:15:47,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3413/203307 [3:59:58<234:15:18,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3413/203307 [3:59:58<234:15:19,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3414/203307 [4:00:02<234:14:46,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3414/203307 [4:00:02<234:14:47,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3415/203307 [4:00:06<234:14:15,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3415/203307 [4:00:06<234:14:16,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3416/203307 [4:00:11<234:14:39,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3416/203307 [4:00:11<234:14:39,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3417/203307 [4:00:15<234:14:51,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3417/203307 [4:00:15<234:14:52,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3418/203307 [4:00:19<234:14:22,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3418/203307 [4:00:19<234:14:23,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3419/203307 [4:00:23<234:14:25,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3419/203307 [4:00:23<234:14:25,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3420/203307 [4:00:28<234:14:28,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3420/203307 [4:00:28<234:14:29,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3421/203307 [4:00:31<234:13:55,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3421/203307 [4:00:31<234:13:55,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3422/203307 [4:00:35<234:13:22,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3422/203307 [4:00:35<234:13:22,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3423/203307 [4:00:39<234:12:55,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3423/203307 [4:00:39<234:12:55,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3424/203307 [4:00:43<234:13:01,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3424/203307 [4:00:43<234:13:02,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3425/203307 [4:00:48<234:13:13,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3425/203307 [4:00:48<234:13:14,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3426/203307 [4:00:51<234:12:41,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3426/203307 [4:00:51<234:12:42,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3427/203307 [4:00:55<234:12:08,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3427/203307 [4:00:55<234:12:09,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3428/203307 [4:01:00<234:12:15,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3428/203307 [4:01:00<234:12:16,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3429/203307 [4:01:03<234:11:44,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3429/203307 [4:01:03<234:11:45,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3430/203307 [4:01:07<234:11:10,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3430/203307 [4:01:07<234:11:10,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3431/203307 [4:01:11<234:10:37,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3431/203307 [4:01:11<234:10:37,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3432/203307 [4:01:15<234:10:11,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3432/203307 [4:01:15<234:10:12,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3433/203307 [4:01:19<234:10:25,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3433/203307 [4:01:19<234:10:25,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3434/203307 [4:01:23<234:09:53,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3434/203307 [4:01:23<234:09:54,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3435/203307 [4:01:27<234:09:20,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3435/203307 [4:01:27<234:09:20,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3436/203307 [4:01:31<234:09:27,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3436/203307 [4:01:31<234:09:28,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3437/203307 [4:01:35<234:09:29,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3437/203307 [4:01:35<234:09:30,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3438/203307 [4:01:39<234:08:55,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3438/203307 [4:01:39<234:08:56,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3439/203307 [4:01:43<234:08:26,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3439/203307 [4:01:43<234:08:26,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3440/203307 [4:01:47<234:07:55,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3440/203307 [4:01:47<234:07:55,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3441/203307 [4:01:51<234:07:33,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   2%|▏         | 3441/203307 [4:01:51<234:07:34,  0.24it/s, v_num=t5e6, training/loss=0.116] Epoch 0:   2%|▏         | 3442/203307 [4:01:55<234:07:46,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3442/203307 [4:01:55<234:07:47,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3443/203307 [4:01:59<234:07:13,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3443/203307 [4:01:59<234:07:13,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3444/203307 [4:02:02<234:06:38,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3444/203307 [4:02:02<234:06:39,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3445/203307 [4:02:07<234:06:44,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3445/203307 [4:02:07<234:06:45,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3446/203307 [4:02:11<234:06:43,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3446/203307 [4:02:11<234:06:44,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3447/203307 [4:02:15<234:06:10,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3447/203307 [4:02:15<234:06:11,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3448/203307 [4:02:19<234:05:40,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3448/203307 [4:02:19<234:05:40,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3449/203307 [4:02:22<234:05:10,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3449/203307 [4:02:22<234:05:10,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3450/203307 [4:02:27<234:05:23,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3450/203307 [4:02:27<234:05:24,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3451/203307 [4:02:31<234:04:56,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3451/203307 [4:02:31<234:04:57,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3452/203307 [4:02:34<234:04:24,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3452/203307 [4:02:34<234:04:25,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3453/203307 [4:02:39<234:04:29,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3453/203307 [4:02:39<234:04:29,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3454/203307 [4:02:43<234:04:04,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3454/203307 [4:02:43<234:04:04,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3455/203307 [4:02:47<234:03:58,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3455/203307 [4:02:47<234:03:58,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3456/203307 [4:02:51<234:03:27,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3456/203307 [4:02:51<234:03:28,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3457/203307 [4:02:54<234:02:59,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3457/203307 [4:02:54<234:02:59,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3458/203307 [4:02:59<234:03:10,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3458/203307 [4:02:59<234:03:11,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3459/203307 [4:03:03<234:03:18,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3459/203307 [4:03:03<234:03:19,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3460/203307 [4:03:07<234:02:44,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3460/203307 [4:03:07<234:02:44,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3461/203307 [4:03:11<234:02:48,  0.24it/s, v_num=t5e6, training/loss=0.116]Epoch 0:   2%|▏         | 3461/203307 [4:03:11<234:02:49,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3462/203307 [4:03:15<234:02:19,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3462/203307 [4:03:15<234:02:20,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3463/203307 [4:03:19<234:01:57,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3463/203307 [4:03:19<234:01:58,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3464/203307 [4:03:23<234:01:57,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3464/203307 [4:03:23<234:01:57,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3465/203307 [4:03:27<234:01:23,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3465/203307 [4:03:27<234:01:24,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3466/203307 [4:03:31<234:00:46,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3466/203307 [4:03:31<234:00:47,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3467/203307 [4:03:35<234:01:07,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3467/203307 [4:03:35<234:01:07,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3468/203307 [4:03:40<234:01:15,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3468/203307 [4:03:40<234:01:16,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3469/203307 [4:03:44<234:00:43,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3469/203307 [4:03:44<234:00:43,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3470/203307 [4:03:48<234:00:52,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3470/203307 [4:03:48<234:00:53,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3471/203307 [4:03:52<234:00:18,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3471/203307 [4:03:52<234:00:18,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3472/203307 [4:03:55<233:59:42,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3472/203307 [4:03:55<233:59:42,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3473/203307 [4:04:00<233:59:57,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3473/203307 [4:04:00<233:59:58,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3474/203307 [4:04:04<233:59:25,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3474/203307 [4:04:04<233:59:26,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3475/203307 [4:04:08<233:59:33,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3475/203307 [4:04:08<233:59:34,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3476/203307 [4:04:13<233:59:45,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3476/203307 [4:04:13<233:59:45,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3477/203307 [4:04:16<233:59:11,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3477/203307 [4:04:16<233:59:12,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3478/203307 [4:04:21<233:59:15,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3478/203307 [4:04:21<233:59:15,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3479/203307 [4:04:24<233:58:49,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3479/203307 [4:04:24<233:58:50,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3480/203307 [4:04:28<233:58:15,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3480/203307 [4:04:28<233:58:15,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3481/203307 [4:04:32<233:57:42,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   2%|▏         | 3481/203307 [4:04:32<233:57:43,  0.24it/s, v_num=t5e6, training/loss=0.103] Epoch 0:   2%|▏         | 3482/203307 [4:04:36<233:57:42,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3482/203307 [4:04:36<233:57:42,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3483/203307 [4:04:41<233:57:54,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3483/203307 [4:04:41<233:57:55,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3484/203307 [4:04:44<233:57:22,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3484/203307 [4:04:44<233:57:22,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3485/203307 [4:04:49<233:57:34,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3485/203307 [4:04:49<233:57:35,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3486/203307 [4:04:53<233:57:40,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3486/203307 [4:04:53<233:57:40,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3487/203307 [4:04:57<233:57:06,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3487/203307 [4:04:57<233:57:06,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3488/203307 [4:05:01<233:56:33,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3488/203307 [4:05:01<233:56:33,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3489/203307 [4:05:04<233:56:02,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3489/203307 [4:05:04<233:56:03,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3490/203307 [4:05:08<233:55:26,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3490/203307 [4:05:08<233:55:26,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3491/203307 [4:05:12<233:55:27,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3491/203307 [4:05:12<233:55:28,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3492/203307 [4:05:17<233:55:37,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3492/203307 [4:05:17<233:55:38,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3493/203307 [4:05:21<233:55:05,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3493/203307 [4:05:21<233:55:05,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3494/203307 [4:05:25<233:55:14,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3494/203307 [4:05:25<233:55:15,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3495/203307 [4:05:29<233:55:20,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3495/203307 [4:05:29<233:55:21,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3496/203307 [4:05:33<233:54:44,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3496/203307 [4:05:33<233:54:45,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3497/203307 [4:05:37<233:54:13,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3497/203307 [4:05:37<233:54:13,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3498/203307 [4:05:41<233:53:41,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3498/203307 [4:05:41<233:53:42,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3499/203307 [4:05:44<233:53:11,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3499/203307 [4:05:44<233:53:11,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3500/203307 [4:05:49<233:53:22,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3500/203307 [4:05:49<233:53:22,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3501/203307 [4:05:53<233:52:56,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3501/203307 [4:05:53<233:52:56,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3502/203307 [4:05:57<233:53:00,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3502/203307 [4:05:57<233:53:01,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3503/203307 [4:06:01<233:53:05,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3503/203307 [4:06:01<233:53:06,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3504/203307 [4:06:05<233:52:33,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3504/203307 [4:06:05<233:52:33,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3505/203307 [4:06:09<233:52:02,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3505/203307 [4:06:09<233:52:02,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3506/203307 [4:06:13<233:51:29,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3506/203307 [4:06:13<233:51:30,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3507/203307 [4:06:16<233:50:56,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3507/203307 [4:06:16<233:50:57,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3508/203307 [4:06:21<233:51:04,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3508/203307 [4:06:21<233:51:04,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3509/203307 [4:06:25<233:51:03,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3509/203307 [4:06:25<233:51:03,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3510/203307 [4:06:29<233:50:29,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3510/203307 [4:06:29<233:50:30,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3511/203307 [4:06:33<233:50:40,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3511/203307 [4:06:33<233:50:41,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3512/203307 [4:06:37<233:50:10,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3512/203307 [4:06:37<233:50:11,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3513/203307 [4:06:41<233:49:43,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3513/203307 [4:06:41<233:49:43,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3514/203307 [4:06:44<233:49:15,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3514/203307 [4:06:44<233:49:15,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3515/203307 [4:06:48<233:48:45,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3515/203307 [4:06:48<233:48:46,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3516/203307 [4:06:52<233:48:13,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3516/203307 [4:06:52<233:48:13,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3517/203307 [4:06:56<233:48:26,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3517/203307 [4:06:56<233:48:26,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3518/203307 [4:07:01<233:48:22,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3518/203307 [4:07:01<233:48:23,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3519/203307 [4:07:04<233:47:54,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3519/203307 [4:07:04<233:47:54,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3520/203307 [4:07:09<233:48:01,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3520/203307 [4:07:09<233:48:02,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3521/203307 [4:07:13<233:47:31,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3521/203307 [4:07:13<233:47:32,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3522/203307 [4:07:16<233:46:58,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3522/203307 [4:07:16<233:46:58,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3523/203307 [4:07:20<233:46:29,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3523/203307 [4:07:20<233:46:29,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3524/203307 [4:07:24<233:45:53,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3524/203307 [4:07:24<233:45:53,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3525/203307 [4:07:28<233:46:03,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3525/203307 [4:07:28<233:46:03,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3526/203307 [4:07:32<233:45:34,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3526/203307 [4:07:32<233:45:34,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3527/203307 [4:07:36<233:45:30,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3527/203307 [4:07:36<233:45:30,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3528/203307 [4:07:41<233:45:32,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3528/203307 [4:07:41<233:45:33,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3529/203307 [4:07:44<233:45:01,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3529/203307 [4:07:44<233:45:01,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3530/203307 [4:07:48<233:44:30,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3530/203307 [4:07:48<233:44:31,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3531/203307 [4:07:52<233:43:57,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3531/203307 [4:07:52<233:43:58,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3532/203307 [4:07:55<233:43:20,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3532/203307 [4:07:55<233:43:21,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3533/203307 [4:08:00<233:43:32,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3533/203307 [4:08:00<233:43:32,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3534/203307 [4:08:04<233:43:00,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3534/203307 [4:08:04<233:43:00,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3535/203307 [4:08:07<233:42:28,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3535/203307 [4:08:07<233:42:28,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3536/203307 [4:08:12<233:42:32,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3536/203307 [4:08:12<233:42:33,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3537/203307 [4:08:16<233:42:45,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3537/203307 [4:08:16<233:42:46,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3538/203307 [4:08:20<233:42:20,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3538/203307 [4:08:20<233:42:20,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3539/203307 [4:08:24<233:41:58,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3539/203307 [4:08:24<233:41:58,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3540/203307 [4:08:28<233:41:29,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3540/203307 [4:08:28<233:41:29,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3541/203307 [4:08:32<233:41:03,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 3541/203307 [4:08:32<233:41:03,  0.24it/s, v_num=t5e6, training/loss=0.101] Epoch 0:   2%|▏         | 3542/203307 [4:08:36<233:41:14,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3542/203307 [4:08:36<233:41:15,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3543/203307 [4:08:40<233:40:49,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3543/203307 [4:08:40<233:40:50,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3544/203307 [4:08:44<233:40:25,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3544/203307 [4:08:44<233:40:25,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3545/203307 [4:08:48<233:40:37,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3545/203307 [4:08:48<233:40:38,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3546/203307 [4:08:53<233:40:48,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3546/203307 [4:08:53<233:40:49,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3547/203307 [4:08:56<233:40:18,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3547/203307 [4:08:56<233:40:19,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3548/203307 [4:09:00<233:39:53,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3548/203307 [4:09:00<233:39:53,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3549/203307 [4:09:04<233:39:26,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3549/203307 [4:09:04<233:39:27,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3550/203307 [4:09:09<233:39:38,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3550/203307 [4:09:09<233:39:38,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3551/203307 [4:09:12<233:39:13,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3551/203307 [4:09:12<233:39:13,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3552/203307 [4:09:16<233:38:44,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3552/203307 [4:09:16<233:38:45,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3553/203307 [4:09:21<233:38:49,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3553/203307 [4:09:21<233:38:49,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3554/203307 [4:09:25<233:39:00,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3554/203307 [4:09:25<233:39:00,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3555/203307 [4:09:29<233:38:31,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3555/203307 [4:09:29<233:38:32,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3556/203307 [4:09:33<233:38:01,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3556/203307 [4:09:33<233:38:01,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3557/203307 [4:09:36<233:37:29,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3557/203307 [4:09:36<233:37:29,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3558/203307 [4:09:41<233:37:39,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3558/203307 [4:09:41<233:37:39,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3559/203307 [4:09:45<233:37:10,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3559/203307 [4:09:45<233:37:11,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3560/203307 [4:09:48<233:36:41,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3560/203307 [4:09:48<233:36:41,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3561/203307 [4:09:53<233:36:46,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   2%|▏         | 3561/203307 [4:09:53<233:36:46,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3562/203307 [4:09:56<233:36:19,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3562/203307 [4:09:56<233:36:19,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3563/203307 [4:10:01<233:36:26,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3563/203307 [4:10:01<233:36:27,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3564/203307 [4:10:05<233:36:04,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3564/203307 [4:10:05<233:36:04,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3565/203307 [4:10:09<233:35:33,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3565/203307 [4:10:09<233:35:34,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3566/203307 [4:10:12<233:35:05,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3566/203307 [4:10:12<233:35:05,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3567/203307 [4:10:17<233:35:15,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3567/203307 [4:10:17<233:35:16,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3568/203307 [4:10:21<233:34:48,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3568/203307 [4:10:21<233:34:48,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3569/203307 [4:10:24<233:34:28,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3569/203307 [4:10:24<233:34:28,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3570/203307 [4:10:29<233:34:37,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3570/203307 [4:10:29<233:34:38,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3571/203307 [4:10:33<233:34:13,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3571/203307 [4:10:33<233:34:14,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3572/203307 [4:10:37<233:34:27,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3572/203307 [4:10:37<233:34:28,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3573/203307 [4:10:41<233:34:01,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3573/203307 [4:10:41<233:34:02,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3574/203307 [4:10:45<233:33:36,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3574/203307 [4:10:45<233:33:37,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3575/203307 [4:10:50<233:33:50,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3575/203307 [4:10:50<233:33:51,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3576/203307 [4:10:53<233:33:28,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3576/203307 [4:10:53<233:33:29,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3577/203307 [4:10:57<233:33:03,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3577/203307 [4:10:57<233:33:03,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3578/203307 [4:11:02<233:33:12,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3578/203307 [4:11:02<233:33:13,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3579/203307 [4:11:06<233:32:48,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3579/203307 [4:11:06<233:32:49,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3580/203307 [4:11:10<233:33:03,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3580/203307 [4:11:10<233:33:03,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3581/203307 [4:11:14<233:32:59,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   2%|▏         | 3581/203307 [4:11:14<233:33:00,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3582/203307 [4:11:18<233:32:35,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3582/203307 [4:11:18<233:32:35,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3583/203307 [4:11:23<233:32:44,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3583/203307 [4:11:23<233:32:45,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3584/203307 [4:11:26<233:32:14,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3584/203307 [4:11:26<233:32:14,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3585/203307 [4:11:30<233:31:44,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3585/203307 [4:11:30<233:31:45,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3586/203307 [4:11:35<233:31:51,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3586/203307 [4:11:35<233:31:51,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3587/203307 [4:11:38<233:31:21,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3587/203307 [4:11:38<233:31:21,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3588/203307 [4:11:42<233:30:49,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3588/203307 [4:11:42<233:30:50,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3589/203307 [4:11:46<233:31:01,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3589/203307 [4:11:46<233:31:02,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3590/203307 [4:11:51<233:30:57,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3590/203307 [4:11:51<233:30:57,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3591/203307 [4:11:54<233:30:27,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3591/203307 [4:11:54<233:30:27,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3592/203307 [4:11:59<233:30:37,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3592/203307 [4:11:59<233:30:37,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3593/203307 [4:12:03<233:30:08,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3593/203307 [4:12:03<233:30:08,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3594/203307 [4:12:06<233:29:39,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3594/203307 [4:12:06<233:29:39,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3595/203307 [4:12:11<233:29:44,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3595/203307 [4:12:11<233:29:45,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3596/203307 [4:12:15<233:29:13,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3596/203307 [4:12:15<233:29:14,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3597/203307 [4:12:18<233:28:38,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3597/203307 [4:12:18<233:28:38,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3598/203307 [4:12:23<233:28:50,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3598/203307 [4:12:23<233:28:50,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3599/203307 [4:12:27<233:28:46,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3599/203307 [4:12:27<233:28:46,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3600/203307 [4:12:31<233:28:57,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3600/203307 [4:12:31<233:28:57,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3601/203307 [4:12:35<233:28:32,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 3601/203307 [4:12:35<233:28:33,  0.24it/s, v_num=t5e6, training/loss=0.104] Epoch 0:   2%|▏         | 3602/203307 [4:12:39<233:28:02,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3602/203307 [4:12:39<233:28:02,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3603/203307 [4:12:43<233:28:03,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3603/203307 [4:12:43<233:28:03,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3604/203307 [4:12:47<233:27:32,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3604/203307 [4:12:47<233:27:33,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3605/203307 [4:12:51<233:27:02,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3605/203307 [4:12:51<233:27:02,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3606/203307 [4:12:55<233:27:14,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3606/203307 [4:12:55<233:27:15,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3607/203307 [4:12:59<233:26:40,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3607/203307 [4:12:59<233:26:40,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3608/203307 [4:13:03<233:26:48,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3608/203307 [4:13:03<233:26:48,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3609/203307 [4:13:07<233:26:16,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3609/203307 [4:13:07<233:26:17,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3610/203307 [4:13:11<233:25:43,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3610/203307 [4:13:11<233:25:43,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3611/203307 [4:13:15<233:25:46,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3611/203307 [4:13:15<233:25:46,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3612/203307 [4:13:19<233:25:18,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3612/203307 [4:13:19<233:25:18,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3613/203307 [4:13:22<233:24:43,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3613/203307 [4:13:22<233:24:44,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3614/203307 [4:13:26<233:24:13,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3614/203307 [4:13:26<233:24:14,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3615/203307 [4:13:31<233:24:23,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3615/203307 [4:13:31<233:24:24,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3616/203307 [4:13:34<233:23:50,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3616/203307 [4:13:34<233:23:50,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3617/203307 [4:13:39<233:23:55,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3617/203307 [4:13:39<233:23:56,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3618/203307 [4:13:42<233:23:19,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3618/203307 [4:13:42<233:23:19,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3619/203307 [4:13:46<233:22:45,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3619/203307 [4:13:46<233:22:45,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3620/203307 [4:13:50<233:22:47,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3620/203307 [4:13:50<233:22:48,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3621/203307 [4:13:54<233:22:16,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3621/203307 [4:13:54<233:22:16,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3622/203307 [4:13:58<233:21:43,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3622/203307 [4:13:58<233:21:44,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3623/203307 [4:14:02<233:21:13,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3623/203307 [4:14:02<233:21:14,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3624/203307 [4:14:06<233:21:21,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3624/203307 [4:14:06<233:21:21,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3625/203307 [4:14:10<233:21:28,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3625/203307 [4:14:10<233:21:29,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3626/203307 [4:14:14<233:21:19,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3626/203307 [4:14:14<233:21:19,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3627/203307 [4:14:18<233:20:48,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3627/203307 [4:14:18<233:20:48,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3628/203307 [4:14:23<233:20:50,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3628/203307 [4:14:23<233:20:50,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3629/203307 [4:14:26<233:20:23,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3629/203307 [4:14:26<233:20:24,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3630/203307 [4:14:30<233:19:56,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3630/203307 [4:14:30<233:19:56,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3631/203307 [4:14:34<233:19:24,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3631/203307 [4:14:34<233:19:24,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3632/203307 [4:14:38<233:19:30,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3632/203307 [4:14:38<233:19:31,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3633/203307 [4:14:43<233:19:40,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3633/203307 [4:14:43<233:19:41,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3634/203307 [4:14:46<233:19:10,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3634/203307 [4:14:46<233:19:10,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3635/203307 [4:14:50<233:19:00,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3635/203307 [4:14:50<233:19:00,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3636/203307 [4:14:55<233:19:04,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3636/203307 [4:14:55<233:19:05,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3637/203307 [4:14:59<233:18:34,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3637/203307 [4:14:59<233:18:35,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3638/203307 [4:15:02<233:18:00,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3638/203307 [4:15:02<233:18:01,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3639/203307 [4:15:06<233:17:28,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3639/203307 [4:15:06<233:17:29,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3640/203307 [4:15:10<233:16:56,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3640/203307 [4:15:10<233:16:57,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3641/203307 [4:15:14<233:17:13,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   2%|▏         | 3641/203307 [4:15:14<233:17:14,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3642/203307 [4:15:19<233:17:25,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3642/203307 [4:15:19<233:17:26,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3643/203307 [4:15:22<233:16:53,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3643/203307 [4:15:22<233:16:53,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3644/203307 [4:15:27<233:16:49,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3644/203307 [4:15:27<233:16:50,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3645/203307 [4:15:31<233:16:53,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3645/203307 [4:15:31<233:16:53,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3646/203307 [4:15:35<233:16:22,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3646/203307 [4:15:35<233:16:23,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3647/203307 [4:15:38<233:15:54,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3647/203307 [4:15:39<233:15:55,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3648/203307 [4:15:42<233:15:24,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3648/203307 [4:15:42<233:15:24,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3649/203307 [4:15:46<233:14:53,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3649/203307 [4:15:46<233:14:54,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3650/203307 [4:15:50<233:15:05,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3650/203307 [4:15:50<233:15:05,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3651/203307 [4:15:54<233:14:32,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3651/203307 [4:15:54<233:14:33,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3652/203307 [4:15:58<233:13:59,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3652/203307 [4:15:58<233:14:00,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3653/203307 [4:16:02<233:14:04,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3653/203307 [4:16:02<233:14:04,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3654/203307 [4:16:06<233:13:33,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3654/203307 [4:16:06<233:13:34,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3655/203307 [4:16:10<233:13:03,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3655/203307 [4:16:10<233:13:04,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3656/203307 [4:16:13<233:12:32,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3656/203307 [4:16:13<233:12:32,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3657/203307 [4:16:17<233:12:04,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3657/203307 [4:16:17<233:12:04,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3658/203307 [4:16:22<233:12:12,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3658/203307 [4:16:22<233:12:12,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3659/203307 [4:16:25<233:11:46,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3659/203307 [4:16:25<233:11:46,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3660/203307 [4:16:29<233:11:17,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3660/203307 [4:16:29<233:11:18,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3661/203307 [4:16:33<233:11:23,  0.24it/s, v_num=t5e6, training/loss=0.0988]Epoch 0:   2%|▏         | 3661/203307 [4:16:34<233:11:24,  0.24it/s, v_num=t5e6, training/loss=0.108] Epoch 0:   2%|▏         | 3662/203307 [4:16:38<233:11:24,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3662/203307 [4:16:38<233:11:25,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3663/203307 [4:16:42<233:10:57,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3663/203307 [4:16:42<233:10:58,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3664/203307 [4:16:45<233:10:27,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3664/203307 [4:16:45<233:10:28,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3665/203307 [4:16:49<233:09:58,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3665/203307 [4:16:49<233:09:58,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3666/203307 [4:16:53<233:09:30,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3666/203307 [4:16:53<233:09:30,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3667/203307 [4:16:57<233:09:44,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3667/203307 [4:16:57<233:09:45,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3668/203307 [4:17:01<233:09:18,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3668/203307 [4:17:01<233:09:18,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3669/203307 [4:17:05<233:08:49,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3669/203307 [4:17:05<233:08:49,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3670/203307 [4:17:09<233:08:53,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3670/203307 [4:17:09<233:08:53,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3671/203307 [4:17:14<233:08:54,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3671/203307 [4:17:14<233:08:54,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3672/203307 [4:17:17<233:08:30,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3672/203307 [4:17:17<233:08:31,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3673/203307 [4:17:21<233:08:03,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3673/203307 [4:17:21<233:08:04,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3674/203307 [4:17:25<233:07:36,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3674/203307 [4:17:25<233:07:36,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3675/203307 [4:17:30<233:07:52,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3675/203307 [4:17:30<233:07:53,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3676/203307 [4:17:34<233:08:06,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3676/203307 [4:17:34<233:08:06,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3677/203307 [4:17:38<233:07:36,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3677/203307 [4:17:38<233:07:36,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3678/203307 [4:17:42<233:07:38,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3678/203307 [4:17:42<233:07:39,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3679/203307 [4:17:46<233:07:13,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3679/203307 [4:17:46<233:07:13,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3680/203307 [4:17:50<233:07:09,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3680/203307 [4:17:50<233:07:10,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3681/203307 [4:17:54<233:06:42,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 3681/203307 [4:17:54<233:06:43,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3682/203307 [4:17:58<233:06:10,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3682/203307 [4:17:58<233:06:10,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3683/203307 [4:18:02<233:06:21,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3683/203307 [4:18:02<233:06:21,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3684/203307 [4:18:07<233:06:29,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3684/203307 [4:18:07<233:06:29,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3685/203307 [4:18:10<233:06:01,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3685/203307 [4:18:10<233:06:02,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3686/203307 [4:18:15<233:06:03,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3686/203307 [4:18:15<233:06:04,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3687/203307 [4:18:18<233:05:37,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3687/203307 [4:18:18<233:05:37,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3688/203307 [4:18:22<233:05:03,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3688/203307 [4:18:22<233:05:03,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3689/203307 [4:18:26<233:05:01,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3689/203307 [4:18:26<233:05:01,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3690/203307 [4:18:30<233:04:31,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3690/203307 [4:18:30<233:04:31,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3691/203307 [4:18:34<233:03:59,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3691/203307 [4:18:34<233:03:59,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3692/203307 [4:18:38<233:04:12,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3692/203307 [4:18:38<233:04:13,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3693/203307 [4:18:43<233:04:17,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3693/203307 [4:18:43<233:04:17,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3694/203307 [4:18:46<233:03:43,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3694/203307 [4:18:46<233:03:44,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3695/203307 [4:18:51<233:03:45,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3695/203307 [4:18:51<233:03:46,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3696/203307 [4:18:54<233:03:16,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3696/203307 [4:18:54<233:03:16,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3697/203307 [4:18:58<233:02:43,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3697/203307 [4:18:58<233:02:44,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3698/203307 [4:19:02<233:02:40,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3698/203307 [4:19:02<233:02:40,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3699/203307 [4:19:06<233:02:07,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3699/203307 [4:19:06<233:02:08,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3700/203307 [4:19:10<233:02:11,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3700/203307 [4:19:10<233:02:12,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3701/203307 [4:19:14<233:01:39,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 3701/203307 [4:19:14<233:01:40,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3702/203307 [4:19:19<233:01:55,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3702/203307 [4:19:19<233:01:55,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3703/203307 [4:19:23<233:01:57,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3703/203307 [4:19:23<233:01:57,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3704/203307 [4:19:27<233:01:27,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3704/203307 [4:19:27<233:01:27,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3705/203307 [4:19:30<233:00:55,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3705/203307 [4:19:30<233:00:56,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3706/203307 [4:19:34<233:00:23,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3706/203307 [4:19:34<233:00:24,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3707/203307 [4:19:38<233:00:23,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3707/203307 [4:19:38<233:00:24,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3708/203307 [4:19:43<233:00:32,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3708/203307 [4:19:43<233:00:33,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3709/203307 [4:19:46<233:00:02,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3709/203307 [4:19:46<233:00:03,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3710/203307 [4:19:51<233:00:13,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3710/203307 [4:19:51<233:00:13,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3711/203307 [4:19:55<233:00:17,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3711/203307 [4:19:55<233:00:18,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3712/203307 [4:19:59<232:59:51,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3712/203307 [4:19:59<232:59:52,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3713/203307 [4:20:03<232:59:23,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3713/203307 [4:20:03<232:59:23,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3714/203307 [4:20:07<232:58:56,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3714/203307 [4:20:07<232:58:57,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3715/203307 [4:20:10<232:58:30,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3715/203307 [4:20:10<232:58:30,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3716/203307 [4:20:15<232:58:27,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3716/203307 [4:20:15<232:58:27,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3717/203307 [4:20:19<232:58:35,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3717/203307 [4:20:19<232:58:36,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3718/203307 [4:20:23<232:58:03,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3718/203307 [4:20:23<232:58:04,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3719/203307 [4:20:27<232:58:17,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3719/203307 [4:20:27<232:58:17,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3720/203307 [4:20:32<232:58:17,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3720/203307 [4:20:32<232:58:17,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3721/203307 [4:20:35<232:57:46,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   2%|▏         | 3721/203307 [4:20:35<232:57:47,  0.24it/s, v_num=t5e6, training/loss=0.104] Epoch 0:   2%|▏         | 3722/203307 [4:20:39<232:57:14,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3722/203307 [4:20:39<232:57:15,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3723/203307 [4:20:43<232:56:47,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3723/203307 [4:20:43<232:56:47,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3724/203307 [4:20:46<232:56:19,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3724/203307 [4:20:46<232:56:19,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3725/203307 [4:20:51<232:56:29,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3725/203307 [4:20:51<232:56:29,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3726/203307 [4:20:55<232:55:57,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3726/203307 [4:20:55<232:55:57,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3727/203307 [4:20:58<232:55:25,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3727/203307 [4:20:58<232:55:25,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3728/203307 [4:21:03<232:55:37,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3728/203307 [4:21:03<232:55:37,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3729/203307 [4:21:07<232:55:06,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3729/203307 [4:21:07<232:55:07,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3730/203307 [4:21:10<232:54:34,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3730/203307 [4:21:10<232:54:34,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3731/203307 [4:21:14<232:54:00,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3731/203307 [4:21:14<232:54:01,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3732/203307 [4:21:18<232:53:32,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3732/203307 [4:21:18<232:53:33,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3733/203307 [4:21:22<232:53:45,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3733/203307 [4:21:22<232:53:46,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3734/203307 [4:21:26<232:53:42,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3734/203307 [4:21:26<232:53:43,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3735/203307 [4:21:30<232:53:11,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3735/203307 [4:21:30<232:53:11,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3736/203307 [4:21:34<232:53:19,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3736/203307 [4:21:34<232:53:19,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3737/203307 [4:21:38<232:52:49,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3737/203307 [4:21:38<232:52:49,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3738/203307 [4:21:42<232:52:18,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3738/203307 [4:21:42<232:52:18,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3739/203307 [4:21:46<232:51:48,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3739/203307 [4:21:46<232:51:49,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3740/203307 [4:21:49<232:51:19,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3740/203307 [4:21:49<232:51:20,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3741/203307 [4:21:53<232:50:52,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 3741/203307 [4:21:53<232:50:52,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3742/203307 [4:21:58<232:51:10,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3742/203307 [4:21:58<232:51:10,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3743/203307 [4:22:02<232:51:05,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3743/203307 [4:22:02<232:51:05,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3744/203307 [4:22:06<232:50:35,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3744/203307 [4:22:06<232:50:35,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3745/203307 [4:22:10<232:50:46,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3745/203307 [4:22:10<232:50:47,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3746/203307 [4:22:14<232:50:19,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3746/203307 [4:22:14<232:50:19,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3747/203307 [4:22:18<232:49:55,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3747/203307 [4:22:18<232:49:55,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3748/203307 [4:22:22<232:49:32,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3748/203307 [4:22:22<232:49:32,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3749/203307 [4:22:25<232:49:05,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3749/203307 [4:22:25<232:49:05,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3750/203307 [4:22:30<232:49:15,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3750/203307 [4:22:30<232:49:15,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3751/203307 [4:22:34<232:48:48,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3751/203307 [4:22:34<232:48:48,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3752/203307 [4:22:38<232:48:44,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3752/203307 [4:22:38<232:48:45,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3753/203307 [4:22:42<232:48:47,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3753/203307 [4:22:42<232:48:47,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3754/203307 [4:22:47<232:48:54,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3754/203307 [4:22:47<232:48:55,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3755/203307 [4:22:50<232:48:23,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3755/203307 [4:22:50<232:48:24,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3756/203307 [4:22:54<232:47:54,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3756/203307 [4:22:54<232:47:54,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3757/203307 [4:22:58<232:47:21,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3757/203307 [4:22:58<232:47:21,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3758/203307 [4:23:02<232:47:32,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3758/203307 [4:23:02<232:47:33,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3759/203307 [4:23:06<232:47:02,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3759/203307 [4:23:06<232:47:02,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3760/203307 [4:23:09<232:46:28,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3760/203307 [4:23:09<232:46:29,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3761/203307 [4:23:14<232:46:32,  0.24it/s, v_num=t5e6, training/loss=0.109]Epoch 0:   2%|▏         | 3761/203307 [4:23:14<232:46:33,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3762/203307 [4:23:18<232:46:47,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3762/203307 [4:23:18<232:46:47,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3763/203307 [4:23:22<232:46:19,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3763/203307 [4:23:22<232:46:19,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3764/203307 [4:23:26<232:45:51,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3764/203307 [4:23:26<232:45:51,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3765/203307 [4:23:30<232:45:21,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3765/203307 [4:23:30<232:45:21,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3766/203307 [4:23:33<232:44:53,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3766/203307 [4:23:33<232:44:53,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3767/203307 [4:23:38<232:45:03,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3767/203307 [4:23:38<232:45:03,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3768/203307 [4:23:41<232:44:32,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3768/203307 [4:23:41<232:44:32,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3769/203307 [4:23:45<232:44:00,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3769/203307 [4:23:45<232:44:00,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3770/203307 [4:23:50<232:44:09,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3770/203307 [4:23:50<232:44:10,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3771/203307 [4:23:54<232:44:16,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3771/203307 [4:23:54<232:44:17,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3772/203307 [4:23:58<232:43:44,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3772/203307 [4:23:58<232:43:44,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3773/203307 [4:24:01<232:43:14,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3773/203307 [4:24:01<232:43:15,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3774/203307 [4:24:05<232:42:45,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3774/203307 [4:24:05<232:42:45,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3775/203307 [4:24:10<232:42:52,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3775/203307 [4:24:10<232:42:53,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3776/203307 [4:24:13<232:42:24,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3776/203307 [4:24:13<232:42:25,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3777/203307 [4:24:17<232:42:00,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3777/203307 [4:24:17<232:42:01,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3778/203307 [4:24:21<232:42:01,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3778/203307 [4:24:21<232:42:02,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3779/203307 [4:24:26<232:41:59,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3779/203307 [4:24:26<232:41:59,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3780/203307 [4:24:30<232:42:06,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3780/203307 [4:24:30<232:42:06,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3781/203307 [4:24:34<232:41:34,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   2%|▏         | 3781/203307 [4:24:34<232:41:35,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3782/203307 [4:24:37<232:41:04,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3782/203307 [4:24:37<232:41:05,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3783/203307 [4:24:42<232:41:16,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3783/203307 [4:24:42<232:41:16,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3784/203307 [4:24:46<232:40:47,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3784/203307 [4:24:46<232:40:48,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3785/203307 [4:24:49<232:40:20,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3785/203307 [4:24:49<232:40:21,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3786/203307 [4:24:54<232:40:28,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3786/203307 [4:24:54<232:40:28,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3787/203307 [4:24:58<232:39:59,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3787/203307 [4:24:58<232:40:00,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3788/203307 [4:25:02<232:40:10,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3788/203307 [4:25:02<232:40:11,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3789/203307 [4:25:06<232:39:43,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3789/203307 [4:25:06<232:39:44,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3790/203307 [4:25:10<232:39:14,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3790/203307 [4:25:10<232:39:14,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3791/203307 [4:25:13<232:38:46,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3791/203307 [4:25:13<232:38:46,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3792/203307 [4:25:18<232:38:59,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3792/203307 [4:25:18<232:38:59,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3793/203307 [4:25:22<232:38:31,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3793/203307 [4:25:22<232:38:31,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3794/203307 [4:25:25<232:38:03,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3794/203307 [4:25:25<232:38:04,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3795/203307 [4:25:30<232:38:07,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3795/203307 [4:25:30<232:38:07,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3796/203307 [4:25:33<232:37:37,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3796/203307 [4:25:33<232:37:38,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3797/203307 [4:25:38<232:37:49,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3797/203307 [4:25:38<232:37:50,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3798/203307 [4:25:42<232:37:21,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3798/203307 [4:25:42<232:37:22,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3799/203307 [4:25:45<232:36:50,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3799/203307 [4:25:45<232:36:50,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3800/203307 [4:25:50<232:37:01,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3800/203307 [4:25:50<232:37:01,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3801/203307 [4:25:54<232:36:32,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3801/203307 [4:25:54<232:36:33,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3802/203307 [4:25:57<232:36:04,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3802/203307 [4:25:57<232:36:05,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3803/203307 [4:26:02<232:36:11,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3803/203307 [4:26:02<232:36:11,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3804/203307 [4:26:05<232:35:42,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3804/203307 [4:26:05<232:35:43,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3805/203307 [4:26:09<232:35:13,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3805/203307 [4:26:09<232:35:14,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3806/203307 [4:26:14<232:35:25,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3806/203307 [4:26:14<232:35:25,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3807/203307 [4:26:18<232:35:02,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3807/203307 [4:26:18<232:35:02,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3808/203307 [4:26:22<232:35:14,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3808/203307 [4:26:22<232:35:14,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3809/203307 [4:26:26<232:34:49,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3809/203307 [4:26:26<232:34:50,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3810/203307 [4:26:30<232:34:22,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3810/203307 [4:26:30<232:34:23,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3811/203307 [4:26:34<232:34:29,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3811/203307 [4:26:34<232:34:29,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3812/203307 [4:26:38<232:34:04,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3812/203307 [4:26:38<232:34:04,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3813/203307 [4:26:42<232:33:38,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3813/203307 [4:26:42<232:33:38,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3814/203307 [4:26:46<232:33:46,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3814/203307 [4:26:46<232:33:46,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3815/203307 [4:26:50<232:33:40,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3815/203307 [4:26:50<232:33:40,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3816/203307 [4:26:54<232:33:15,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3816/203307 [4:26:54<232:33:16,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3817/203307 [4:26:58<232:33:24,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3817/203307 [4:26:58<232:33:24,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3818/203307 [4:27:02<232:32:54,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3818/203307 [4:27:02<232:32:55,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3819/203307 [4:27:06<232:32:29,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3819/203307 [4:27:06<232:32:29,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3820/203307 [4:27:10<232:32:36,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3820/203307 [4:27:10<232:32:37,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3821/203307 [4:27:14<232:32:06,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 3821/203307 [4:27:14<232:32:06,  0.24it/s, v_num=t5e6, training/loss=0.110] Epoch 0:   2%|▏         | 3822/203307 [4:27:18<232:31:35,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3822/203307 [4:27:18<232:31:35,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3823/203307 [4:27:22<232:31:44,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3823/203307 [4:27:22<232:31:45,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3824/203307 [4:27:26<232:31:43,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3824/203307 [4:27:26<232:31:43,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3825/203307 [4:27:31<232:31:48,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3825/203307 [4:27:31<232:31:48,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3826/203307 [4:27:34<232:31:19,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3826/203307 [4:27:34<232:31:19,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3827/203307 [4:27:38<232:30:47,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3827/203307 [4:27:38<232:30:48,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3828/203307 [4:27:43<232:30:51,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3828/203307 [4:27:43<232:30:52,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3829/203307 [4:27:46<232:30:21,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3829/203307 [4:27:46<232:30:21,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3830/203307 [4:27:50<232:29:48,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3830/203307 [4:27:50<232:29:48,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3831/203307 [4:27:54<232:29:17,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3831/203307 [4:27:54<232:29:17,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3832/203307 [4:27:58<232:29:25,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3832/203307 [4:27:58<232:29:25,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3833/203307 [4:28:02<232:29:31,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3833/203307 [4:28:02<232:29:31,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3834/203307 [4:28:06<232:29:01,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3834/203307 [4:28:06<232:29:01,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3835/203307 [4:28:10<232:28:32,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3835/203307 [4:28:10<232:28:33,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3836/203307 [4:28:14<232:28:41,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3836/203307 [4:28:14<232:28:42,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3837/203307 [4:28:18<232:28:27,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3837/203307 [4:28:18<232:28:27,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3838/203307 [4:28:22<232:28:05,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3838/203307 [4:28:22<232:28:05,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3839/203307 [4:28:26<232:27:39,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3839/203307 [4:28:26<232:27:40,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3840/203307 [4:28:30<232:27:47,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3840/203307 [4:28:30<232:27:47,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3841/203307 [4:28:34<232:27:23,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 3841/203307 [4:28:34<232:27:24,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3842/203307 [4:28:39<232:27:30,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3842/203307 [4:28:39<232:27:30,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3843/203307 [4:28:42<232:26:59,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3843/203307 [4:28:42<232:27:00,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3844/203307 [4:28:46<232:26:31,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3844/203307 [4:28:46<232:26:31,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3845/203307 [4:28:50<232:26:37,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3845/203307 [4:28:50<232:26:37,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3846/203307 [4:28:54<232:26:05,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3846/203307 [4:28:54<232:26:05,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3847/203307 [4:28:58<232:25:34,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3847/203307 [4:28:58<232:25:35,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3848/203307 [4:29:01<232:25:07,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3848/203307 [4:29:01<232:25:08,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3849/203307 [4:29:06<232:25:15,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3849/203307 [4:29:06<232:25:15,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3850/203307 [4:29:10<232:25:19,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3850/203307 [4:29:10<232:25:20,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3851/203307 [4:29:14<232:25:13,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3851/203307 [4:29:14<232:25:14,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3852/203307 [4:29:18<232:24:46,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3852/203307 [4:29:18<232:24:47,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3853/203307 [4:29:22<232:24:52,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3853/203307 [4:29:23<232:24:52,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3854/203307 [4:29:26<232:24:27,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3854/203307 [4:29:26<232:24:28,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3855/203307 [4:29:30<232:24:01,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3855/203307 [4:29:30<232:24:01,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3856/203307 [4:29:34<232:23:34,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3856/203307 [4:29:34<232:23:34,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3857/203307 [4:29:38<232:23:06,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3857/203307 [4:29:38<232:23:06,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3858/203307 [4:29:42<232:23:21,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3858/203307 [4:29:42<232:23:22,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3859/203307 [4:29:46<232:22:55,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3859/203307 [4:29:46<232:22:56,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3860/203307 [4:29:50<232:22:54,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3860/203307 [4:29:50<232:22:55,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3861/203307 [4:29:55<232:23:01,  0.24it/s, v_num=t5e6, training/loss=0.106]Epoch 0:   2%|▏         | 3861/203307 [4:29:55<232:23:01,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3862/203307 [4:29:58<232:22:31,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3862/203307 [4:29:58<232:22:32,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3863/203307 [4:30:02<232:22:06,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3863/203307 [4:30:02<232:22:06,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3864/203307 [4:30:06<232:21:43,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3864/203307 [4:30:06<232:21:43,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3865/203307 [4:30:10<232:21:16,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3865/203307 [4:30:10<232:21:17,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3866/203307 [4:30:14<232:21:25,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3866/203307 [4:30:14<232:21:25,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3867/203307 [4:30:18<232:21:32,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3867/203307 [4:30:19<232:21:33,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3868/203307 [4:30:22<232:21:02,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3868/203307 [4:30:22<232:21:03,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3869/203307 [4:30:26<232:20:59,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3869/203307 [4:30:26<232:20:59,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3870/203307 [4:30:31<232:21:02,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3870/203307 [4:30:31<232:21:02,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3871/203307 [4:30:34<232:20:32,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3871/203307 [4:30:34<232:20:33,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3872/203307 [4:30:38<232:20:02,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3872/203307 [4:30:38<232:20:03,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3873/203307 [4:30:42<232:19:35,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3873/203307 [4:30:42<232:19:35,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3874/203307 [4:30:46<232:19:05,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3874/203307 [4:30:46<232:19:06,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3875/203307 [4:30:50<232:19:19,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3875/203307 [4:30:50<232:19:19,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3876/203307 [4:30:54<232:18:52,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3876/203307 [4:30:54<232:18:53,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3877/203307 [4:30:58<232:18:21,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3877/203307 [4:30:58<232:18:21,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3878/203307 [4:31:02<232:18:26,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3878/203307 [4:31:02<232:18:27,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3879/203307 [4:31:06<232:17:58,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3879/203307 [4:31:06<232:17:58,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3880/203307 [4:31:09<232:17:29,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3880/203307 [4:31:09<232:17:29,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3881/203307 [4:31:13<232:17:04,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   2%|▏         | 3881/203307 [4:31:13<232:17:04,  0.24it/s, v_num=t5e6, training/loss=0.100] Epoch 0:   2%|▏         | 3882/203307 [4:31:17<232:16:35,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3882/203307 [4:31:17<232:16:35,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3883/203307 [4:31:21<232:16:46,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3883/203307 [4:31:21<232:16:47,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3884/203307 [4:31:26<232:16:57,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3884/203307 [4:31:26<232:16:58,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3885/203307 [4:31:30<232:16:28,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3885/203307 [4:31:30<232:16:29,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3886/203307 [4:31:34<232:16:34,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3886/203307 [4:31:34<232:16:34,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3887/203307 [4:31:38<232:16:29,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3887/203307 [4:31:38<232:16:29,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3888/203307 [4:31:42<232:16:00,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3888/203307 [4:31:42<232:16:00,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3889/203307 [4:31:46<232:15:31,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3889/203307 [4:31:46<232:15:31,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3890/203307 [4:31:49<232:15:02,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3890/203307 [4:31:49<232:15:02,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3891/203307 [4:31:53<232:14:32,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3891/203307 [4:31:53<232:14:33,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3892/203307 [4:31:57<232:14:47,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3892/203307 [4:31:57<232:14:47,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3893/203307 [4:32:01<232:14:19,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3893/203307 [4:32:01<232:14:20,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3894/203307 [4:32:05<232:13:48,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3894/203307 [4:32:05<232:13:48,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3895/203307 [4:32:09<232:13:56,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3895/203307 [4:32:09<232:13:56,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3896/203307 [4:32:13<232:13:49,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3896/203307 [4:32:13<232:13:49,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3897/203307 [4:32:17<232:13:23,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3897/203307 [4:32:17<232:13:24,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3898/203307 [4:32:21<232:12:56,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3898/203307 [4:32:21<232:12:57,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3899/203307 [4:32:25<232:12:26,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3899/203307 [4:32:25<232:12:27,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3900/203307 [4:32:29<232:12:39,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3900/203307 [4:32:29<232:12:39,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3901/203307 [4:32:34<232:12:47,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   2%|▏         | 3901/203307 [4:32:34<232:12:47,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3902/203307 [4:32:37<232:12:15,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3902/203307 [4:32:37<232:12:15,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3903/203307 [4:32:42<232:12:31,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3903/203307 [4:32:42<232:12:32,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3904/203307 [4:32:46<232:12:04,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3904/203307 [4:32:46<232:12:04,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3905/203307 [4:32:50<232:12:06,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3905/203307 [4:32:50<232:12:06,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3906/203307 [4:32:54<232:11:37,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3906/203307 [4:32:54<232:11:38,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3907/203307 [4:32:57<232:11:07,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3907/203307 [4:32:57<232:11:07,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3908/203307 [4:33:02<232:11:17,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3908/203307 [4:33:02<232:11:17,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3909/203307 [4:33:06<232:10:54,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3909/203307 [4:33:06<232:10:54,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3910/203307 [4:33:10<232:11:02,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3910/203307 [4:33:10<232:11:02,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3911/203307 [4:33:14<232:11:09,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3911/203307 [4:33:14<232:11:09,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3912/203307 [4:33:18<232:10:44,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3912/203307 [4:33:18<232:10:45,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3913/203307 [4:33:22<232:10:17,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3913/203307 [4:33:22<232:10:18,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3914/203307 [4:33:26<232:10:15,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3914/203307 [4:33:26<232:10:15,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3915/203307 [4:33:30<232:09:46,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3915/203307 [4:33:30<232:09:47,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3916/203307 [4:33:34<232:09:20,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3916/203307 [4:33:34<232:09:21,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3917/203307 [4:33:38<232:09:32,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3917/203307 [4:33:38<232:09:32,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3918/203307 [4:33:43<232:09:40,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3918/203307 [4:33:43<232:09:40,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3919/203307 [4:33:46<232:09:12,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3919/203307 [4:33:46<232:09:12,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3920/203307 [4:33:51<232:09:16,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3920/203307 [4:33:51<232:09:16,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3921/203307 [4:33:54<232:08:52,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 3921/203307 [4:33:54<232:08:52,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3922/203307 [4:33:58<232:08:23,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3922/203307 [4:33:58<232:08:24,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3923/203307 [4:34:03<232:08:26,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3923/203307 [4:34:03<232:08:27,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3924/203307 [4:34:06<232:07:58,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3924/203307 [4:34:06<232:07:58,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3925/203307 [4:34:11<232:08:05,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3925/203307 [4:34:11<232:08:05,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3926/203307 [4:34:14<232:07:41,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3926/203307 [4:34:14<232:07:41,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3927/203307 [4:34:19<232:07:50,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3927/203307 [4:34:19<232:07:51,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3928/203307 [4:34:23<232:07:51,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3928/203307 [4:34:23<232:07:52,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3929/203307 [4:34:27<232:07:28,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3929/203307 [4:34:27<232:07:28,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3930/203307 [4:34:31<232:07:08,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3930/203307 [4:34:31<232:07:08,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3931/203307 [4:34:35<232:06:43,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3931/203307 [4:34:35<232:06:43,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3932/203307 [4:34:39<232:06:47,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3932/203307 [4:34:39<232:06:48,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3933/203307 [4:34:43<232:06:56,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3933/203307 [4:34:43<232:06:56,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3934/203307 [4:34:47<232:06:29,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3934/203307 [4:34:47<232:06:29,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3935/203307 [4:34:51<232:05:58,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3935/203307 [4:34:51<232:05:58,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3936/203307 [4:34:56<232:06:20,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3936/203307 [4:34:56<232:06:20,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3937/203307 [4:34:59<232:05:54,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3937/203307 [4:34:59<232:05:54,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3938/203307 [4:35:03<232:05:24,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3938/203307 [4:35:03<232:05:25,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3939/203307 [4:35:07<232:04:53,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3939/203307 [4:35:07<232:04:53,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3940/203307 [4:35:10<232:04:24,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3940/203307 [4:35:10<232:04:24,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3941/203307 [4:35:15<232:04:31,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   2%|▏         | 3941/203307 [4:35:15<232:04:31,  0.24it/s, v_num=t5e6, training/loss=0.099] Epoch 0:   2%|▏         | 3942/203307 [4:35:19<232:04:41,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3942/203307 [4:35:19<232:04:41,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3943/203307 [4:35:23<232:04:18,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3943/203307 [4:35:23<232:04:18,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3944/203307 [4:35:27<232:04:23,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3944/203307 [4:35:27<232:04:23,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3945/203307 [4:35:32<232:04:27,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3945/203307 [4:35:32<232:04:28,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3946/203307 [4:35:36<232:04:00,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3946/203307 [4:35:36<232:04:00,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3947/203307 [4:35:39<232:03:31,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3947/203307 [4:35:39<232:03:31,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3948/203307 [4:35:43<232:03:05,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3948/203307 [4:35:43<232:03:06,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3949/203307 [4:35:47<232:02:40,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3949/203307 [4:35:47<232:02:40,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3950/203307 [4:35:51<232:02:49,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3950/203307 [4:35:51<232:02:50,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3951/203307 [4:35:55<232:02:24,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3951/203307 [4:35:55<232:02:24,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3952/203307 [4:35:59<232:01:56,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3952/203307 [4:35:59<232:01:56,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3953/203307 [4:36:03<232:02:11,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3953/203307 [4:36:03<232:02:12,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3954/203307 [4:36:07<232:01:45,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3954/203307 [4:36:07<232:01:45,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3955/203307 [4:36:11<232:01:18,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3955/203307 [4:36:11<232:01:18,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3956/203307 [4:36:15<232:00:53,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3956/203307 [4:36:15<232:00:54,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3957/203307 [4:36:18<232:00:25,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3957/203307 [4:36:18<232:00:25,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3958/203307 [4:36:23<232:00:35,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3958/203307 [4:36:23<232:00:36,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3959/203307 [4:36:27<232:00:33,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3959/203307 [4:36:27<232:00:33,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3960/203307 [4:36:31<232:00:03,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3960/203307 [4:36:31<232:00:03,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3961/203307 [4:36:35<232:00:07,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 3961/203307 [4:36:35<232:00:08,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3962/203307 [4:36:39<232:00:14,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3962/203307 [4:36:39<232:00:14,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3963/203307 [4:36:43<231:59:45,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3963/203307 [4:36:43<231:59:46,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3964/203307 [4:36:47<231:59:18,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3964/203307 [4:36:47<231:59:19,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3965/203307 [4:36:51<231:58:52,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3965/203307 [4:36:51<231:58:53,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3966/203307 [4:36:54<231:58:23,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3966/203307 [4:36:54<231:58:23,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3967/203307 [4:36:59<231:58:35,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3967/203307 [4:36:59<231:58:35,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3968/203307 [4:37:03<231:58:29,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3968/203307 [4:37:03<231:58:29,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3969/203307 [4:37:07<231:57:59,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3969/203307 [4:37:07<231:57:59,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3970/203307 [4:37:11<231:58:07,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3970/203307 [4:37:11<231:58:07,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3971/203307 [4:37:15<231:57:41,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3971/203307 [4:37:15<231:57:42,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3972/203307 [4:37:19<231:57:12,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3972/203307 [4:37:19<231:57:12,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3973/203307 [4:37:22<231:56:47,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3973/203307 [4:37:22<231:56:48,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3974/203307 [4:37:26<231:56:20,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3974/203307 [4:37:26<231:56:21,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3975/203307 [4:37:31<231:56:29,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3975/203307 [4:37:31<231:56:30,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3976/203307 [4:37:34<231:56:02,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3976/203307 [4:37:34<231:56:03,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3977/203307 [4:37:38<231:55:58,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3977/203307 [4:37:38<231:55:58,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3978/203307 [4:37:43<231:55:59,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3978/203307 [4:37:43<231:56:00,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3979/203307 [4:37:47<231:56:06,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3979/203307 [4:37:47<231:56:07,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3980/203307 [4:37:51<231:55:36,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3980/203307 [4:37:51<231:55:37,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3981/203307 [4:37:54<231:55:05,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 3981/203307 [4:37:55<231:55:06,  0.24it/s, v_num=t5e6, training/loss=0.105] Epoch 0:   2%|▏         | 3982/203307 [4:37:58<231:54:38,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3982/203307 [4:37:58<231:54:38,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3983/203307 [4:38:03<231:54:49,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3983/203307 [4:38:03<231:54:50,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3984/203307 [4:38:06<231:54:21,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3984/203307 [4:38:06<231:54:21,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3985/203307 [4:38:10<231:53:51,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3985/203307 [4:38:10<231:53:52,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3986/203307 [4:38:14<231:53:54,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3986/203307 [4:38:14<231:53:54,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3987/203307 [4:38:18<231:53:28,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3987/203307 [4:38:18<231:53:29,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3988/203307 [4:38:23<231:53:37,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3988/203307 [4:38:23<231:53:37,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3989/203307 [4:38:26<231:53:08,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3989/203307 [4:38:26<231:53:08,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3990/203307 [4:38:30<231:52:38,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3990/203307 [4:38:30<231:52:38,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3991/203307 [4:38:34<231:52:08,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3991/203307 [4:38:34<231:52:08,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3992/203307 [4:38:38<231:52:15,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3992/203307 [4:38:38<231:52:16,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3993/203307 [4:38:42<231:51:47,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3993/203307 [4:38:42<231:51:48,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3994/203307 [4:38:45<231:51:18,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3994/203307 [4:38:45<231:51:19,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3995/203307 [4:38:50<231:51:20,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3995/203307 [4:38:50<231:51:20,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3996/203307 [4:38:54<231:51:25,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3996/203307 [4:38:54<231:51:26,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3997/203307 [4:38:58<231:50:54,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3997/203307 [4:38:58<231:50:54,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3998/203307 [4:39:02<231:50:37,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3998/203307 [4:39:02<231:50:37,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3999/203307 [4:39:05<231:50:08,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 3999/203307 [4:39:05<231:50:09,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4000/203307 [4:39:10<231:50:16,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4000/203307 [4:39:10<231:50:16,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4001/203307 [4:39:14<231:49:46,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4001/203307 [4:39:14<231:49:47,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4002/203307 [4:39:17<231:49:21,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4002/203307 [4:39:17<231:49:21,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4003/203307 [4:39:22<231:49:22,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4003/203307 [4:39:22<231:49:22,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4004/203307 [4:39:26<231:49:18,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4004/203307 [4:39:26<231:49:19,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4005/203307 [4:39:30<231:49:23,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4005/203307 [4:39:30<231:49:24,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4006/203307 [4:39:34<231:48:57,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4006/203307 [4:39:34<231:48:57,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4007/203307 [4:39:38<231:48:28,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4007/203307 [4:39:38<231:48:28,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4008/203307 [4:39:42<231:48:36,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4008/203307 [4:39:42<231:48:36,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4009/203307 [4:39:46<231:48:08,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4009/203307 [4:39:46<231:48:09,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4010/203307 [4:39:49<231:47:39,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4010/203307 [4:39:49<231:47:39,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4011/203307 [4:39:54<231:47:41,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4011/203307 [4:39:54<231:47:41,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4012/203307 [4:39:57<231:47:14,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4012/203307 [4:39:57<231:47:14,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4013/203307 [4:40:02<231:47:11,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4013/203307 [4:40:02<231:47:11,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4014/203307 [4:40:06<231:47:17,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4014/203307 [4:40:06<231:47:18,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4015/203307 [4:40:10<231:46:53,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4015/203307 [4:40:10<231:46:53,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4016/203307 [4:40:13<231:46:21,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4016/203307 [4:40:13<231:46:22,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4017/203307 [4:40:18<231:46:31,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4017/203307 [4:40:18<231:46:31,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4018/203307 [4:40:22<231:46:05,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4018/203307 [4:40:22<231:46:05,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4019/203307 [4:40:25<231:45:41,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4019/203307 [4:40:25<231:45:41,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4020/203307 [4:40:30<231:45:44,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4020/203307 [4:40:30<231:45:45,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4021/203307 [4:40:34<231:45:15,  0.24it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   2%|▏         | 4021/203307 [4:40:34<231:45:15,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4022/203307 [4:40:38<231:45:22,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4022/203307 [4:40:38<231:45:22,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4023/203307 [4:40:42<231:44:56,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4023/203307 [4:40:42<231:44:57,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4024/203307 [4:40:45<231:44:25,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4024/203307 [4:40:45<231:44:26,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4025/203307 [4:40:50<231:44:32,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4025/203307 [4:40:50<231:44:32,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4026/203307 [4:40:53<231:44:06,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4026/203307 [4:40:53<231:44:07,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4027/203307 [4:40:57<231:43:36,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4027/203307 [4:40:57<231:43:37,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4028/203307 [4:41:01<231:43:36,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4028/203307 [4:41:01<231:43:37,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4029/203307 [4:41:05<231:43:09,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4029/203307 [4:41:05<231:43:09,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4030/203307 [4:41:09<231:42:37,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4030/203307 [4:41:09<231:42:38,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4031/203307 [4:41:13<231:42:43,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4031/203307 [4:41:13<231:42:43,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4032/203307 [4:41:17<231:42:16,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4032/203307 [4:41:17<231:42:16,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4033/203307 [4:41:21<231:42:24,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4033/203307 [4:41:21<231:42:25,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4034/203307 [4:41:25<231:41:56,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4034/203307 [4:41:25<231:41:56,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4035/203307 [4:41:29<231:41:25,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4035/203307 [4:41:29<231:41:25,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4036/203307 [4:41:33<231:41:29,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4036/203307 [4:41:33<231:41:29,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4037/203307 [4:41:37<231:41:02,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4037/203307 [4:41:37<231:41:02,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4038/203307 [4:41:40<231:40:33,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4038/203307 [4:41:40<231:40:33,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4039/203307 [4:41:44<231:40:02,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4039/203307 [4:41:44<231:40:03,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4040/203307 [4:41:48<231:40:08,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4040/203307 [4:41:48<231:40:09,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4041/203307 [4:41:52<231:39:40,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 4041/203307 [4:41:52<231:39:40,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4042/203307 [4:41:57<231:39:46,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4042/203307 [4:41:57<231:39:46,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4043/203307 [4:42:00<231:39:16,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4043/203307 [4:42:00<231:39:16,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4044/203307 [4:42:04<231:38:45,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4044/203307 [4:42:04<231:38:45,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4045/203307 [4:42:08<231:38:44,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4045/203307 [4:42:08<231:38:44,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4046/203307 [4:42:12<231:38:14,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4046/203307 [4:42:12<231:38:15,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4047/203307 [4:42:15<231:37:47,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4047/203307 [4:42:15<231:37:47,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4048/203307 [4:42:20<231:37:58,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4048/203307 [4:42:20<231:37:58,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4049/203307 [4:42:24<231:37:54,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4049/203307 [4:42:24<231:37:55,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4050/203307 [4:42:29<231:38:01,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4050/203307 [4:42:29<231:38:02,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4051/203307 [4:42:32<231:37:35,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4051/203307 [4:42:32<231:37:35,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4052/203307 [4:42:36<231:37:13,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4052/203307 [4:42:36<231:37:13,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4053/203307 [4:42:40<231:37:15,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4053/203307 [4:42:40<231:37:16,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4054/203307 [4:42:44<231:36:49,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4054/203307 [4:42:44<231:36:49,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4055/203307 [4:42:48<231:36:21,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4055/203307 [4:42:48<231:36:22,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4056/203307 [4:42:52<231:35:55,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4056/203307 [4:42:52<231:35:56,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4057/203307 [4:42:56<231:36:07,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4057/203307 [4:42:56<231:36:07,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4058/203307 [4:43:01<231:36:18,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4058/203307 [4:43:01<231:36:18,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4059/203307 [4:43:04<231:35:54,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4059/203307 [4:43:04<231:35:54,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4060/203307 [4:43:08<231:35:29,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4060/203307 [4:43:08<231:35:29,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4061/203307 [4:43:13<231:35:35,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   2%|▏         | 4061/203307 [4:43:13<231:35:36,  0.24it/s, v_num=t5e6, training/loss=0.104] Epoch 0:   2%|▏         | 4062/203307 [4:43:17<231:35:25,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4062/203307 [4:43:17<231:35:25,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4063/203307 [4:43:20<231:34:57,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4063/203307 [4:43:20<231:34:57,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4064/203307 [4:43:24<231:34:26,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4064/203307 [4:43:24<231:34:27,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4065/203307 [4:43:28<231:33:56,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4065/203307 [4:43:28<231:33:56,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4066/203307 [4:43:32<231:34:05,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4066/203307 [4:43:32<231:34:05,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4067/203307 [4:43:36<231:34:11,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4067/203307 [4:43:36<231:34:12,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4068/203307 [4:43:40<231:33:42,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4068/203307 [4:43:40<231:33:42,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4069/203307 [4:43:44<231:33:12,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4069/203307 [4:43:44<231:33:12,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4070/203307 [4:43:48<231:33:15,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4070/203307 [4:43:48<231:33:15,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4071/203307 [4:43:52<231:32:44,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4071/203307 [4:43:52<231:32:45,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4072/203307 [4:43:55<231:32:17,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4072/203307 [4:43:56<231:32:18,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4073/203307 [4:43:59<231:31:49,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4073/203307 [4:43:59<231:31:49,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4074/203307 [4:44:04<231:31:54,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4074/203307 [4:44:04<231:31:54,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4075/203307 [4:44:08<231:31:57,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4075/203307 [4:44:08<231:31:57,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4076/203307 [4:44:12<231:31:49,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4076/203307 [4:44:12<231:31:49,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4077/203307 [4:44:16<231:31:20,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4077/203307 [4:44:16<231:31:20,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4078/203307 [4:44:20<231:31:24,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4078/203307 [4:44:20<231:31:25,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4079/203307 [4:44:24<231:30:56,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4079/203307 [4:44:24<231:30:56,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4080/203307 [4:44:27<231:30:28,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4080/203307 [4:44:27<231:30:28,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4081/203307 [4:44:31<231:30:02,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   2%|▏         | 4081/203307 [4:44:31<231:30:02,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4082/203307 [4:44:35<231:29:37,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4082/203307 [4:44:35<231:29:37,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4083/203307 [4:44:39<231:29:47,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4083/203307 [4:44:39<231:29:48,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4084/203307 [4:44:43<231:29:20,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4084/203307 [4:44:43<231:29:21,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4085/203307 [4:44:47<231:29:17,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4085/203307 [4:44:47<231:29:18,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4086/203307 [4:44:52<231:29:23,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4086/203307 [4:44:52<231:29:23,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4087/203307 [4:44:55<231:28:58,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4087/203307 [4:44:55<231:28:58,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4088/203307 [4:44:59<231:28:34,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4088/203307 [4:44:59<231:28:34,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4089/203307 [4:45:03<231:28:11,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4089/203307 [4:45:03<231:28:11,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4090/203307 [4:45:07<231:27:47,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4090/203307 [4:45:07<231:27:48,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4091/203307 [4:45:11<231:27:27,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4091/203307 [4:45:11<231:27:28,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4092/203307 [4:45:15<231:27:38,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4092/203307 [4:45:15<231:27:39,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4093/203307 [4:45:19<231:27:14,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4093/203307 [4:45:19<231:27:15,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4094/203307 [4:45:23<231:27:12,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4094/203307 [4:45:23<231:27:12,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4095/203307 [4:45:27<231:27:16,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4095/203307 [4:45:28<231:27:16,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4096/203307 [4:45:31<231:26:48,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4096/203307 [4:45:31<231:26:49,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4097/203307 [4:45:35<231:26:21,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4097/203307 [4:45:35<231:26:21,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4098/203307 [4:45:39<231:25:58,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4098/203307 [4:45:39<231:25:58,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4099/203307 [4:45:42<231:25:30,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4099/203307 [4:45:42<231:25:31,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4100/203307 [4:45:47<231:25:40,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4100/203307 [4:45:47<231:25:41,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4101/203307 [4:45:51<231:25:14,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   2%|▏         | 4101/203307 [4:45:51<231:25:14,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4102/203307 [4:45:54<231:24:48,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4102/203307 [4:45:54<231:24:48,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4103/203307 [4:45:59<231:24:51,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4103/203307 [4:45:59<231:24:52,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4104/203307 [4:46:02<231:24:23,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4104/203307 [4:46:02<231:24:24,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4105/203307 [4:46:06<231:23:55,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4105/203307 [4:46:06<231:23:56,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4106/203307 [4:46:10<231:23:29,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4106/203307 [4:46:10<231:23:29,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4107/203307 [4:46:13<231:23:01,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4107/203307 [4:46:13<231:23:01,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4108/203307 [4:46:18<231:23:14,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4108/203307 [4:46:18<231:23:14,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4109/203307 [4:46:22<231:23:25,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4109/203307 [4:46:23<231:23:25,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4110/203307 [4:46:26<231:22:56,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4110/203307 [4:46:26<231:22:56,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4111/203307 [4:46:31<231:22:59,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4111/203307 [4:46:31<231:23:00,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4112/203307 [4:46:35<231:23:02,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4112/203307 [4:46:35<231:23:02,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4113/203307 [4:46:39<231:22:35,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4113/203307 [4:46:39<231:22:35,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4114/203307 [4:46:42<231:22:05,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4114/203307 [4:46:42<231:22:05,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4115/203307 [4:46:46<231:21:41,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4115/203307 [4:46:46<231:21:41,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4116/203307 [4:46:50<231:21:11,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4116/203307 [4:46:50<231:21:12,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4117/203307 [4:46:54<231:21:27,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4117/203307 [4:46:54<231:21:28,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4118/203307 [4:46:59<231:21:34,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4118/203307 [4:46:59<231:21:35,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4119/203307 [4:47:02<231:21:08,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4119/203307 [4:47:02<231:21:08,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4120/203307 [4:47:07<231:21:10,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4120/203307 [4:47:07<231:21:10,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4121/203307 [4:47:11<231:21:16,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4121/203307 [4:47:11<231:21:16,  0.24it/s, v_num=t5e6, training/loss=0.102] Epoch 0:   2%|▏         | 4122/203307 [4:47:15<231:20:47,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4122/203307 [4:47:15<231:20:48,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4123/203307 [4:47:18<231:20:20,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4123/203307 [4:47:18<231:20:21,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4124/203307 [4:47:22<231:19:52,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4124/203307 [4:47:22<231:19:52,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4125/203307 [4:47:27<231:20:00,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4125/203307 [4:47:27<231:20:01,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4126/203307 [4:47:31<231:20:08,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4126/203307 [4:47:31<231:20:08,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4127/203307 [4:47:35<231:19:39,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4127/203307 [4:47:35<231:19:39,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4128/203307 [4:47:39<231:19:38,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4128/203307 [4:47:39<231:19:38,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4129/203307 [4:47:43<231:19:10,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4129/203307 [4:47:43<231:19:10,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4130/203307 [4:47:47<231:19:09,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4130/203307 [4:47:47<231:19:10,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4131/203307 [4:47:51<231:18:40,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4131/203307 [4:47:51<231:18:41,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4132/203307 [4:47:54<231:18:14,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4132/203307 [4:47:54<231:18:14,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4133/203307 [4:47:59<231:18:20,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4133/203307 [4:47:59<231:18:20,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4134/203307 [4:48:02<231:17:54,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4134/203307 [4:48:02<231:17:55,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4135/203307 [4:48:07<231:18:02,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4135/203307 [4:48:07<231:18:03,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4136/203307 [4:48:11<231:18:05,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4136/203307 [4:48:11<231:18:05,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4137/203307 [4:48:15<231:17:39,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4137/203307 [4:48:15<231:17:39,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4138/203307 [4:48:19<231:17:13,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4138/203307 [4:48:19<231:17:14,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4139/203307 [4:48:23<231:17:11,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4139/203307 [4:48:23<231:17:12,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4140/203307 [4:48:27<231:16:47,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4140/203307 [4:48:27<231:16:48,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4141/203307 [4:48:30<231:16:28,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4141/203307 [4:48:30<231:16:28,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4142/203307 [4:48:35<231:16:37,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4142/203307 [4:48:35<231:16:37,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4143/203307 [4:48:39<231:16:10,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4143/203307 [4:48:39<231:16:10,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4144/203307 [4:48:43<231:16:18,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4144/203307 [4:48:43<231:16:18,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4145/203307 [4:48:47<231:16:25,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4145/203307 [4:48:47<231:16:25,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4146/203307 [4:48:51<231:15:57,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4146/203307 [4:48:51<231:15:58,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4147/203307 [4:48:55<231:15:32,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4147/203307 [4:48:55<231:15:33,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4148/203307 [4:48:59<231:15:41,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4148/203307 [4:48:59<231:15:41,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4149/203307 [4:49:03<231:15:15,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4149/203307 [4:49:03<231:15:16,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4150/203307 [4:49:08<231:15:25,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4150/203307 [4:49:08<231:15:26,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4151/203307 [4:49:11<231:15:00,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4151/203307 [4:49:11<231:15:01,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4152/203307 [4:49:16<231:15:04,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4152/203307 [4:49:16<231:15:04,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4153/203307 [4:49:20<231:15:09,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4153/203307 [4:49:20<231:15:09,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4154/203307 [4:49:24<231:14:46,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4154/203307 [4:49:24<231:14:47,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4155/203307 [4:49:28<231:14:23,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4155/203307 [4:49:28<231:14:23,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4156/203307 [4:49:31<231:13:58,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4156/203307 [4:49:31<231:13:58,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4157/203307 [4:49:36<231:14:03,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4157/203307 [4:49:36<231:14:03,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4158/203307 [4:49:40<231:14:12,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4158/203307 [4:49:40<231:14:13,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4159/203307 [4:49:44<231:13:45,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4159/203307 [4:49:44<231:13:46,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4160/203307 [4:49:48<231:13:18,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4160/203307 [4:49:48<231:13:19,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4161/203307 [4:49:52<231:13:35,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4161/203307 [4:49:52<231:13:36,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4162/203307 [4:49:56<231:13:11,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4162/203307 [4:49:56<231:13:11,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4163/203307 [4:50:00<231:12:48,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4163/203307 [4:50:00<231:12:48,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4164/203307 [4:50:03<231:12:22,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4164/203307 [4:50:03<231:12:23,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4165/203307 [4:50:07<231:11:56,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4165/203307 [4:50:07<231:11:57,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4166/203307 [4:50:12<231:12:08,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4166/203307 [4:50:12<231:12:08,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4167/203307 [4:50:16<231:12:22,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4167/203307 [4:50:16<231:12:22,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4168/203307 [4:50:20<231:11:55,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4168/203307 [4:50:20<231:11:55,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4169/203307 [4:50:24<231:11:33,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4169/203307 [4:50:24<231:11:34,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4170/203307 [4:50:28<231:11:44,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4170/203307 [4:50:28<231:11:45,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4171/203307 [4:50:32<231:11:19,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4171/203307 [4:50:32<231:11:20,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4172/203307 [4:50:36<231:10:53,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4172/203307 [4:50:36<231:10:54,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4173/203307 [4:50:39<231:10:28,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4173/203307 [4:50:39<231:10:28,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4174/203307 [4:50:43<231:10:00,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4174/203307 [4:50:43<231:10:00,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4175/203307 [4:50:48<231:10:16,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4175/203307 [4:50:48<231:10:16,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4176/203307 [4:50:52<231:09:53,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4176/203307 [4:50:52<231:09:54,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4177/203307 [4:50:55<231:09:28,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4177/203307 [4:50:55<231:09:28,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4178/203307 [4:51:00<231:09:38,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4178/203307 [4:51:00<231:09:38,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4179/203307 [4:51:04<231:09:16,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4179/203307 [4:51:04<231:09:16,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4180/203307 [4:51:07<231:08:50,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4180/203307 [4:51:07<231:08:50,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4181/203307 [4:51:11<231:08:28,  0.24it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   2%|▏         | 4181/203307 [4:51:11<231:08:28,  0.24it/s, v_num=t5e6, training/loss=0.088] Epoch 0:   2%|▏         | 4182/203307 [4:51:15<231:08:03,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4182/203307 [4:51:15<231:08:03,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4183/203307 [4:51:19<231:08:16,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4183/203307 [4:51:19<231:08:16,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4184/203307 [4:51:24<231:08:17,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4184/203307 [4:51:24<231:08:17,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4185/203307 [4:51:27<231:07:54,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4185/203307 [4:51:27<231:07:54,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4186/203307 [4:51:32<231:08:00,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4186/203307 [4:51:32<231:08:00,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4187/203307 [4:51:36<231:08:08,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4187/203307 [4:51:36<231:08:08,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4188/203307 [4:51:40<231:07:42,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4188/203307 [4:51:40<231:07:42,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4189/203307 [4:51:44<231:07:17,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4189/203307 [4:51:44<231:07:17,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4190/203307 [4:51:47<231:06:52,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4190/203307 [4:51:47<231:06:52,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4191/203307 [4:51:51<231:06:27,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4191/203307 [4:51:51<231:06:27,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4192/203307 [4:51:56<231:06:41,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4192/203307 [4:51:56<231:06:42,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4193/203307 [4:52:00<231:06:39,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4193/203307 [4:52:00<231:06:39,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4194/203307 [4:52:04<231:06:12,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4194/203307 [4:52:04<231:06:13,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4195/203307 [4:52:08<231:06:17,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4195/203307 [4:52:08<231:06:18,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4196/203307 [4:52:13<231:06:26,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4196/203307 [4:52:13<231:06:26,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4197/203307 [4:52:16<231:06:00,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4197/203307 [4:52:16<231:06:00,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4198/203307 [4:52:20<231:05:31,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4198/203307 [4:52:20<231:05:32,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4199/203307 [4:52:24<231:05:04,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4199/203307 [4:52:24<231:05:04,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4200/203307 [4:52:28<231:05:15,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4200/203307 [4:52:28<231:05:15,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4201/203307 [4:52:32<231:04:47,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   2%|▏         | 4201/203307 [4:52:32<231:04:47,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4202/203307 [4:52:36<231:04:47,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4202/203307 [4:52:36<231:04:47,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4203/203307 [4:52:40<231:04:43,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4203/203307 [4:52:40<231:04:43,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4204/203307 [4:52:45<231:04:47,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4204/203307 [4:52:45<231:04:47,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4205/203307 [4:52:48<231:04:20,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4205/203307 [4:52:48<231:04:20,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4206/203307 [4:52:52<231:03:50,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4206/203307 [4:52:52<231:03:50,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4207/203307 [4:52:56<231:03:24,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4207/203307 [4:52:56<231:03:24,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4208/203307 [4:53:00<231:03:32,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4208/203307 [4:53:00<231:03:32,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4209/203307 [4:53:04<231:03:04,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4209/203307 [4:53:04<231:03:04,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4210/203307 [4:53:07<231:02:32,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4210/203307 [4:53:07<231:02:32,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4211/203307 [4:53:12<231:02:33,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4211/203307 [4:53:12<231:02:33,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4212/203307 [4:53:15<231:02:07,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4212/203307 [4:53:15<231:02:07,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4213/203307 [4:53:20<231:02:14,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4213/203307 [4:53:20<231:02:14,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4214/203307 [4:53:23<231:01:46,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4214/203307 [4:53:23<231:01:46,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4215/203307 [4:53:27<231:01:16,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4215/203307 [4:53:27<231:01:17,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4216/203307 [4:53:31<231:00:53,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4216/203307 [4:53:31<231:00:53,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4217/203307 [4:53:35<231:01:04,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4217/203307 [4:53:35<231:01:04,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4218/203307 [4:53:39<231:00:34,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4218/203307 [4:53:39<231:00:35,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4219/203307 [4:53:43<231:00:07,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4219/203307 [4:53:43<231:00:07,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4220/203307 [4:53:47<231:00:15,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4220/203307 [4:53:47<231:00:16,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4221/203307 [4:53:51<230:59:50,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   2%|▏         | 4221/203307 [4:53:51<230:59:51,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4222/203307 [4:53:55<230:59:58,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4222/203307 [4:53:55<230:59:58,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4223/203307 [4:53:59<230:59:33,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4223/203307 [4:53:59<230:59:33,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4224/203307 [4:54:03<230:59:06,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4224/203307 [4:54:03<230:59:06,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4225/203307 [4:54:07<230:59:20,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4225/203307 [4:54:07<230:59:20,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4226/203307 [4:54:11<230:58:55,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4226/203307 [4:54:11<230:58:55,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4227/203307 [4:54:15<230:58:26,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4227/203307 [4:54:15<230:58:27,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4228/203307 [4:54:19<230:58:34,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4228/203307 [4:54:19<230:58:35,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4229/203307 [4:54:23<230:58:29,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4229/203307 [4:54:23<230:58:30,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4230/203307 [4:54:28<230:58:33,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4230/203307 [4:54:28<230:58:34,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4231/203307 [4:54:31<230:58:06,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4231/203307 [4:54:31<230:58:06,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4232/203307 [4:54:35<230:57:37,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4232/203307 [4:54:35<230:57:38,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4233/203307 [4:54:39<230:57:47,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4233/203307 [4:54:39<230:57:48,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4234/203307 [4:54:43<230:57:22,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4234/203307 [4:54:43<230:57:22,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4235/203307 [4:54:47<230:56:55,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4235/203307 [4:54:47<230:56:56,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4236/203307 [4:54:51<230:56:57,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4236/203307 [4:54:51<230:56:58,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4237/203307 [4:54:55<230:56:32,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4237/203307 [4:54:55<230:56:32,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4238/203307 [4:54:59<230:56:28,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4238/203307 [4:54:59<230:56:29,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4239/203307 [4:55:03<230:56:33,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4239/203307 [4:55:03<230:56:33,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4240/203307 [4:55:07<230:56:04,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4240/203307 [4:55:07<230:56:05,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4241/203307 [4:55:11<230:55:39,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   2%|▏         | 4241/203307 [4:55:11<230:55:40,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4242/203307 [4:55:15<230:55:48,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4242/203307 [4:55:15<230:55:48,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4243/203307 [4:55:19<230:55:25,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4243/203307 [4:55:19<230:55:25,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4244/203307 [4:55:23<230:55:05,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4244/203307 [4:55:23<230:55:06,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4245/203307 [4:55:27<230:55:20,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4245/203307 [4:55:27<230:55:20,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4246/203307 [4:55:31<230:54:54,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4246/203307 [4:55:31<230:54:54,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4247/203307 [4:55:35<230:54:53,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4247/203307 [4:55:35<230:54:53,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4248/203307 [4:55:40<230:55:02,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4248/203307 [4:55:40<230:55:03,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4249/203307 [4:55:44<230:54:37,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4249/203307 [4:55:44<230:54:37,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4250/203307 [4:55:48<230:54:44,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4250/203307 [4:55:48<230:54:45,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4251/203307 [4:55:52<230:54:23,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4251/203307 [4:55:52<230:54:24,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4252/203307 [4:55:55<230:53:55,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4252/203307 [4:55:55<230:53:56,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4253/203307 [4:56:00<230:54:03,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4253/203307 [4:56:00<230:54:03,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4254/203307 [4:56:04<230:53:38,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4254/203307 [4:56:04<230:53:39,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4255/203307 [4:56:07<230:53:11,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4255/203307 [4:56:07<230:53:12,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4256/203307 [4:56:12<230:53:22,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4256/203307 [4:56:12<230:53:23,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4257/203307 [4:56:16<230:52:56,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4257/203307 [4:56:16<230:52:57,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4258/203307 [4:56:20<230:53:03,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4258/203307 [4:56:20<230:53:03,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4259/203307 [4:56:24<230:52:38,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4259/203307 [4:56:24<230:52:38,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4260/203307 [4:56:27<230:52:09,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4260/203307 [4:56:27<230:52:09,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4261/203307 [4:56:32<230:52:14,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   2%|▏         | 4261/203307 [4:56:32<230:52:15,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4262/203307 [4:56:35<230:51:49,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4262/203307 [4:56:35<230:51:49,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4263/203307 [4:56:39<230:51:19,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4263/203307 [4:56:39<230:51:19,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4264/203307 [4:56:43<230:50:54,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4264/203307 [4:56:43<230:50:54,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4265/203307 [4:56:47<230:51:04,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4265/203307 [4:56:47<230:51:04,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4266/203307 [4:56:51<230:50:35,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4266/203307 [4:56:51<230:50:35,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4267/203307 [4:56:55<230:50:43,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4267/203307 [4:56:55<230:50:43,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4268/203307 [4:56:59<230:50:14,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4268/203307 [4:56:59<230:50:14,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4269/203307 [4:57:03<230:49:48,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4269/203307 [4:57:03<230:49:49,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4270/203307 [4:57:07<230:49:52,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4270/203307 [4:57:07<230:49:53,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4271/203307 [4:57:11<230:49:26,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4271/203307 [4:57:11<230:49:26,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4272/203307 [4:57:14<230:48:57,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4272/203307 [4:57:14<230:48:58,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4273/203307 [4:57:18<230:48:38,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4273/203307 [4:57:18<230:48:38,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4274/203307 [4:57:23<230:48:46,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4274/203307 [4:57:23<230:48:47,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4275/203307 [4:57:27<230:48:50,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4275/203307 [4:57:27<230:48:50,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4276/203307 [4:57:31<230:48:24,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4276/203307 [4:57:31<230:48:24,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4277/203307 [4:57:34<230:48:00,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4277/203307 [4:57:34<230:48:00,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4278/203307 [4:57:39<230:48:00,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4278/203307 [4:57:39<230:48:01,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4279/203307 [4:57:42<230:47:35,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4279/203307 [4:57:42<230:47:36,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4280/203307 [4:57:46<230:47:10,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4280/203307 [4:57:46<230:47:10,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4281/203307 [4:57:50<230:46:43,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   2%|▏         | 4281/203307 [4:57:50<230:46:43,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4282/203307 [4:57:54<230:46:47,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4282/203307 [4:57:54<230:46:47,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4283/203307 [4:57:59<230:46:52,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4283/203307 [4:57:59<230:46:52,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4284/203307 [4:58:02<230:46:25,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4284/203307 [4:58:02<230:46:25,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4285/203307 [4:58:06<230:45:57,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4285/203307 [4:58:06<230:45:58,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4286/203307 [4:58:10<230:46:01,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4286/203307 [4:58:10<230:46:02,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4287/203307 [4:58:14<230:45:36,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4287/203307 [4:58:14<230:45:36,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4288/203307 [4:58:18<230:45:11,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4288/203307 [4:58:18<230:45:11,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4289/203307 [4:58:21<230:44:46,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4289/203307 [4:58:21<230:44:47,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4290/203307 [4:58:25<230:44:21,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4290/203307 [4:58:25<230:44:22,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4291/203307 [4:58:30<230:44:32,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4291/203307 [4:58:30<230:44:32,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4292/203307 [4:58:34<230:44:45,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4292/203307 [4:58:34<230:44:46,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4293/203307 [4:58:38<230:44:21,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4293/203307 [4:58:38<230:44:22,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4294/203307 [4:58:42<230:43:55,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4294/203307 [4:58:42<230:43:55,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4295/203307 [4:58:46<230:44:00,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4295/203307 [4:58:46<230:44:01,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4296/203307 [4:58:50<230:43:36,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4296/203307 [4:58:50<230:43:37,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4297/203307 [4:58:54<230:43:15,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4297/203307 [4:58:54<230:43:15,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4298/203307 [4:58:57<230:42:50,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4298/203307 [4:58:57<230:42:50,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4299/203307 [4:59:01<230:42:24,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4299/203307 [4:59:01<230:42:24,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4300/203307 [4:59:06<230:42:38,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4300/203307 [4:59:06<230:42:38,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4301/203307 [4:59:10<230:42:39,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:   2%|▏         | 4301/203307 [4:59:10<230:42:40,  0.24it/s, v_num=t5e6, training/loss=0.102] Epoch 0:   2%|▏         | 4302/203307 [4:59:14<230:42:13,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4302/203307 [4:59:14<230:42:13,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4303/203307 [4:59:18<230:42:16,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4303/203307 [4:59:18<230:42:17,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4304/203307 [4:59:22<230:41:51,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4304/203307 [4:59:22<230:41:51,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4305/203307 [4:59:25<230:41:24,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4305/203307 [4:59:25<230:41:24,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4306/203307 [4:59:29<230:40:58,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4306/203307 [4:59:29<230:40:59,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4307/203307 [4:59:33<230:40:32,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4307/203307 [4:59:33<230:40:33,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4308/203307 [4:59:37<230:40:46,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4308/203307 [4:59:37<230:40:46,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4309/203307 [4:59:41<230:40:21,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4309/203307 [4:59:41<230:40:22,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4310/203307 [4:59:45<230:40:16,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4310/203307 [4:59:45<230:40:16,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4311/203307 [4:59:49<230:40:16,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4311/203307 [4:59:49<230:40:17,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4312/203307 [4:59:53<230:39:52,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4312/203307 [4:59:53<230:39:52,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4313/203307 [4:59:57<230:39:26,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4313/203307 [4:59:57<230:39:26,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4314/203307 [5:00:01<230:39:01,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4314/203307 [5:00:01<230:39:01,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4315/203307 [5:00:04<230:38:35,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4315/203307 [5:00:04<230:38:35,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4316/203307 [5:00:08<230:38:09,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4316/203307 [5:00:08<230:38:09,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4317/203307 [5:00:12<230:38:19,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4317/203307 [5:00:12<230:38:19,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4318/203307 [5:00:16<230:37:52,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4318/203307 [5:00:16<230:37:52,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4319/203307 [5:00:20<230:37:50,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4319/203307 [5:00:20<230:37:51,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4320/203307 [5:00:25<230:37:55,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4320/203307 [5:00:25<230:37:55,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4321/203307 [5:00:28<230:37:31,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   2%|▏         | 4321/203307 [5:00:29<230:37:32,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4322/203307 [5:00:32<230:37:07,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4322/203307 [5:00:32<230:37:07,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4323/203307 [5:00:36<230:36:42,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4323/203307 [5:00:36<230:36:42,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4324/203307 [5:00:40<230:36:18,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4324/203307 [5:00:40<230:36:18,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4325/203307 [5:00:44<230:36:30,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4325/203307 [5:00:44<230:36:30,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4326/203307 [5:00:49<230:36:33,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4326/203307 [5:00:49<230:36:33,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4327/203307 [5:00:52<230:36:06,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4327/203307 [5:00:52<230:36:07,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4328/203307 [5:00:57<230:36:11,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4328/203307 [5:00:57<230:36:11,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4329/203307 [5:01:00<230:35:48,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4329/203307 [5:01:00<230:35:48,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4330/203307 [5:01:04<230:35:23,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4330/203307 [5:01:04<230:35:23,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4331/203307 [5:01:08<230:35:00,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4331/203307 [5:01:08<230:35:01,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4332/203307 [5:01:12<230:34:35,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4332/203307 [5:01:12<230:34:35,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4333/203307 [5:01:16<230:34:46,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4333/203307 [5:01:16<230:34:46,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4334/203307 [5:01:20<230:34:52,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4334/203307 [5:01:20<230:34:52,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4335/203307 [5:01:24<230:34:27,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4335/203307 [5:01:24<230:34:28,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4336/203307 [5:01:29<230:34:31,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4336/203307 [5:01:29<230:34:32,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4337/203307 [5:01:33<230:34:30,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4337/203307 [5:01:33<230:34:30,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4338/203307 [5:01:36<230:34:06,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4338/203307 [5:01:37<230:34:06,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4339/203307 [5:01:40<230:33:43,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4339/203307 [5:01:40<230:33:43,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4340/203307 [5:01:44<230:33:18,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4340/203307 [5:01:44<230:33:18,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4341/203307 [5:01:48<230:32:50,  0.24it/s, v_num=t5e6, training/loss=0.110]Epoch 0:   2%|▏         | 4341/203307 [5:01:48<230:32:51,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4342/203307 [5:01:52<230:33:01,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4342/203307 [5:01:52<230:33:01,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4343/203307 [5:01:57<230:33:06,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4343/203307 [5:01:57<230:33:07,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4344/203307 [5:02:00<230:32:40,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4344/203307 [5:02:00<230:32:41,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4345/203307 [5:02:05<230:32:45,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4345/203307 [5:02:05<230:32:45,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4346/203307 [5:02:09<230:32:39,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4346/203307 [5:02:09<230:32:39,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4347/203307 [5:02:12<230:32:14,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4347/203307 [5:02:12<230:32:14,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4348/203307 [5:02:16<230:31:52,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4348/203307 [5:02:16<230:31:53,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4349/203307 [5:02:20<230:31:32,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4349/203307 [5:02:20<230:31:33,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4350/203307 [5:02:25<230:31:43,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4350/203307 [5:02:25<230:31:44,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4351/203307 [5:02:28<230:31:21,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4351/203307 [5:02:28<230:31:22,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4352/203307 [5:02:33<230:31:32,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4352/203307 [5:02:33<230:31:32,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4353/203307 [5:02:37<230:31:36,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4353/203307 [5:02:37<230:31:36,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4354/203307 [5:02:41<230:31:16,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4354/203307 [5:02:41<230:31:16,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4355/203307 [5:02:45<230:31:12,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4355/203307 [5:02:45<230:31:13,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4356/203307 [5:02:49<230:30:51,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4356/203307 [5:02:49<230:30:51,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4357/203307 [5:02:53<230:30:26,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4357/203307 [5:02:53<230:30:26,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4358/203307 [5:02:57<230:30:40,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4358/203307 [5:02:57<230:30:40,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4359/203307 [5:03:01<230:30:20,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4359/203307 [5:03:01<230:30:20,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4360/203307 [5:03:05<230:30:25,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4360/203307 [5:03:05<230:30:25,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4361/203307 [5:03:10<230:30:33,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4361/203307 [5:03:10<230:30:33,  0.24it/s, v_num=t5e6, training/loss=0.105] Epoch 0:   2%|▏         | 4362/203307 [5:03:14<230:30:10,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4362/203307 [5:03:14<230:30:10,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4363/203307 [5:03:17<230:29:48,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4363/203307 [5:03:17<230:29:49,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4364/203307 [5:03:22<230:29:51,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4364/203307 [5:03:22<230:29:51,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4365/203307 [5:03:25<230:29:27,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4365/203307 [5:03:25<230:29:27,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4366/203307 [5:03:29<230:29:05,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4366/203307 [5:03:29<230:29:06,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4367/203307 [5:03:34<230:29:16,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4367/203307 [5:03:34<230:29:17,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4368/203307 [5:03:38<230:28:55,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4368/203307 [5:03:38<230:28:55,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4369/203307 [5:03:42<230:29:05,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4369/203307 [5:03:42<230:29:05,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4370/203307 [5:03:46<230:29:12,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4370/203307 [5:03:46<230:29:12,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4371/203307 [5:03:50<230:28:49,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4371/203307 [5:03:50<230:28:50,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4372/203307 [5:03:54<230:28:27,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4372/203307 [5:03:54<230:28:27,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4373/203307 [5:03:58<230:28:29,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4373/203307 [5:03:58<230:28:29,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4374/203307 [5:04:02<230:28:07,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4374/203307 [5:04:02<230:28:07,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4375/203307 [5:04:07<230:28:20,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4375/203307 [5:04:07<230:28:20,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4376/203307 [5:04:10<230:27:54,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4376/203307 [5:04:10<230:27:54,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4377/203307 [5:04:14<230:27:32,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4377/203307 [5:04:14<230:27:32,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4378/203307 [5:04:19<230:27:40,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4378/203307 [5:04:19<230:27:41,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4379/203307 [5:04:22<230:27:19,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4379/203307 [5:04:22<230:27:19,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4380/203307 [5:04:26<230:26:56,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4380/203307 [5:04:26<230:26:56,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4381/203307 [5:04:30<230:26:30,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4381/203307 [5:04:30<230:26:30,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4382/203307 [5:04:34<230:26:27,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4382/203307 [5:04:34<230:26:27,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4383/203307 [5:04:38<230:26:34,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4383/203307 [5:04:38<230:26:34,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4384/203307 [5:04:42<230:26:10,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4384/203307 [5:04:42<230:26:10,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4385/203307 [5:04:46<230:25:43,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4385/203307 [5:04:46<230:25:43,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4386/203307 [5:04:50<230:25:53,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4386/203307 [5:04:50<230:25:54,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4387/203307 [5:04:54<230:25:30,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4387/203307 [5:04:54<230:25:31,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4388/203307 [5:04:58<230:25:08,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4388/203307 [5:04:58<230:25:09,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4389/203307 [5:05:02<230:24:46,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4389/203307 [5:05:02<230:24:46,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4390/203307 [5:05:05<230:24:20,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4390/203307 [5:05:05<230:24:20,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4391/203307 [5:05:10<230:24:19,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4391/203307 [5:05:10<230:24:19,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4392/203307 [5:05:14<230:24:27,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4392/203307 [5:05:14<230:24:27,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4393/203307 [5:05:18<230:24:01,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4393/203307 [5:05:18<230:24:01,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4394/203307 [5:05:21<230:23:34,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4394/203307 [5:05:21<230:23:34,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4395/203307 [5:05:26<230:23:42,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4395/203307 [5:05:26<230:23:43,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4396/203307 [5:05:29<230:23:15,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4396/203307 [5:05:29<230:23:16,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4397/203307 [5:05:33<230:22:51,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4397/203307 [5:05:33<230:22:51,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4398/203307 [5:05:37<230:22:26,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4398/203307 [5:05:37<230:22:26,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4399/203307 [5:05:41<230:22:02,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4399/203307 [5:05:41<230:22:02,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4400/203307 [5:05:45<230:22:12,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4400/203307 [5:05:45<230:22:12,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4401/203307 [5:05:49<230:21:48,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   2%|▏         | 4401/203307 [5:05:49<230:21:48,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4402/203307 [5:05:52<230:21:19,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4402/203307 [5:05:52<230:21:19,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4403/203307 [5:05:57<230:21:23,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4403/203307 [5:05:57<230:21:23,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4404/203307 [5:06:01<230:21:29,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4404/203307 [5:06:01<230:21:29,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4405/203307 [5:06:05<230:21:02,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4405/203307 [5:06:05<230:21:02,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4406/203307 [5:06:09<230:20:38,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4406/203307 [5:06:09<230:20:38,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4407/203307 [5:06:12<230:20:11,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4407/203307 [5:06:12<230:20:12,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4408/203307 [5:06:17<230:20:20,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4408/203307 [5:06:17<230:20:21,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4409/203307 [5:06:21<230:20:15,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4409/203307 [5:06:21<230:20:15,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4410/203307 [5:06:25<230:19:49,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4410/203307 [5:06:25<230:19:49,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4411/203307 [5:06:29<230:19:50,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4411/203307 [5:06:29<230:19:50,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4412/203307 [5:06:33<230:19:53,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4412/203307 [5:06:33<230:19:54,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4413/203307 [5:06:37<230:19:27,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4413/203307 [5:06:37<230:19:27,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4414/203307 [5:06:40<230:19:00,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4414/203307 [5:06:40<230:19:00,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4415/203307 [5:06:44<230:18:36,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4415/203307 [5:06:44<230:18:36,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4416/203307 [5:06:48<230:18:09,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4416/203307 [5:06:48<230:18:09,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4417/203307 [5:06:52<230:18:19,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4417/203307 [5:06:52<230:18:19,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4418/203307 [5:06:57<230:18:17,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4418/203307 [5:06:57<230:18:17,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4419/203307 [5:07:00<230:17:50,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4419/203307 [5:07:00<230:17:50,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4420/203307 [5:07:05<230:17:54,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4420/203307 [5:07:05<230:17:55,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4421/203307 [5:07:09<230:18:02,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   2%|▏         | 4421/203307 [5:07:09<230:18:03,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4422/203307 [5:07:13<230:17:36,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4422/203307 [5:07:13<230:17:36,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4423/203307 [5:07:17<230:17:16,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4423/203307 [5:07:17<230:17:16,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4424/203307 [5:07:20<230:16:57,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4424/203307 [5:07:20<230:16:58,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4425/203307 [5:07:25<230:17:08,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4425/203307 [5:07:25<230:17:09,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4426/203307 [5:07:29<230:16:54,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4426/203307 [5:07:29<230:16:54,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4427/203307 [5:07:33<230:16:51,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4427/203307 [5:07:33<230:16:52,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4428/203307 [5:07:37<230:16:52,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4428/203307 [5:07:37<230:16:52,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4429/203307 [5:07:41<230:16:34,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4429/203307 [5:07:41<230:16:34,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4430/203307 [5:07:46<230:16:44,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4430/203307 [5:07:46<230:16:44,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4431/203307 [5:07:49<230:16:20,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4431/203307 [5:07:49<230:16:20,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4432/203307 [5:07:53<230:15:59,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4432/203307 [5:07:53<230:15:59,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4433/203307 [5:07:58<230:16:11,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4433/203307 [5:07:58<230:16:11,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4434/203307 [5:08:02<230:15:52,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4434/203307 [5:08:02<230:15:52,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4435/203307 [5:08:05<230:15:26,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4435/203307 [5:08:05<230:15:26,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4436/203307 [5:08:10<230:15:37,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4436/203307 [5:08:10<230:15:37,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4437/203307 [5:08:13<230:15:15,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4437/203307 [5:08:13<230:15:16,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4438/203307 [5:08:18<230:15:23,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4438/203307 [5:08:18<230:15:23,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4439/203307 [5:08:22<230:15:03,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4439/203307 [5:08:22<230:15:03,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4440/203307 [5:08:26<230:14:43,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4440/203307 [5:08:26<230:14:43,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4441/203307 [5:08:29<230:14:23,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   2%|▏         | 4441/203307 [5:08:29<230:14:23,  0.24it/s, v_num=t5e6, training/loss=0.105] Epoch 0:   2%|▏         | 4442/203307 [5:08:34<230:14:38,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4442/203307 [5:08:34<230:14:39,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4443/203307 [5:08:38<230:14:13,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4443/203307 [5:08:38<230:14:14,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4444/203307 [5:08:41<230:13:51,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4444/203307 [5:08:41<230:13:51,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4445/203307 [5:08:46<230:13:58,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4445/203307 [5:08:46<230:13:58,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4446/203307 [5:08:50<230:13:35,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4446/203307 [5:08:50<230:13:35,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4447/203307 [5:08:54<230:13:41,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4447/203307 [5:08:54<230:13:41,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4448/203307 [5:08:58<230:13:19,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4448/203307 [5:08:58<230:13:19,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4449/203307 [5:09:01<230:12:55,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4449/203307 [5:09:01<230:12:55,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4450/203307 [5:09:06<230:13:04,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4450/203307 [5:09:06<230:13:05,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4451/203307 [5:09:10<230:12:44,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4451/203307 [5:09:10<230:12:44,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4452/203307 [5:09:13<230:12:20,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4452/203307 [5:09:13<230:12:20,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4453/203307 [5:09:18<230:12:26,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4453/203307 [5:09:18<230:12:26,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4454/203307 [5:09:22<230:12:20,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4454/203307 [5:09:22<230:12:20,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4455/203307 [5:09:26<230:12:00,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4455/203307 [5:09:26<230:12:00,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4456/203307 [5:09:30<230:12:08,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4456/203307 [5:09:30<230:12:08,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4457/203307 [5:09:34<230:11:43,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4457/203307 [5:09:34<230:11:44,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4458/203307 [5:09:38<230:11:50,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4458/203307 [5:09:38<230:11:50,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4459/203307 [5:09:42<230:11:24,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4459/203307 [5:09:42<230:11:24,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4460/203307 [5:09:46<230:11:01,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4460/203307 [5:09:46<230:11:01,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4461/203307 [5:09:50<230:11:04,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   2%|▏         | 4461/203307 [5:09:50<230:11:05,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4462/203307 [5:09:54<230:10:42,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4462/203307 [5:09:54<230:10:43,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4463/203307 [5:09:58<230:10:40,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4463/203307 [5:09:58<230:10:41,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4464/203307 [5:10:02<230:10:44,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4464/203307 [5:10:02<230:10:44,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4465/203307 [5:10:06<230:10:20,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4465/203307 [5:10:06<230:10:21,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4466/203307 [5:10:10<230:09:54,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4466/203307 [5:10:10<230:09:54,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4467/203307 [5:10:14<230:10:06,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4467/203307 [5:10:14<230:10:07,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4468/203307 [5:10:18<230:09:44,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4468/203307 [5:10:18<230:09:45,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4469/203307 [5:10:22<230:09:24,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4469/203307 [5:10:22<230:09:24,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4470/203307 [5:10:26<230:09:29,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4470/203307 [5:10:26<230:09:30,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4471/203307 [5:10:30<230:09:05,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4471/203307 [5:10:30<230:09:05,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4472/203307 [5:10:34<230:09:07,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4472/203307 [5:10:34<230:09:07,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4473/203307 [5:10:39<230:09:15,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4473/203307 [5:10:39<230:09:15,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4474/203307 [5:10:43<230:08:52,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4474/203307 [5:10:43<230:08:52,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4475/203307 [5:10:47<230:09:01,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4475/203307 [5:10:47<230:09:02,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4476/203307 [5:10:51<230:08:40,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4476/203307 [5:10:51<230:08:40,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4477/203307 [5:10:55<230:08:16,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4477/203307 [5:10:55<230:08:16,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4478/203307 [5:10:59<230:08:22,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4478/203307 [5:10:59<230:08:22,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4479/203307 [5:11:03<230:08:02,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4479/203307 [5:11:03<230:08:03,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4480/203307 [5:11:07<230:07:41,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4480/203307 [5:11:07<230:07:41,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4481/203307 [5:11:11<230:07:43,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4481/203307 [5:11:11<230:07:43,  0.24it/s, v_num=t5e6, training/loss=0.108] Epoch 0:   2%|▏         | 4482/203307 [5:11:15<230:07:54,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4482/203307 [5:11:15<230:07:55,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4483/203307 [5:11:20<230:08:00,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4483/203307 [5:11:20<230:08:00,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4484/203307 [5:11:23<230:07:34,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4484/203307 [5:11:23<230:07:35,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4485/203307 [5:11:27<230:07:24,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4485/203307 [5:11:27<230:07:24,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4486/203307 [5:11:32<230:07:24,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4486/203307 [5:11:32<230:07:24,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4487/203307 [5:11:36<230:07:05,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4487/203307 [5:11:36<230:07:05,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4488/203307 [5:11:39<230:06:39,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4488/203307 [5:11:39<230:06:40,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4489/203307 [5:11:43<230:06:14,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4489/203307 [5:11:43<230:06:14,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4490/203307 [5:11:47<230:06:19,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4490/203307 [5:11:47<230:06:20,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4491/203307 [5:11:51<230:05:57,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4491/203307 [5:11:51<230:05:57,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4492/203307 [5:11:55<230:06:04,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4492/203307 [5:11:55<230:06:04,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4493/203307 [5:11:59<230:05:36,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4493/203307 [5:11:59<230:05:37,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4494/203307 [5:12:03<230:05:12,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4494/203307 [5:12:03<230:05:12,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4495/203307 [5:12:07<230:05:15,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4495/203307 [5:12:07<230:05:16,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4496/203307 [5:12:11<230:04:50,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4496/203307 [5:12:11<230:04:51,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4497/203307 [5:12:15<230:04:32,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4497/203307 [5:12:15<230:04:32,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4498/203307 [5:12:18<230:04:11,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4498/203307 [5:12:18<230:04:12,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4499/203307 [5:12:23<230:04:18,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4499/203307 [5:12:23<230:04:18,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4500/203307 [5:12:27<230:04:27,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4500/203307 [5:12:27<230:04:27,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4501/203307 [5:12:31<230:04:02,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   2%|▏         | 4501/203307 [5:12:31<230:04:03,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4502/203307 [5:12:35<230:03:37,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4502/203307 [5:12:35<230:03:37,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4503/203307 [5:12:39<230:03:42,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4503/203307 [5:12:39<230:03:42,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4504/203307 [5:12:43<230:03:17,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4504/203307 [5:12:43<230:03:18,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4505/203307 [5:12:46<230:02:52,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4505/203307 [5:12:47<230:02:52,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4506/203307 [5:12:50<230:02:28,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4506/203307 [5:12:50<230:02:28,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4507/203307 [5:12:54<230:02:06,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4507/203307 [5:12:54<230:02:06,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4508/203307 [5:12:58<230:02:15,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4508/203307 [5:12:58<230:02:15,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4509/203307 [5:13:02<230:01:55,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4509/203307 [5:13:02<230:01:56,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4510/203307 [5:13:06<230:01:30,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4510/203307 [5:13:06<230:01:31,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4511/203307 [5:13:10<230:01:34,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4511/203307 [5:13:10<230:01:34,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4512/203307 [5:13:14<230:01:08,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4512/203307 [5:13:14<230:01:09,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4513/203307 [5:13:18<230:00:46,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4513/203307 [5:13:18<230:00:46,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4514/203307 [5:13:21<230:00:23,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4514/203307 [5:13:21<230:00:24,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4515/203307 [5:13:25<230:00:00,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4515/203307 [5:13:25<230:00:00,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4516/203307 [5:13:30<230:00:14,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4516/203307 [5:13:30<230:00:14,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4517/203307 [5:13:34<230:00:22,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4517/203307 [5:13:34<230:00:22,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4518/203307 [5:13:38<229:59:58,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4518/203307 [5:13:38<229:59:59,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4519/203307 [5:13:42<229:59:34,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4519/203307 [5:13:42<229:59:35,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4520/203307 [5:13:46<229:59:38,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4520/203307 [5:13:46<229:59:38,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4521/203307 [5:13:50<229:59:15,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4521/203307 [5:13:50<229:59:16,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4522/203307 [5:13:54<229:58:54,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4522/203307 [5:13:54<229:58:54,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4523/203307 [5:13:57<229:58:30,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4523/203307 [5:13:57<229:58:30,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4524/203307 [5:14:01<229:58:04,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4524/203307 [5:14:01<229:58:05,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4525/203307 [5:14:05<229:58:16,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4525/203307 [5:14:05<229:58:16,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4526/203307 [5:14:10<229:58:11,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4526/203307 [5:14:10<229:58:12,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4527/203307 [5:14:13<229:57:49,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4527/203307 [5:14:13<229:57:50,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4528/203307 [5:14:18<229:57:53,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4528/203307 [5:14:18<229:57:54,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4529/203307 [5:14:21<229:57:32,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4529/203307 [5:14:21<229:57:32,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4530/203307 [5:14:25<229:57:06,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4530/203307 [5:14:25<229:57:06,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4531/203307 [5:14:29<229:56:45,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4531/203307 [5:14:29<229:56:45,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4532/203307 [5:14:33<229:56:25,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4532/203307 [5:14:33<229:56:26,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4533/203307 [5:14:37<229:56:30,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4533/203307 [5:14:37<229:56:31,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4534/203307 [5:14:41<229:56:36,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4534/203307 [5:14:41<229:56:37,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4535/203307 [5:14:46<229:56:32,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4535/203307 [5:14:46<229:56:32,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4536/203307 [5:14:50<229:56:33,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4536/203307 [5:14:50<229:56:34,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4537/203307 [5:14:54<229:56:10,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4537/203307 [5:14:54<229:56:10,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4538/203307 [5:14:57<229:55:45,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4538/203307 [5:14:57<229:55:45,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4539/203307 [5:15:01<229:55:19,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4539/203307 [5:15:01<229:55:20,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4540/203307 [5:15:05<229:54:55,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4540/203307 [5:15:05<229:54:55,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4541/203307 [5:15:09<229:54:37,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   2%|▏         | 4541/203307 [5:15:09<229:54:37,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4542/203307 [5:15:13<229:54:48,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4542/203307 [5:15:13<229:54:48,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4543/203307 [5:15:17<229:54:24,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4543/203307 [5:15:17<229:54:24,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4544/203307 [5:15:21<229:54:19,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4544/203307 [5:15:21<229:54:20,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4545/203307 [5:15:25<229:54:25,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4545/203307 [5:15:25<229:54:26,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4546/203307 [5:15:29<229:53:59,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4546/203307 [5:15:29<229:53:59,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4547/203307 [5:15:33<229:53:39,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4547/203307 [5:15:33<229:53:39,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4548/203307 [5:15:37<229:53:17,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4548/203307 [5:15:37<229:53:17,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4549/203307 [5:15:40<229:52:54,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4549/203307 [5:15:40<229:52:54,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4550/203307 [5:15:45<229:53:02,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4550/203307 [5:15:45<229:53:03,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4551/203307 [5:15:49<229:53:07,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4551/203307 [5:15:49<229:53:08,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4552/203307 [5:15:53<229:52:41,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4552/203307 [5:15:53<229:52:41,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4553/203307 [5:15:57<229:52:50,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4553/203307 [5:15:57<229:52:50,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4554/203307 [5:16:01<229:52:27,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4554/203307 [5:16:01<229:52:28,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4555/203307 [5:16:05<229:52:02,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4555/203307 [5:16:05<229:52:03,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4556/203307 [5:16:08<229:51:39,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4556/203307 [5:16:08<229:51:39,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4557/203307 [5:16:12<229:51:16,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4557/203307 [5:16:12<229:51:17,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4558/203307 [5:16:17<229:51:25,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4558/203307 [5:16:17<229:51:25,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4559/203307 [5:16:20<229:51:05,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4559/203307 [5:16:20<229:51:06,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4560/203307 [5:16:25<229:51:12,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4560/203307 [5:16:25<229:51:12,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4561/203307 [5:16:29<229:51:18,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4561/203307 [5:16:29<229:51:18,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4562/203307 [5:16:33<229:51:14,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4562/203307 [5:16:33<229:51:14,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4563/203307 [5:16:37<229:50:48,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4563/203307 [5:16:37<229:50:49,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4564/203307 [5:16:41<229:50:24,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4564/203307 [5:16:41<229:50:25,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4565/203307 [5:16:45<229:50:05,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4565/203307 [5:16:45<229:50:05,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4566/203307 [5:16:48<229:49:45,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4566/203307 [5:16:48<229:49:46,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4567/203307 [5:16:53<229:49:59,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4567/203307 [5:16:53<229:49:59,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4568/203307 [5:16:57<229:50:06,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4568/203307 [5:16:57<229:50:06,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4569/203307 [5:17:01<229:49:46,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4569/203307 [5:17:01<229:49:47,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4570/203307 [5:17:05<229:49:48,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4570/203307 [5:17:05<229:49:48,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4571/203307 [5:17:10<229:49:43,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4571/203307 [5:17:10<229:49:43,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4572/203307 [5:17:13<229:49:20,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4572/203307 [5:17:13<229:49:20,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4573/203307 [5:17:17<229:48:59,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4573/203307 [5:17:17<229:49:00,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4574/203307 [5:17:21<229:48:38,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4574/203307 [5:17:21<229:48:38,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4575/203307 [5:17:25<229:48:47,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4575/203307 [5:17:25<229:48:48,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4576/203307 [5:17:29<229:48:27,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4576/203307 [5:17:29<229:48:28,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4577/203307 [5:17:34<229:48:35,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4577/203307 [5:17:34<229:48:36,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4578/203307 [5:17:38<229:48:36,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4578/203307 [5:17:38<229:48:36,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4579/203307 [5:17:42<229:48:16,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4579/203307 [5:17:42<229:48:16,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4580/203307 [5:17:46<229:48:19,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4580/203307 [5:17:46<229:48:20,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4581/203307 [5:17:50<229:47:55,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   2%|▏         | 4581/203307 [5:17:50<229:47:56,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4582/203307 [5:17:53<229:47:31,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4582/203307 [5:17:53<229:47:31,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4583/203307 [5:17:58<229:47:43,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4583/203307 [5:17:58<229:47:43,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4584/203307 [5:18:02<229:47:20,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4584/203307 [5:18:02<229:47:20,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4585/203307 [5:18:05<229:46:54,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4585/203307 [5:18:05<229:46:54,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4586/203307 [5:18:10<229:47:02,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4586/203307 [5:18:10<229:47:02,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4587/203307 [5:18:14<229:46:40,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4587/203307 [5:18:14<229:46:41,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4588/203307 [5:18:17<229:46:18,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4588/203307 [5:18:17<229:46:19,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4589/203307 [5:18:22<229:46:23,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4589/203307 [5:18:22<229:46:24,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4590/203307 [5:18:25<229:45:57,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4590/203307 [5:18:25<229:45:57,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4591/203307 [5:18:29<229:45:34,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4591/203307 [5:18:29<229:45:35,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4592/203307 [5:18:34<229:45:46,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4592/203307 [5:18:34<229:45:46,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4593/203307 [5:18:37<229:45:23,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4593/203307 [5:18:37<229:45:23,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4594/203307 [5:18:42<229:45:30,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4594/203307 [5:18:42<229:45:30,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4595/203307 [5:18:46<229:45:35,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4595/203307 [5:18:46<229:45:35,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4596/203307 [5:18:50<229:45:14,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4596/203307 [5:18:50<229:45:15,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4597/203307 [5:18:54<229:44:49,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4597/203307 [5:18:54<229:44:50,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4598/203307 [5:18:58<229:44:52,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4598/203307 [5:18:58<229:44:52,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4599/203307 [5:19:02<229:44:28,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4599/203307 [5:19:02<229:44:29,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4600/203307 [5:19:06<229:44:38,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4600/203307 [5:19:06<229:44:38,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4601/203307 [5:19:10<229:44:13,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   2%|▏         | 4601/203307 [5:19:10<229:44:14,  0.24it/s, v_num=t5e6, training/loss=0.096] Epoch 0:   2%|▏         | 4602/203307 [5:19:13<229:43:49,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4602/203307 [5:19:13<229:43:49,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4603/203307 [5:19:18<229:44:01,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4603/203307 [5:19:18<229:44:01,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4604/203307 [5:19:22<229:43:39,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4604/203307 [5:19:22<229:43:39,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4605/203307 [5:19:25<229:43:15,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4605/203307 [5:19:25<229:43:16,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4606/203307 [5:19:29<229:42:53,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4606/203307 [5:19:29<229:42:54,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4607/203307 [5:19:34<229:42:56,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4607/203307 [5:19:34<229:42:57,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4608/203307 [5:19:38<229:43:05,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4608/203307 [5:19:38<229:43:05,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4609/203307 [5:19:42<229:42:46,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4609/203307 [5:19:42<229:42:46,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4610/203307 [5:19:45<229:42:19,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4610/203307 [5:19:45<229:42:19,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4611/203307 [5:19:50<229:42:22,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4611/203307 [5:19:50<229:42:22,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4612/203307 [5:19:54<229:42:28,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4612/203307 [5:19:54<229:42:28,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4613/203307 [5:19:58<229:42:04,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4613/203307 [5:19:58<229:42:04,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4614/203307 [5:20:02<229:41:40,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4614/203307 [5:20:02<229:41:40,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4615/203307 [5:20:05<229:41:13,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4615/203307 [5:20:05<229:41:14,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4616/203307 [5:20:10<229:41:20,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4616/203307 [5:20:10<229:41:20,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4617/203307 [5:20:14<229:41:29,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4617/203307 [5:20:14<229:41:29,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4618/203307 [5:20:18<229:41:04,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4618/203307 [5:20:18<229:41:05,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4619/203307 [5:20:21<229:40:39,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4619/203307 [5:20:21<229:40:40,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4620/203307 [5:20:26<229:40:51,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4620/203307 [5:20:26<229:40:52,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4621/203307 [5:20:30<229:40:28,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   2%|▏         | 4621/203307 [5:20:30<229:40:29,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4622/203307 [5:20:33<229:40:06,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4622/203307 [5:20:33<229:40:06,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4623/203307 [5:20:37<229:39:43,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4623/203307 [5:20:37<229:39:44,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4624/203307 [5:20:41<229:39:20,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4624/203307 [5:20:41<229:39:20,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4625/203307 [5:20:46<229:39:35,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4625/203307 [5:20:46<229:39:35,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4626/203307 [5:20:49<229:39:15,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4626/203307 [5:20:49<229:39:15,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4627/203307 [5:20:53<229:38:50,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4627/203307 [5:20:53<229:38:50,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4628/203307 [5:20:57<229:38:53,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4628/203307 [5:20:57<229:38:54,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4629/203307 [5:21:02<229:39:02,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4629/203307 [5:21:02<229:39:02,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4630/203307 [5:21:05<229:38:37,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4630/203307 [5:21:05<229:38:38,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4631/203307 [5:21:09<229:38:16,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4631/203307 [5:21:09<229:38:16,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4632/203307 [5:21:13<229:37:54,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4632/203307 [5:21:13<229:37:54,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4633/203307 [5:21:17<229:38:05,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4633/203307 [5:21:17<229:38:05,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4634/203307 [5:21:22<229:38:02,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4634/203307 [5:21:22<229:38:02,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4635/203307 [5:21:25<229:37:37,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4635/203307 [5:21:25<229:37:38,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4636/203307 [5:21:30<229:37:40,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4636/203307 [5:21:30<229:37:41,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4637/203307 [5:21:33<229:37:19,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4637/203307 [5:21:33<229:37:19,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4638/203307 [5:21:38<229:37:26,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4638/203307 [5:21:38<229:37:26,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4639/203307 [5:21:42<229:37:04,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4639/203307 [5:21:42<229:37:04,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4640/203307 [5:21:45<229:36:37,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4640/203307 [5:21:45<229:36:37,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4641/203307 [5:21:49<229:36:15,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   2%|▏         | 4641/203307 [5:21:49<229:36:16,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4642/203307 [5:21:54<229:36:26,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4642/203307 [5:21:54<229:36:27,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4643/203307 [5:21:58<229:36:23,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4643/203307 [5:21:58<229:36:24,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4644/203307 [5:22:01<229:35:58,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4644/203307 [5:22:01<229:35:59,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4645/203307 [5:22:06<229:36:00,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4645/203307 [5:22:06<229:36:00,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4646/203307 [5:22:10<229:36:04,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4646/203307 [5:22:10<229:36:04,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4647/203307 [5:22:14<229:35:39,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4647/203307 [5:22:14<229:35:40,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4648/203307 [5:22:17<229:35:17,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4648/203307 [5:22:17<229:35:18,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4649/203307 [5:22:21<229:34:54,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4649/203307 [5:22:21<229:34:55,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4650/203307 [5:22:26<229:35:03,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4650/203307 [5:22:26<229:35:03,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4651/203307 [5:22:29<229:34:42,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4651/203307 [5:22:29<229:34:42,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4652/203307 [5:22:34<229:34:43,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4652/203307 [5:22:34<229:34:44,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4653/203307 [5:22:38<229:34:42,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4653/203307 [5:22:38<229:34:42,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4654/203307 [5:22:42<229:34:21,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4654/203307 [5:22:42<229:34:21,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4655/203307 [5:22:46<229:34:26,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4655/203307 [5:22:46<229:34:26,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4656/203307 [5:22:50<229:34:03,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4656/203307 [5:22:50<229:34:03,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4657/203307 [5:22:53<229:33:38,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4657/203307 [5:22:53<229:33:39,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4658/203307 [5:22:58<229:33:48,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4658/203307 [5:22:58<229:33:49,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4659/203307 [5:23:02<229:33:24,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4659/203307 [5:23:02<229:33:24,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4660/203307 [5:23:05<229:32:59,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4660/203307 [5:23:05<229:33:00,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4661/203307 [5:23:10<229:33:11,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   2%|▏         | 4661/203307 [5:23:10<229:33:11,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4662/203307 [5:23:13<229:32:46,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4662/203307 [5:23:14<229:32:46,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4663/203307 [5:23:17<229:32:24,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4663/203307 [5:23:17<229:32:25,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4664/203307 [5:23:22<229:32:29,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4664/203307 [5:23:22<229:32:30,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4665/203307 [5:23:25<229:32:05,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4665/203307 [5:23:25<229:32:06,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4666/203307 [5:23:29<229:31:41,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4666/203307 [5:23:29<229:31:42,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4667/203307 [5:23:33<229:31:51,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4667/203307 [5:23:33<229:31:51,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4668/203307 [5:23:37<229:31:25,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4668/203307 [5:23:37<229:31:26,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4669/203307 [5:23:41<229:31:04,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4669/203307 [5:23:41<229:31:04,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4670/203307 [5:23:45<229:31:10,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4670/203307 [5:23:45<229:31:11,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4671/203307 [5:23:49<229:30:45,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4671/203307 [5:23:49<229:30:45,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4672/203307 [5:23:53<229:30:48,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4672/203307 [5:23:53<229:30:48,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4673/203307 [5:23:57<229:30:25,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4673/203307 [5:23:57<229:30:25,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4674/203307 [5:24:01<229:30:01,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4674/203307 [5:24:01<229:30:02,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4675/203307 [5:24:05<229:30:10,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4675/203307 [5:24:05<229:30:10,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4676/203307 [5:24:09<229:29:49,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4676/203307 [5:24:09<229:29:49,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4677/203307 [5:24:13<229:29:24,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4677/203307 [5:24:13<229:29:24,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4678/203307 [5:24:17<229:29:29,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4678/203307 [5:24:17<229:29:30,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4679/203307 [5:24:21<229:29:31,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4679/203307 [5:24:21<229:29:31,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4680/203307 [5:24:25<229:29:07,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4680/203307 [5:24:25<229:29:07,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4681/203307 [5:24:29<229:29:13,  0.24it/s, v_num=t5e6, training/loss=0.0964]Epoch 0:   2%|▏         | 4681/203307 [5:24:29<229:29:13,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4682/203307 [5:24:33<229:28:49,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4682/203307 [5:24:33<229:28:49,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4683/203307 [5:24:38<229:28:58,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4683/203307 [5:24:38<229:28:59,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4684/203307 [5:24:41<229:28:34,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4684/203307 [5:24:41<229:28:35,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4685/203307 [5:24:45<229:28:16,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4685/203307 [5:24:45<229:28:16,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4686/203307 [5:24:49<229:28:15,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4686/203307 [5:24:49<229:28:15,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4687/203307 [5:24:53<229:27:54,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4687/203307 [5:24:53<229:27:54,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4688/203307 [5:24:57<229:27:57,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4688/203307 [5:24:57<229:27:57,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4689/203307 [5:25:01<229:27:35,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4689/203307 [5:25:01<229:27:35,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4690/203307 [5:25:06<229:27:41,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4690/203307 [5:25:06<229:27:41,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4691/203307 [5:25:09<229:27:19,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4691/203307 [5:25:09<229:27:20,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4692/203307 [5:25:14<229:27:28,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4692/203307 [5:25:14<229:27:29,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4693/203307 [5:25:18<229:27:09,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4693/203307 [5:25:18<229:27:10,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4694/203307 [5:25:21<229:26:48,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4694/203307 [5:25:21<229:26:48,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4695/203307 [5:25:26<229:26:53,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4695/203307 [5:25:26<229:26:54,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4696/203307 [5:25:29<229:26:31,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4696/203307 [5:25:29<229:26:31,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4697/203307 [5:25:34<229:26:30,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4697/203307 [5:25:34<229:26:30,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4698/203307 [5:25:38<229:26:37,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4698/203307 [5:25:38<229:26:38,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4699/203307 [5:25:42<229:26:14,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4699/203307 [5:25:42<229:26:14,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4700/203307 [5:25:46<229:26:19,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4700/203307 [5:25:46<229:26:19,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4701/203307 [5:25:50<229:26:00,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4701/203307 [5:25:50<229:26:00,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4702/203307 [5:25:54<229:25:40,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4702/203307 [5:25:54<229:25:40,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4703/203307 [5:25:58<229:25:45,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4703/203307 [5:25:58<229:25:45,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4704/203307 [5:26:02<229:25:25,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4704/203307 [5:26:02<229:25:25,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4705/203307 [5:26:06<229:25:04,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4705/203307 [5:26:06<229:25:04,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4706/203307 [5:26:10<229:25:06,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4706/203307 [5:26:10<229:25:06,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4707/203307 [5:26:14<229:25:13,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4707/203307 [5:26:14<229:25:13,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4708/203307 [5:26:19<229:25:18,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4708/203307 [5:26:19<229:25:18,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4709/203307 [5:26:23<229:24:57,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4709/203307 [5:26:23<229:24:58,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4710/203307 [5:26:26<229:24:34,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4710/203307 [5:26:26<229:24:35,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4711/203307 [5:26:31<229:24:40,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4711/203307 [5:26:31<229:24:41,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4712/203307 [5:26:34<229:24:18,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4712/203307 [5:26:34<229:24:19,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4713/203307 [5:26:38<229:23:57,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4713/203307 [5:26:38<229:23:58,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4714/203307 [5:26:42<229:23:33,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4714/203307 [5:26:42<229:23:34,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4715/203307 [5:26:46<229:23:30,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4715/203307 [5:26:46<229:23:30,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4716/203307 [5:26:50<229:23:39,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4716/203307 [5:26:51<229:23:40,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4717/203307 [5:26:55<229:23:47,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4717/203307 [5:26:55<229:23:47,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4718/203307 [5:26:59<229:23:24,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4718/203307 [5:26:59<229:23:24,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4719/203307 [5:27:02<229:23:01,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4719/203307 [5:27:02<229:23:01,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4720/203307 [5:27:07<229:23:04,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4720/203307 [5:27:07<229:23:05,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4721/203307 [5:27:10<229:22:45,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4721/203307 [5:27:11<229:22:46,  0.24it/s, v_num=t5e6, training/loss=0.087] Epoch 0:   2%|▏         | 4722/203307 [5:27:14<229:22:24,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4722/203307 [5:27:14<229:22:25,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4723/203307 [5:27:18<229:22:03,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4723/203307 [5:27:18<229:22:03,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4724/203307 [5:27:22<229:22:06,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4724/203307 [5:27:22<229:22:07,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4725/203307 [5:27:27<229:22:22,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4725/203307 [5:27:27<229:22:22,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4726/203307 [5:27:31<229:21:59,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4726/203307 [5:27:31<229:22:00,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4727/203307 [5:27:34<229:21:37,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4727/203307 [5:27:34<229:21:37,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4728/203307 [5:27:39<229:21:41,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4728/203307 [5:27:39<229:21:41,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4729/203307 [5:27:43<229:21:22,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4729/203307 [5:27:43<229:21:23,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4730/203307 [5:27:46<229:20:58,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4730/203307 [5:27:46<229:20:59,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4731/203307 [5:27:50<229:20:36,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4731/203307 [5:27:50<229:20:37,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4732/203307 [5:27:54<229:20:17,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4732/203307 [5:27:54<229:20:17,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4733/203307 [5:27:58<229:20:29,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4733/203307 [5:27:58<229:20:30,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4734/203307 [5:28:02<229:20:09,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4734/203307 [5:28:02<229:20:10,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4735/203307 [5:28:06<229:19:45,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4735/203307 [5:28:06<229:19:46,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4736/203307 [5:28:10<229:19:51,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4736/203307 [5:28:10<229:19:51,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4737/203307 [5:28:14<229:19:31,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4737/203307 [5:28:14<229:19:32,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4738/203307 [5:28:18<229:19:08,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4738/203307 [5:28:18<229:19:09,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4739/203307 [5:28:21<229:18:46,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4739/203307 [5:28:21<229:18:46,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4740/203307 [5:28:25<229:18:24,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4740/203307 [5:28:25<229:18:24,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4741/203307 [5:28:29<229:18:08,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   2%|▏         | 4741/203307 [5:28:29<229:18:09,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4742/203307 [5:28:33<229:18:16,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4742/203307 [5:28:33<229:18:16,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4743/203307 [5:28:37<229:17:55,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4743/203307 [5:28:37<229:17:55,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4744/203307 [5:28:41<229:17:33,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4744/203307 [5:28:41<229:17:33,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4745/203307 [5:28:45<229:17:36,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4745/203307 [5:28:45<229:17:36,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4746/203307 [5:28:49<229:17:17,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4746/203307 [5:28:49<229:17:17,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4747/203307 [5:28:53<229:16:57,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4747/203307 [5:28:53<229:16:58,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4748/203307 [5:28:57<229:16:37,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4748/203307 [5:28:57<229:16:37,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4749/203307 [5:29:00<229:16:13,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4749/203307 [5:29:00<229:16:14,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4750/203307 [5:29:05<229:16:21,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4750/203307 [5:29:05<229:16:22,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4751/203307 [5:29:09<229:16:23,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4751/203307 [5:29:09<229:16:24,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4752/203307 [5:29:13<229:15:57,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4752/203307 [5:29:13<229:15:58,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4753/203307 [5:29:17<229:16:04,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4753/203307 [5:29:17<229:16:04,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4754/203307 [5:29:21<229:15:41,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4754/203307 [5:29:21<229:15:41,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4755/203307 [5:29:25<229:15:17,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4755/203307 [5:29:25<229:15:17,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4756/203307 [5:29:28<229:14:56,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4756/203307 [5:29:28<229:14:56,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4757/203307 [5:29:32<229:14:33,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4757/203307 [5:29:32<229:14:33,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4758/203307 [5:29:36<229:14:43,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4758/203307 [5:29:36<229:14:43,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4759/203307 [5:29:41<229:14:52,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4759/203307 [5:29:41<229:14:52,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4760/203307 [5:29:45<229:14:47,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4760/203307 [5:29:45<229:14:47,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4761/203307 [5:29:49<229:14:51,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   2%|▏         | 4761/203307 [5:29:49<229:14:51,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4762/203307 [5:29:53<229:14:27,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4762/203307 [5:29:53<229:14:28,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4763/203307 [5:29:57<229:14:06,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4763/203307 [5:29:57<229:14:06,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4764/203307 [5:30:01<229:13:43,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4764/203307 [5:30:01<229:13:44,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4765/203307 [5:30:04<229:13:22,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4765/203307 [5:30:04<229:13:22,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4766/203307 [5:30:08<229:12:58,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4766/203307 [5:30:08<229:12:58,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4767/203307 [5:30:12<229:13:04,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4767/203307 [5:30:12<229:13:05,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4768/203307 [5:30:17<229:13:11,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4768/203307 [5:30:17<229:13:12,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4769/203307 [5:30:21<229:13:06,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4769/203307 [5:30:21<229:13:06,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4770/203307 [5:30:25<229:13:05,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4770/203307 [5:30:25<229:13:06,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4771/203307 [5:30:29<229:12:41,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4771/203307 [5:30:29<229:12:41,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4772/203307 [5:30:33<229:12:19,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4772/203307 [5:30:33<229:12:19,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4773/203307 [5:30:36<229:11:58,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4773/203307 [5:30:36<229:11:59,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4774/203307 [5:30:40<229:11:36,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4774/203307 [5:30:40<229:11:36,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4775/203307 [5:30:44<229:11:41,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4775/203307 [5:30:44<229:11:41,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4776/203307 [5:30:49<229:11:51,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4776/203307 [5:30:49<229:11:51,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4777/203307 [5:30:53<229:11:29,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4777/203307 [5:30:53<229:11:30,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4778/203307 [5:30:57<229:11:34,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4778/203307 [5:30:57<229:11:34,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4779/203307 [5:31:01<229:11:12,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4779/203307 [5:31:01<229:11:12,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4780/203307 [5:31:04<229:10:49,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4780/203307 [5:31:05<229:10:50,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4781/203307 [5:31:08<229:10:25,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   2%|▏         | 4781/203307 [5:31:08<229:10:26,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4782/203307 [5:31:12<229:10:02,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4782/203307 [5:31:12<229:10:03,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4783/203307 [5:31:16<229:10:10,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4783/203307 [5:31:16<229:10:10,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4784/203307 [5:31:20<229:09:48,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4784/203307 [5:31:20<229:09:49,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4785/203307 [5:31:24<229:09:54,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4785/203307 [5:31:24<229:09:55,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4786/203307 [5:31:29<229:09:55,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4786/203307 [5:31:29<229:09:55,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4787/203307 [5:31:33<229:09:49,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4787/203307 [5:31:33<229:09:49,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4788/203307 [5:31:37<229:09:25,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4788/203307 [5:31:37<229:09:26,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4789/203307 [5:31:40<229:09:02,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4789/203307 [5:31:40<229:09:03,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4790/203307 [5:31:44<229:08:41,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4790/203307 [5:31:44<229:08:41,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4791/203307 [5:31:48<229:08:19,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4791/203307 [5:31:48<229:08:20,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4792/203307 [5:31:52<229:08:27,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4792/203307 [5:31:52<229:08:28,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4793/203307 [5:31:56<229:08:02,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4793/203307 [5:31:56<229:08:02,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4794/203307 [5:32:00<229:08:08,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4794/203307 [5:32:00<229:08:08,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4795/203307 [5:32:04<229:08:09,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4795/203307 [5:32:04<229:08:09,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4796/203307 [5:32:09<229:08:05,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4796/203307 [5:32:09<229:08:05,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4797/203307 [5:32:12<229:07:41,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4797/203307 [5:32:12<229:07:41,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4798/203307 [5:32:16<229:07:21,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4798/203307 [5:32:16<229:07:21,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4799/203307 [5:32:20<229:07:02,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4799/203307 [5:32:20<229:07:02,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4800/203307 [5:32:24<229:07:07,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4800/203307 [5:32:24<229:07:08,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4801/203307 [5:32:28<229:06:50,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   2%|▏         | 4801/203307 [5:32:28<229:06:50,  0.24it/s, v_num=t5e6, training/loss=0.092] Epoch 0:   2%|▏         | 4802/203307 [5:32:32<229:06:51,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4802/203307 [5:32:32<229:06:51,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4803/203307 [5:32:37<229:06:51,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4803/203307 [5:32:37<229:06:52,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4804/203307 [5:32:40<229:06:35,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4804/203307 [5:32:40<229:06:35,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4805/203307 [5:32:45<229:06:33,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4805/203307 [5:32:45<229:06:33,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4806/203307 [5:32:48<229:06:12,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4806/203307 [5:32:48<229:06:13,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4807/203307 [5:32:52<229:05:49,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4807/203307 [5:32:52<229:05:49,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4808/203307 [5:32:57<229:05:56,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4808/203307 [5:32:57<229:05:57,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4809/203307 [5:33:00<229:05:35,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4809/203307 [5:33:00<229:05:35,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4810/203307 [5:33:04<229:05:16,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4810/203307 [5:33:04<229:05:16,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4811/203307 [5:33:09<229:05:24,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4811/203307 [5:33:09<229:05:24,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4812/203307 [5:33:12<229:05:02,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4812/203307 [5:33:12<229:05:02,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4813/203307 [5:33:16<229:04:39,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4813/203307 [5:33:16<229:04:40,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4814/203307 [5:33:20<229:04:34,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4814/203307 [5:33:20<229:04:35,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4815/203307 [5:33:24<229:04:09,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4815/203307 [5:33:24<229:04:10,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4816/203307 [5:33:28<229:03:49,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4816/203307 [5:33:28<229:03:49,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4817/203307 [5:33:32<229:03:59,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4817/203307 [5:33:32<229:04:00,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4818/203307 [5:33:36<229:03:40,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4818/203307 [5:33:36<229:03:41,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4819/203307 [5:33:40<229:03:17,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4819/203307 [5:33:40<229:03:18,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4820/203307 [5:33:44<229:03:24,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4820/203307 [5:33:44<229:03:24,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4821/203307 [5:33:48<229:03:00,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   2%|▏         | 4821/203307 [5:33:48<229:03:01,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4822/203307 [5:33:51<229:02:35,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4822/203307 [5:33:51<229:02:36,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4823/203307 [5:33:55<229:02:32,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4823/203307 [5:33:55<229:02:32,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4824/203307 [5:33:59<229:02:08,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4824/203307 [5:33:59<229:02:08,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4825/203307 [5:34:04<229:02:14,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4825/203307 [5:34:04<229:02:15,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4826/203307 [5:34:07<229:01:51,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4826/203307 [5:34:07<229:01:52,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4827/203307 [5:34:11<229:01:27,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4827/203307 [5:34:11<229:01:27,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4828/203307 [5:34:15<229:01:37,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4828/203307 [5:34:15<229:01:38,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4829/203307 [5:34:19<229:01:21,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4829/203307 [5:34:19<229:01:21,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4830/203307 [5:34:23<229:00:59,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4830/203307 [5:34:23<229:01:00,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4831/203307 [5:34:27<229:00:41,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4831/203307 [5:34:27<229:00:41,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4832/203307 [5:34:31<229:00:37,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4832/203307 [5:34:31<229:00:38,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4833/203307 [5:34:35<229:00:49,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4833/203307 [5:34:36<229:00:49,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4834/203307 [5:34:39<229:00:27,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4834/203307 [5:34:39<229:00:27,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4835/203307 [5:34:43<229:00:05,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4835/203307 [5:34:43<229:00:05,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4836/203307 [5:34:47<229:00:08,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4836/203307 [5:34:47<229:00:09,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4837/203307 [5:34:52<229:00:15,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4837/203307 [5:34:52<229:00:16,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4838/203307 [5:34:55<228:59:51,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4838/203307 [5:34:55<228:59:52,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4839/203307 [5:34:59<228:59:31,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4839/203307 [5:34:59<228:59:31,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4840/203307 [5:35:03<228:59:08,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4840/203307 [5:35:03<228:59:08,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4841/203307 [5:35:07<228:59:12,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   2%|▏         | 4841/203307 [5:35:07<228:59:12,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4842/203307 [5:35:12<228:59:24,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4842/203307 [5:35:12<228:59:24,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4843/203307 [5:35:15<228:59:02,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4843/203307 [5:35:15<228:59:03,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4844/203307 [5:35:19<228:58:40,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4844/203307 [5:35:19<228:58:41,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4845/203307 [5:35:24<228:58:50,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4845/203307 [5:35:24<228:58:50,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4846/203307 [5:35:28<228:58:55,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4846/203307 [5:35:28<228:58:55,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4847/203307 [5:35:32<228:58:34,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4847/203307 [5:35:32<228:58:35,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4848/203307 [5:35:35<228:58:11,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4848/203307 [5:35:35<228:58:12,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4849/203307 [5:35:39<228:57:46,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4849/203307 [5:35:39<228:57:46,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4850/203307 [5:35:44<228:57:56,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4850/203307 [5:35:44<228:57:57,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4851/203307 [5:35:47<228:57:37,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4851/203307 [5:35:47<228:57:37,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4852/203307 [5:35:51<228:57:13,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4852/203307 [5:35:51<228:57:13,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4853/203307 [5:35:55<228:57:14,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4853/203307 [5:35:55<228:57:15,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4854/203307 [5:36:00<228:57:24,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4854/203307 [5:36:00<228:57:24,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4855/203307 [5:36:04<228:57:00,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4855/203307 [5:36:04<228:57:00,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4856/203307 [5:36:07<228:56:38,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4856/203307 [5:36:07<228:56:38,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4857/203307 [5:36:11<228:56:16,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4857/203307 [5:36:11<228:56:16,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4858/203307 [5:36:15<228:56:26,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4858/203307 [5:36:15<228:56:26,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4859/203307 [5:36:20<228:56:19,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4859/203307 [5:36:20<228:56:19,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4860/203307 [5:36:23<228:55:59,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4860/203307 [5:36:23<228:55:59,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4861/203307 [5:36:28<228:56:02,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   2%|▏         | 4861/203307 [5:36:28<228:56:02,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4862/203307 [5:36:31<228:55:41,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4862/203307 [5:36:31<228:55:42,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4863/203307 [5:36:36<228:55:50,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4863/203307 [5:36:36<228:55:51,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4864/203307 [5:36:40<228:55:30,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4864/203307 [5:36:40<228:55:30,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4865/203307 [5:36:43<228:55:05,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4865/203307 [5:36:43<228:55:06,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4866/203307 [5:36:47<228:54:43,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4866/203307 [5:36:47<228:54:43,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4867/203307 [5:36:51<228:54:54,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4867/203307 [5:36:51<228:54:54,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4868/203307 [5:36:56<228:54:48,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4868/203307 [5:36:56<228:54:48,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4869/203307 [5:36:59<228:54:28,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4869/203307 [5:36:59<228:54:28,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4870/203307 [5:37:04<228:54:31,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4870/203307 [5:37:04<228:54:32,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4871/203307 [5:37:07<228:54:07,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4871/203307 [5:37:07<228:54:08,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4872/203307 [5:37:12<228:54:13,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4872/203307 [5:37:12<228:54:13,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4873/203307 [5:37:15<228:53:49,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4873/203307 [5:37:15<228:53:49,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4874/203307 [5:37:19<228:53:30,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4874/203307 [5:37:19<228:53:30,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4875/203307 [5:37:24<228:53:37,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4875/203307 [5:37:24<228:53:38,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4876/203307 [5:37:27<228:53:17,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4876/203307 [5:37:27<228:53:17,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4877/203307 [5:37:32<228:53:12,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4877/203307 [5:37:32<228:53:12,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4878/203307 [5:37:36<228:53:15,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4878/203307 [5:37:36<228:53:15,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4879/203307 [5:37:40<228:52:50,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4879/203307 [5:37:40<228:52:51,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4880/203307 [5:37:44<228:52:56,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4880/203307 [5:37:44<228:52:57,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4881/203307 [5:37:48<228:52:33,  0.24it/s, v_num=t5e6, training/loss=0.0985]Epoch 0:   2%|▏         | 4881/203307 [5:37:48<228:52:33,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4882/203307 [5:37:51<228:52:10,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4882/203307 [5:37:51<228:52:10,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4883/203307 [5:37:56<228:52:17,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4883/203307 [5:37:56<228:52:17,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4884/203307 [5:37:59<228:51:54,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4884/203307 [5:37:59<228:51:54,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4885/203307 [5:38:03<228:51:32,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4885/203307 [5:38:03<228:51:32,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4886/203307 [5:38:07<228:51:37,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4886/203307 [5:38:07<228:51:37,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4887/203307 [5:38:11<228:51:13,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4887/203307 [5:38:11<228:51:13,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4888/203307 [5:38:15<228:50:49,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4888/203307 [5:38:15<228:50:49,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4889/203307 [5:38:19<228:50:56,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4889/203307 [5:38:19<228:50:56,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4890/203307 [5:38:23<228:50:31,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4890/203307 [5:38:23<228:50:31,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4891/203307 [5:38:27<228:50:10,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4891/203307 [5:38:27<228:50:11,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4892/203307 [5:38:31<228:50:20,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4892/203307 [5:38:31<228:50:20,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4893/203307 [5:38:35<228:50:01,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4893/203307 [5:38:35<228:50:01,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4894/203307 [5:38:39<228:49:41,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4894/203307 [5:38:39<228:49:41,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4895/203307 [5:38:43<228:49:44,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4895/203307 [5:38:43<228:49:44,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4896/203307 [5:38:47<228:49:21,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4896/203307 [5:38:47<228:49:21,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4897/203307 [5:38:50<228:48:59,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4897/203307 [5:38:50<228:48:59,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4898/203307 [5:38:55<228:49:06,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4898/203307 [5:38:55<228:49:06,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4899/203307 [5:38:59<228:48:44,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4899/203307 [5:38:59<228:48:44,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4900/203307 [5:39:03<228:48:51,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4900/203307 [5:39:03<228:48:52,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4901/203307 [5:39:07<228:48:32,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   2%|▏         | 4901/203307 [5:39:07<228:48:33,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4902/203307 [5:39:10<228:48:10,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4902/203307 [5:39:10<228:48:10,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4903/203307 [5:39:15<228:48:13,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4903/203307 [5:39:15<228:48:13,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4904/203307 [5:39:19<228:48:09,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4904/203307 [5:39:19<228:48:10,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4905/203307 [5:39:23<228:47:47,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4905/203307 [5:39:23<228:47:48,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4906/203307 [5:39:27<228:47:51,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4906/203307 [5:39:27<228:47:51,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4907/203307 [5:39:31<228:47:32,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4907/203307 [5:39:31<228:47:32,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4908/203307 [5:39:35<228:47:42,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4908/203307 [5:39:35<228:47:43,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4909/203307 [5:39:39<228:47:22,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4909/203307 [5:39:39<228:47:22,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4910/203307 [5:39:43<228:46:58,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4910/203307 [5:39:43<228:46:59,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4911/203307 [5:39:47<228:47:02,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4911/203307 [5:39:47<228:47:03,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4912/203307 [5:39:51<228:46:42,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4912/203307 [5:39:51<228:46:42,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4913/203307 [5:39:55<228:46:40,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4913/203307 [5:39:55<228:46:40,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4914/203307 [5:39:59<228:46:18,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4914/203307 [5:39:59<228:46:19,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4915/203307 [5:40:03<228:46:25,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4915/203307 [5:40:03<228:46:25,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4916/203307 [5:40:07<228:46:03,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4916/203307 [5:40:07<228:46:03,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4917/203307 [5:40:11<228:46:15,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4917/203307 [5:40:11<228:46:15,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4918/203307 [5:40:15<228:45:51,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4918/203307 [5:40:15<228:45:51,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4919/203307 [5:40:19<228:45:30,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4919/203307 [5:40:19<228:45:31,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4920/203307 [5:40:23<228:45:33,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4920/203307 [5:40:23<228:45:33,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4921/203307 [5:40:27<228:45:13,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   2%|▏         | 4921/203307 [5:40:27<228:45:13,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4922/203307 [5:40:31<228:45:09,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4922/203307 [5:40:31<228:45:09,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4923/203307 [5:40:35<228:44:48,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4923/203307 [5:40:35<228:44:48,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4924/203307 [5:40:39<228:44:55,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4924/203307 [5:40:39<228:44:55,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4925/203307 [5:40:44<228:45:00,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4925/203307 [5:40:44<228:45:00,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4926/203307 [5:40:47<228:44:39,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4926/203307 [5:40:47<228:44:39,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4927/203307 [5:40:51<228:44:15,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4927/203307 [5:40:51<228:44:15,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4928/203307 [5:40:55<228:44:16,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4928/203307 [5:40:55<228:44:16,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4929/203307 [5:40:59<228:43:51,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4929/203307 [5:40:59<228:43:52,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4930/203307 [5:41:03<228:43:27,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4930/203307 [5:41:03<228:43:27,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4931/203307 [5:41:07<228:43:25,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4931/203307 [5:41:07<228:43:26,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4932/203307 [5:41:11<228:43:30,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4932/203307 [5:41:11<228:43:31,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4933/203307 [5:41:16<228:43:41,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4933/203307 [5:41:16<228:43:42,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4934/203307 [5:41:19<228:43:17,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4934/203307 [5:41:19<228:43:18,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4935/203307 [5:41:23<228:42:54,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4935/203307 [5:41:23<228:42:54,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4936/203307 [5:41:27<228:42:58,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4936/203307 [5:41:27<228:42:58,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4937/203307 [5:41:31<228:42:35,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4937/203307 [5:41:31<228:42:36,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4938/203307 [5:41:35<228:42:13,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4938/203307 [5:41:35<228:42:13,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4939/203307 [5:41:38<228:41:50,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4939/203307 [5:41:38<228:41:50,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4940/203307 [5:41:43<228:41:46,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4940/203307 [5:41:43<228:41:47,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4941/203307 [5:41:47<228:41:57,  0.24it/s, v_num=t5e6, training/loss=0.0979]Epoch 0:   2%|▏         | 4941/203307 [5:41:47<228:41:57,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4942/203307 [5:41:52<228:42:06,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4942/203307 [5:41:52<228:42:06,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4943/203307 [5:41:55<228:41:42,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4943/203307 [5:41:55<228:41:42,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4944/203307 [5:41:59<228:41:22,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4944/203307 [5:41:59<228:41:22,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4945/203307 [5:42:03<228:41:26,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4945/203307 [5:42:03<228:41:26,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4946/203307 [5:42:07<228:41:05,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4946/203307 [5:42:07<228:41:05,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4947/203307 [5:42:11<228:40:46,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4947/203307 [5:42:11<228:40:46,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4948/203307 [5:42:15<228:40:25,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4948/203307 [5:42:15<228:40:25,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4949/203307 [5:42:19<228:40:23,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4949/203307 [5:42:19<228:40:23,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4950/203307 [5:42:23<228:40:29,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4950/203307 [5:42:23<228:40:29,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4951/203307 [5:42:27<228:40:09,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4951/203307 [5:42:27<228:40:09,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4952/203307 [5:42:31<228:39:45,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4952/203307 [5:42:31<228:39:45,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4953/203307 [5:42:35<228:39:48,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4953/203307 [5:42:35<228:39:49,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4954/203307 [5:42:39<228:39:28,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4954/203307 [5:42:39<228:39:28,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4955/203307 [5:42:42<228:39:05,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4955/203307 [5:42:42<228:39:06,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4956/203307 [5:42:46<228:38:43,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4956/203307 [5:42:46<228:38:43,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4957/203307 [5:42:50<228:38:20,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4957/203307 [5:42:50<228:38:20,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4958/203307 [5:42:54<228:38:30,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4958/203307 [5:42:54<228:38:30,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4959/203307 [5:42:58<228:38:10,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4959/203307 [5:42:58<228:38:11,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4960/203307 [5:43:02<228:37:49,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4960/203307 [5:43:02<228:37:49,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4961/203307 [5:43:06<228:37:53,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   2%|▏         | 4961/203307 [5:43:06<228:37:53,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4962/203307 [5:43:10<228:37:30,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4962/203307 [5:43:10<228:37:31,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4963/203307 [5:43:14<228:37:12,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4963/203307 [5:43:14<228:37:12,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4964/203307 [5:43:17<228:36:56,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4964/203307 [5:43:17<228:36:56,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4965/203307 [5:43:21<228:36:39,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4965/203307 [5:43:21<228:36:39,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4966/203307 [5:43:25<228:36:21,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4966/203307 [5:43:25<228:36:22,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4967/203307 [5:43:30<228:36:34,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4967/203307 [5:43:30<228:36:34,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4968/203307 [5:43:33<228:36:14,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4968/203307 [5:43:33<228:36:14,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4969/203307 [5:43:37<228:35:54,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4969/203307 [5:43:37<228:35:54,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4970/203307 [5:43:41<228:35:58,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4970/203307 [5:43:41<228:35:58,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4971/203307 [5:43:45<228:35:37,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4971/203307 [5:43:45<228:35:37,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4972/203307 [5:43:49<228:35:17,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4972/203307 [5:43:49<228:35:18,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4973/203307 [5:43:53<228:35:00,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4973/203307 [5:43:53<228:35:00,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4974/203307 [5:43:56<228:34:38,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4974/203307 [5:43:57<228:34:38,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4975/203307 [5:44:01<228:34:48,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4975/203307 [5:44:01<228:34:48,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4976/203307 [5:44:05<228:34:53,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4976/203307 [5:44:05<228:34:53,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4977/203307 [5:44:09<228:34:30,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4977/203307 [5:44:09<228:34:30,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4978/203307 [5:44:13<228:34:31,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4978/203307 [5:44:13<228:34:31,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4979/203307 [5:44:17<228:34:11,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4979/203307 [5:44:17<228:34:12,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4980/203307 [5:44:21<228:33:51,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4980/203307 [5:44:21<228:33:51,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4981/203307 [5:44:25<228:33:31,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 4981/203307 [5:44:25<228:33:31,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4982/203307 [5:44:28<228:33:09,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4982/203307 [5:44:28<228:33:09,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4983/203307 [5:44:33<228:33:16,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4983/203307 [5:44:33<228:33:16,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4984/203307 [5:44:37<228:33:23,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4984/203307 [5:44:37<228:33:23,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4985/203307 [5:44:41<228:33:19,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4985/203307 [5:44:41<228:33:19,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4986/203307 [5:44:46<228:33:19,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4986/203307 [5:44:46<228:33:19,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4987/203307 [5:44:49<228:32:58,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4987/203307 [5:44:49<228:32:58,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4988/203307 [5:44:53<228:32:35,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4988/203307 [5:44:53<228:32:35,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4989/203307 [5:44:57<228:32:13,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4989/203307 [5:44:57<228:32:14,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4990/203307 [5:45:00<228:31:53,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4990/203307 [5:45:00<228:31:53,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4991/203307 [5:45:04<228:31:30,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4991/203307 [5:45:04<228:31:30,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4992/203307 [5:45:09<228:31:39,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4992/203307 [5:45:09<228:31:39,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4993/203307 [5:45:13<228:31:48,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4993/203307 [5:45:13<228:31:48,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4994/203307 [5:45:17<228:31:46,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4994/203307 [5:45:17<228:31:47,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4995/203307 [5:45:22<228:31:50,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4995/203307 [5:45:22<228:31:50,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4996/203307 [5:45:25<228:31:28,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4996/203307 [5:45:25<228:31:28,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4997/203307 [5:45:29<228:31:05,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4997/203307 [5:45:29<228:31:06,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4998/203307 [5:45:33<228:30:46,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4998/203307 [5:45:33<228:30:46,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4999/203307 [5:45:36<228:30:26,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 4999/203307 [5:45:36<228:30:26,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5000/203307 [5:45:41<228:30:32,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5000/203307 [5:45:41<228:30:33,  0.24it/s, v_num=t5e6, training/loss=0.0928]
Validation: |          | 0/? [00:00<?, ?it/s][A
Validation:   0%|          | 0/1 [00:00<?, ?it/s][A


Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s][A[A

Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:23,  1.19it/s][A[A

Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:22,  1.19it/s][A[A

Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:21,  1.20it/s][A[A

Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:20,  1.19it/s][A[A

Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:19,  1.19it/s][A[A

Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:19,  1.19it/s][A[A

Sampling (mamba memory):  54%|█████▎    | 107/200 [00:05<01:18,  1.18it/s][A[A

Sampling (mamba memory):  54%|█████▍    | 108/200 [00:06<01:18,  1.18it/s][A[A

Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:17,  1.17it/s][A[A

Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:17,  1.17it/s][A[A

Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:25,  1.16it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:24,  1.16it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:23,  1.16it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:22,  1.16it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:22,  1.16it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:21,  1.15it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:20,  1.15it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:06<01:19,  1.15it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:18,  1.15it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:17,  1.16it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:17,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:23,  1.18it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:22,  1.18it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:21,  1.18it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:21,  1.19it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:20,  1.18it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:20,  1.16it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:05<01:20,  1.16it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:06<01:19,  1.16it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:18,  1.16it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:17,  1.16it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:17,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:25,  1.16it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:24,  1.16it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:24,  1.15it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:23,  1.16it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:22,  1.15it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:21,  1.15it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:20,  1.15it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:06<01:19,  1.15it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:18,  1.16it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:17,  1.16it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:16,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:29,  1.10it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:28,  1.11it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:25,  1.13it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:24,  1.13it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:23,  1.14it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:22,  1.13it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:22,  1.13it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:22,  1.12it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:21,  1.12it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:20,  1.12it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:20,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:27,  1.13it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:26,  1.14it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:25,  1.13it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:25,  1.13it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:24,  1.13it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:23,  1.12it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:23,  1.12it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:22,  1.12it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:21,  1.11it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:20,  1.11it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:20,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:29,  1.10it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:29,  1.10it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:28,  1.10it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:27,  1.10it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:26,  1.10it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:25,  1.10it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:24,  1.10it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:23,  1.10it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:22,  1.11it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:09<01:21,  1.11it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:20,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:30,  1.10it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:28,  1.10it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:28,  1.10it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:27,  1.10it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:26,  1.10it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:25,  1.10it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:25,  1.09it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:24,  1.09it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:23,  1.08it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:09<01:23,  1.08it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:10<01:22,  1.0Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:16,  1.17it/s][A[A

Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:15,  1.16it/s][A[A

Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:15,  1.16it/s][A[A

Sampling (mamba memory):  57%|█████▋    | 114/200 [00:11<01:14,  1.16it/s][A[A

Sampling (mamba memory):  57%|█████▊    | 115/200 [00:12<01:13,  1.16it/s][A[A

Sampling (mamba memory):  58%|█████▊    | 116/200 [00:13<01:12,  1.16it/s][A[A

Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:11,  1.15it/s][A[A

Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:11,  1.15it/s][A[A

Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:10,  1.15it/s][A[A

Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:09,  1.15it/s][A[A

Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:09,  1.14it/s][A[A

Sampling (mamba memory):  61%|██████    | 122/200 [00:18<01:08,  1.14it/s][A[A

6it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:16,  1.15it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:15,  1.15it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:14,  1.15it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:12<01:13,  1.15it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:13<01:13,  1.15it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:12,  1.14it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:11,  1.14it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:10,  1.14it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:10,  1.14it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:09,  1.14it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:08,  1.14it/s]Sampling (mamba memory):  62%|██████▏   | 123/6it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:16,  1.16it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:15,  1.15it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:14,  1.15it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:14,  1.15it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:13<01:13,  1.15it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:12,  1.14it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:11,  1.14it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:11,  1.14it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:10,  1.14it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:09,  1.14it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:08,  1.14it/s]Sampling (mamba memory):  62%|██████▏   | 123/6it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:16,  1.15it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:15,  1.15it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:14,  1.15it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:14,  1.15it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:13<01:13,  1.14it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:13,  1.13it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:12,  1.13it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:11,  1.13it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:11,  1.13it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:10,  1.12it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:09,  1.12it/s]Sampling (mamba memory):  62%|██████▏   | 123/1it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:19,  1.11it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:18,  1.11it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:17,  1.11it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:16,  1.11it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:15,  1.11it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:14,  1.11it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:13,  1.11it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:12,  1.11it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:12,  1.11it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:11,  1.11it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:10,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 123/Sampling (mamba memory):  62%|██████▏   | 123/200 [00:19<01:07,  1.14it/s][A[A

1it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:19,  1.11it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:18,  1.10it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:18,  1.10it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:17,  1.10it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:16,  1.10it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:15,  1.09it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:14,  1.10it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:14,  1.09it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:13,  1.09it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:12,  1.09it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:11,  1.09it/s]Sampling (mamba memory):  62%|██████▏   | 123/1it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:19,  1.10it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:18,  1.10it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:18,  1.10it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:17,  1.09it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:17,  1.09it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:16,  1.09it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:15,  1.08it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:14,  1.08it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:14,  1.08it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:19<01:13,  1.08it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:20<01:12,  1.07it/s]Sampling (mamba memory):  62%|██████▏   | 123/8it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:11<01:21,  1.07it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:21,  1.07it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:20,  1.07it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:19,  1.07it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:18,  1.07it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:17,  1.07it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:16,  1.07it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:15,  1.07it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:15,  1.07it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:19<01:14,  1.06it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:20<01:13,  1.06it/s]Sampling (mamba memory):  62%|██████▏   | 123/Sampling (mamba memory):  62%|██████▏   | 124/200 [00:20<01:06,  1.14it/s][A[A

Sampling (mamba memory):  62%|██████▎   | 125/200 [00:21<01:06,  1.14it/s][A[A

Sampling (mamba memory):  63%|██████▎   | 126/200 [00:22<01:05,  1.14it/s][A[A

Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:04,  1.14it/s][A[A

Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:03,  1.14it/s][A[A

Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:01,  1.15it/s][A[A

Sampling (mamba memory):  65%|██████▌   | 130/200 [00:25<01:01,  1.15it/s][A[A

Sampling (mamba memory):  66%|██████▌   | 131/200 [00:26<01:00,  1.15it/s][A[A

Sampling (mamba memory):  66%|██████▌   | 132/200 [00:27<00:59,  1.15it/s][A[A

Sampling (mamba memory):  66%|██████▋   | 133/200 [00:28<00:58,  1.15it/s][A[A

Sampling (mamba memory):  67%|██████▋   | 134/200 [00:29<00:57,  1.14it/s][A[A

200 [00:19<01:07,  1.14it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:20<01:06,  1.14it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:21<01:06,  1.13it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:22<01:05,  1.13it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:04,  1.13it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:03,  1.13it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:03,  1.13it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:02,  1.12it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:01,  1.12it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:27<01:00,  1.12it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:28<00:59,  1.12it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:29<00:58,  1.12it/s]Sampling (mamba 200 [00:20<01:07,  1.13it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:20<01:07,  1.13it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:21<01:06,  1.13it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:22<01:05,  1.13it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:04,  1.12it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:04,  1.12it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:03,  1.12it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:03,  1.11it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:02,  1.10it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:01,  1.10it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:00,  1.10it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:29<01:00,  1.10it/s]Sampling (mamba 200 [00:20<01:08,  1.12it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:08,  1.11it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:21<01:07,  1.11it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:22<01:06,  1.11it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:05,  1.11it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:05,  1.11it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:04,  1.11it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:03,  1.10it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:03,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:02,  1.09it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:01,  1.09it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:00,  1.08it/s]Sampling (mamba Sampling (mamba memory):  68%|██████▊   | 135/200 [00:30<00:57,  1.14it/s][A[A

200 [00:20<01:09,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:08,  1.10it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:08,  1.10it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:07,  1.10it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:06,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:05,  1.10it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:04,  1.09it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:04,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:03,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:02,  1.09it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:01,  1.09it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:00,  1.09it/s]Sampling (mamba 200 [00:20<01:10,  1.09it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:09,  1.09it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:09,  1.09it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:08,  1.09it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:06,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:06,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:05,  1.08it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:04,  1.08it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:04,  1.08it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:03,  1.07it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:02,  1.07it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<01:01,  1.07it/s]Sampling (mamba Sampling (mamba memory):  68%|██████▊   | 136/200 [00:31<00:56,  1.14it/s][A[A

200 [00:21<01:11,  1.07it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:10,  1.08it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:09,  1.08it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:08,  1.08it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:07,  1.08it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:06,  1.08it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:06,  1.07it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:05,  1.06it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:05,  1.06it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:04,  1.06it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:03,  1.06it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<01:02,  1.06it/s]Sampling (mamba 200 [00:21<01:13,  1.05it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:22<01:12,  1.05it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:23<01:11,  1.05it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:24<01:10,  1.05it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:25<01:09,  1.05it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:26<01:08,  1.05it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:27<01:07,  1.05it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:28<01:07,  1.04it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:29<01:06,  1.04it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:30<01:05,  1.04it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:31<01:04,  1.03it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<01:03,  1.03it/s]Sampling (mamba Sampling (mamba memory):  68%|██████▊   | 137/200 [00:32<00:55,  1.13it/s][A[A

Sampling (mamba memory):  69%|██████▉   | 138/200 [00:32<00:55,  1.12it/s][A[A

Sampling (mamba memory):  70%|██████▉   | 139/200 [00:33<00:54,  1.12it/s][A[A

Sampling (mamba memory):  70%|███████   | 140/200 [00:34<00:53,  1.12it/s][A[A

Sampling (mamba memory):  70%|███████   | 141/200 [00:35<00:53,  1.11it/s][A[A

Sampling (mamba memory):  71%|███████   | 142/200 [00:36<00:52,  1.11it/s][A[A

Sampling (mamba memory):  72%|███████▏  | 143/200 [00:37<00:51,  1.11it/s][A[A

Sampling (mamba memory):  72%|███████▏  | 144/200 [00:38<00:50,  1.11it/s][A[A

Sampling (mamba memory):  72%|███████▎  | 145/200 [00:39<00:49,  1.11it/s][A[A

memory):  68%|██████▊   | 135/200 [00:30<00:58,  1.12it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:31<00:57,  1.12it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:32<00:56,  1.11it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:33<00:55,  1.11it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:34<00:55,  1.11it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:35<00:54,  1.10it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:36<00:53,  1.10it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:37<00:52,  1.10it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:37<00:52,  1.09it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:38<00:51,  1.09it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:39<00:50,  1.09it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:30<00:59,  1.10it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:31<00:58,  1.10it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:32<00:57,  1.09it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:33<00:56,  1.09it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:34<00:56,  1.09it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:35<00:55,  1.09it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:36<00:54,  1.08it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:37<00:53,  1.08it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:38<00:52,  1.08it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:52,  1.08it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:51,  1.08it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  73%|███████▎  | 146/200 [00:40<00:48,  1.10it/s][A[A

memory):  68%|██████▊   | 135/200 [00:31<01:00,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:59,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:58,  1.08it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:33<00:57,  1.07it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:34<00:56,  1.07it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:35<00:55,  1.07it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:36<00:55,  1.07it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:37<00:54,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:38<00:53,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:52,  1.06it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:52,  1.05it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:31<01:00,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:59,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:58,  1.08it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:57,  1.08it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:56,  1.07it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:55,  1.07it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:55,  1.07it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:54,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:53,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:52,  1.06it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:51,  1.06it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▎  | 147/200 [00:41<00:48,  1.10it/s][A[A

memory):  68%|██████▊   | 135/200 [00:31<01:00,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:59,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:58,  1.07it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:57,  1.07it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:57,  1.07it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:56,  1.07it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:55,  1.07it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:54,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:53,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:52,  1.07it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:51,  1.07it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:32<01:01,  1.06it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:33<01:00,  1.06it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:34<00:59,  1.06it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:35<00:58,  1.06it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:36<00:57,  1.06it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:37<00:56,  1.06it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:38<00:55,  1.06it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:55,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:54,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:53,  1.05it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:52,  1.05it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▍  | 148/200 [00:42<00:47,  1.10it/s][A[A

memory):  68%|██████▊   | 135/200 [00:32<01:02,  1.03it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:33<01:01,  1.04it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:34<01:00,  1.04it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:35<00:59,  1.04it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:36<00:58,  1.04it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:37<00:57,  1.04it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:38<00:57,  1.03it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:39<00:56,  1.03it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:40<00:55,  1.03it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:41<00:54,  1.03it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:42<00:53,  1.02it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▍  | 149/200 [00:42<00:46,  1.10it/s][A[A

Sampling (mamba memory):  75%|███████▌  | 150/200 [00:43<00:45,  1.10it/s][A[A

Sampling (mamba memory):  76%|███████▌  | 151/200 [00:44<00:44,  1.09it/s][A[A

Sampling (mamba memory):  76%|███████▌  | 152/200 [00:45<00:43,  1.09it/s][A[A

Sampling (mamba memory):  76%|███████▋  | 153/200 [00:46<00:43,  1.09it/s][A[A

Sampling (mamba memory):  77%|███████▋  | 154/200 [00:47<00:42,  1.09it/s][A[A

Sampling (mamba memory):  78%|███████▊  | 155/200 [00:48<00:41,  1.09it/s][A[A

Sampling (mamba memory):  78%|███████▊  | 156/200 [00:49<00:40,  1.09it/s][A[A

 | 146/200 [00:40<00:49,  1.09it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:41<00:48,  1.08it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:42<00:48,  1.08it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:43<00:47,  1.08it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:44<00:46,  1.07it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:45<00:45,  1.07it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:46<00:44,  1.07it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:47<00:43,  1.07it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:48<00:43,  1.07it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:49<00:42,  1.07it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:50<00:41,  1.07it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:51<00:40Sampling (mamba memory):  78%|███████▊  | 157/200 [00:50<00:39,  1.09it/s][A[A

 | 146/200 [00:41<00:50,  1.08it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:49,  1.08it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:42<00:48,  1.08it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:43<00:47,  1.08it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:44<00:46,  1.08it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:45<00:45,  1.08it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:46<00:44,  1.08it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:47<00:43,  1.08it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:48<00:42,  1.07it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:49<00:41,  1.07it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:50<00:41,  1.07it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:51<00:40Sampling (mamba memory):  79%|███████▉  | 158/200 [00:51<00:38,  1.08it/s][A[A

 | 146/200 [00:41<00:51,  1.05it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:50,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:49,  1.04it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:48,  1.04it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:48,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:47,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:46,  1.04it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:45,  1.04it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:44,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:43,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:42,  1.02it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:42 | 146/200 [00:41<00:50,  1.07it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:49,  1.07it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:48,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:48,  1.06it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:47,  1.06it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:46,  1.06it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:45,  1.06it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:44,  1.06it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:43,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:42,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:41,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:40 | 146/200 [00:42<00:50,  1.07it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:49,  1.07it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:48,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:48,  1.06it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:47,  1.06it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:46,  1.06it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:45,  1.05it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:44,  1.05it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:43,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:42,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:41,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:41Sampling (mamba memory):  80%|███████▉  | 159/200 [00:52<00:37,  1.08it/s][A[A

 | 146/200 [00:42<00:51,  1.05it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:50,  1.04it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:49,  1.04it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:48,  1.04it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:48,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:47,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:48<00:46,  1.03it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:49<00:45,  1.03it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:50<00:44,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:51<00:43,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:52<00:42,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:53<00:41Sampling (mamba memory):  80%|████████  | 160/200 [00:53<00:36,  1.08it/s][A[A

 | 146/200 [00:43<00:52,  1.02it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:44<00:52,  1.02it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:45<00:51,  1.01it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:46<00:50,  1.01it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:47<00:49,  1.02it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:48<00:48,  1.02it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:49<00:47,  1.02it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:50<00:46,  1.02it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:51<00:45,  1.02it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:52<00:44,  1.02it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:53<00:43,  1.01it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:54<00:42Sampling (mamba memory):  80%|████████  | 161/200 [00:54<00:36,  1.08it/s][A[A

Sampling (mamba memory):  81%|████████  | 162/200 [00:54<00:35,  1.08it/s][A[A

Sampling (mamba memory):  82%|████████▏ | 163/200 [00:55<00:34,  1.08it/s][A[A

Sampling (mamba memory):  82%|████████▏ | 164/200 [00:56<00:33,  1.07it/s][A[A

Sampling (mamba memory):  82%|████████▎ | 165/200 [00:57<00:32,  1.07it/s][A[A

Sampling (mamba memory):  83%|████████▎ | 166/200 [00:58<00:31,  1.07it/s][A[A

Sampling (mamba memory):  84%|████████▎ | 167/200 [00:59<00:30,  1.07it/s][A[A

,  1.06it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:51<00:39,  1.06it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:52<00:38,  1.07it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:53<00:37,  1.07it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:54<00:36,  1.07it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:55<00:35,  1.07it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:56<00:34,  1.07it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:57<00:33,  1.06it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [00:58<00:33,  1.06it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [00:59<00:32,  1.05it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:00<00:31,  1.04it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:01<00:30,  1.05it/sSampling (mamba memory):  84%|████████▍ | 168/200 [01:00<00:29,  1.07it/s][A[A

,  1.07it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:52<00:39,  1.07it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:53<00:38,  1.06it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:54<00:37,  1.06it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:55<00:36,  1.06it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:56<00:35,  1.06it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:57<00:34,  1.06it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:57<00:34,  1.06it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [00:58<00:33,  1.05it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [00:59<00:32,  1.05it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:00<00:31,  1.05it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:01<00:30,  1.05it/sSampling (mamba memory):  84%|████████▍ | 169/200 [01:01<00:29,  1.07it/s][A[A

,  1.05it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:53<00:39,  1.05it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:54<00:39,  1.05it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:55<00:38,  1.05it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:56<00:37,  1.04it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:57<00:36,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:35,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:34,  1.04it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:33,  1.04it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:32,  1.04it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:02<00:31,  1.03it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:03<00:31,  1.03it/s,  1.02it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:53<00:41,  1.02it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:54<00:40,  1.02it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:55<00:39,  1.01it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:56<00:38,  1.01it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:57<00:37,  1.01it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:36,  1.01it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:35,  1.01it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:34,  1.01it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:33,  1.00it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:02<00:32,  1.00it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:03<00:31,  1.00it/sSampling (mamba memory):  85%|████████▌ | 170/200 [01:02<00:28,  1.07it/s][A[A

,  1.05it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:53<00:40,  1.05it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:54<00:39,  1.04it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:55<00:38,  1.04it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:56<00:37,  1.04it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:57<00:36,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:35,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:34,  1.04it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:33,  1.04it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:32,  1.03it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:02<00:32,  1.03it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:03<00:31,  1.03it/sSampling (mamba memory):  86%|████████▌ | 171/200 [01:03<00:27,  1.06it/s][A[A

,  1.02it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:54<00:41,  1.02it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:55<00:40,  1.02it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:56<00:39,  1.02it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:57<00:38,  1.02it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:58<00:37,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:59<00:36,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:00<00:35,  1.01it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:01<00:34,  1.01it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:02<00:33,  1.01it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:03<00:32,  1.01it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:04<00:31,  1.01it/sSampling (mamba memory):  86%|████████▌ | 172/200 [01:04<00:26,  1.06it/s][A[A

,  1.01it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:55<00:41,  1.01it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:56<00:40,  1.01it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:57<00:39,  1.01it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:58<00:38,  1.01it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:59<00:37,  1.01it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [01:00<00:36,  1.00it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:01<00:35,  1.00it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:02<00:35,  1.00s/it]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:03<00:34,  1.00s/it]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:04<00:32,  1.00it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:05<00:31,  1.00it/sSampling (mamba memory):  86%|████████▋ | 173/200 [01:05<00:25,  1.06it/s][A[A

Sampling (mamba memory):  87%|████████▋ | 174/200 [01:06<00:24,  1.06it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 175/200 [01:07<00:23,  1.05it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 176/200 [01:08<00:22,  1.05it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 177/200 [01:09<00:21,  1.05it/s][A[A

Sampling (mamba memory):  89%|████████▉ | 178/200 [01:10<00:20,  1.05it/s][A[A

Sampling (mamba memory):  90%|████████▉ | 179/200 [01:11<00:20,  1.05it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:02<00:29,  1.05it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:03<00:28,  1.05it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:04<00:27,  1.05it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:05<00:26,  1.05it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:06<00:25,  1.05it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:07<00:24,  1.05it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:08<00:23,  1.04it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:09<00:23,  1.04it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:10<00:22,  1.04it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:11<00:21,  1.03it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:11<00:20,  1.04it/s]]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:02<00:29,  1.05it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:03<00:28,  1.04it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:04<00:27,  1.04it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:05<00:26,  1.04it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:06<00:25,  1.04it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:07<00:25,  1.03it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:08<00:24,  1.03it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:09<00:23,  1.03it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:10<00:22,  1.03it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:11<00:21,  1.02it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:12<00:20,  1.02it/s]Sampling (mamba memory):  90%|█████████ | 180/200 [01:11<00:19,  1.05it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:03<00:30,  1.03it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:04<00:29,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:05<00:28,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:06<00:27,  1.02it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:07<00:26,  1.02it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:08<00:25,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:09<00:24,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:10<00:23,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:11<00:22,  1.01it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:12<00:21,  1.01it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:13<00:20,  1.01it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:12<00:18,  1.05it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:04<00:30,  1.00it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:05<00:29,  1.00it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:06<00:28,  1.00it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:07<00:28,  1.00s/it]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:08<00:27,  1.01s/it]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:09<00:26,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:10<00:25,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:11<00:24,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:12<00:23,  1.01s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:13<00:22,  1.01s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:14<00:21,  1.01s/it]]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:04<00:30,  1.02it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:05<00:29,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:06<00:28,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:07<00:27,  1.02it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:08<00:26,  1.02it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:09<00:25,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:10<00:24,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:11<00:23,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:12<00:22,  1.01it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:13<00:21,  1.01it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:14<00:20,  1.01it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:13<00:17,  1.04it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:05<00:30,  1.01it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:06<00:29,  1.01it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:07<00:28,  1.00it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:08<00:28,  1.00s/it]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:09<00:27,  1.00s/it]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:10<00:26,  1.00s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:11<00:25,  1.00s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:12<00:24,  1.00s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:13<00:23,  1.01s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:14<00:22,  1.01s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:15<00:21,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:14<00:16,  1.04it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:06<00:30,  1.00it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:07<00:30,  1.00s/it]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:08<00:29,  1.00s/it]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:09<00:28,  1.01s/it]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:10<00:27,  1.01s/it]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:11<00:26,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:12<00:25,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:13<00:24,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:14<00:23,  1.01s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:15<00:22,  1.02s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:16<00:21,  1.02s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:15<00:15,  1.04it/s][A[A

Sampling (mamba memory):  92%|█████████▎| 185/200 [01:16<00:14,  1.04it/s][A[A

Sampling (mamba memory):  93%|█████████▎| 186/200 [01:17<00:13,  1.04it/s][A[A

Sampling (mamba memory):  94%|█████████▎| 187/200 [01:18<00:12,  1.03it/s][A[A

Sampling (mamba memory):  94%|█████████▍| 188/200 [01:19<00:11,  1.03it/s][A[A

Sampling (mamba memory):  94%|█████████▍| 189/200 [01:20<00:10,  1.03it/s][A[A

Sampling (mamba memory):  95%|█████████▌| 190/200 [01:21<00:09,  1.02it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:12<00:19,  1.03it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:13<00:18,  1.03it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:14<00:17,  1.03it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:15<00:16,  1.03it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:16<00:15,  1.03it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:17<00:14,  1.03it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:18<00:13,  1.03it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:19<00:12,  1.02it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:20<00:11,  1.02it/s]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:21<00:10,  1.02it/s]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:22<00Sampling (mamba memory):  90%|█████████ | 180/200 [01:13<00:19,  1.02it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:14<00:18,  1.02it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:15<00:17,  1.02it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:16<00:16,  1.02it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:17<00:15,  1.01it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:18<00:14,  1.01it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:19<00:13,  1.01it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:20<00:12,  1.01it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:21<00:11,  1.01it/s]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:22<00:10,  1.01it/s]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:23<00Sampling (mamba memory):  96%|█████████▌| 191/200 [01:22<00:08,  1.02it/s][A[A

Sampling (mamba memory):  96%|█████████▌| 192/200 [01:23<00:07,  1.02it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:14<00:19,  1.01it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:15<00:18,  1.00it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:16<00:17,  1.00it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:17<00:16,  1.00it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:18<00:15,  1.00it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:19<00:15,  1.00s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:20<00:14,  1.01s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:21<00:13,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:22<00:12,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:23<00:11,  1.00s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:24<00Sampling (mamba memory):  90%|█████████ | 180/200 [01:15<00:19,  1.01it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:16<00:18,  1.00it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:17<00:17,  1.00it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:18<00:16,  1.00it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:19<00:15,  1.00it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:20<00:15,  1.00s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:21<00:14,  1.01s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:22<00:13,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:23<00:12,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:24<00:11,  1.02s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:25<00Sampling (mamba memory):  90%|█████████ | 180/200 [01:15<00:20,  1.01s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:16<00:19,  1.02s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:17<00:18,  1.02s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:18<00:17,  1.02s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:19<00:16,  1.03s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:20<00:15,  1.03s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:21<00:14,  1.03s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:22<00:13,  1.03s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:23<00:12,  1.03s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:24<00:11,  1.03s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:25<00Sampling (mamba memory):  96%|█████████▋| 193/200 [01:24<00:06,  1.02it/s][A[A

Sampling (mamba memory):  97%|█████████▋| 194/200 [01:25<00:05,  1.02it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:16<00:20,  1.01s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:17<00:19,  1.02s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:18<00:18,  1.02s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:19<00:17,  1.02s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:20<00:16,  1.02s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:21<00:15,  1.02s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:22<00:14,  1.02s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:23<00:13,  1.02s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:24<00:12,  1.02s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:25<00:11,  1.03s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:26<00Sampling (mamba memory):  98%|█████████▊| 195/200 [01:26<00:04,  1.02it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:17<00:20,  1.02s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:18<00:19,  1.02s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:19<00:18,  1.02s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:20<00:17,  1.03s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:21<00:16,  1.03s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:22<00:15,  1.04s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:23<00:14,  1.04s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:24<00:13,  1.04s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:25<00:12,  1.04s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:27<00:11,  1.05s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:28<00Sampling (mamba memory):  98%|█████████▊| 196/200 [01:27<00:03,  1.02it/s][A[A

Sampling (mamba memory):  98%|█████████▊| 197/200 [01:28<00:02,  1.02it/s][A[A

Sampling (mamba memory):  99%|█████████▉| 198/200 [01:29<00:01,  1.02it/s][A[A

Sampling (mamba memory): 100%|█████████▉| 199/200 [01:30<00:00,  1.02it/s][A[A

Sampling (mamba memory): 100%|██████████| 200/200 [01:31<00:00,  1.02it/s][A[ASampling (mamba memory): 100%|██████████| 200/200 [01:36<00:00,  1.04it/s]
Validation DataLoader 0:   0%|          | 0/1 [00:00<?, ?it/s][A
:09,  1.02it/s]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:23<00:08,  1.02it/s]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:24<00:07,  1.02it/s]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:25<00:06,  1.01it/s]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:26<00:05,  1.01it/s]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:27<00:04,  1.01it/s]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:28<00:03,  1.01it/s]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:29<00:02,  1.01it/s]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:30<00:01,  1.00it/s]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:31<00:01,  1.00s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:32<00:00,  1.00s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:37<00:00,  1.03it/s]
:09,  1.01it/s]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:24<00:08,  1.00it/s]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:25<00:07,  1.00it/s]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:26<00:07,  1.00s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:27<00:06,  1.00s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:28<00:05,  1.00s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:29<00:04,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:30<00:03,  1.01s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:31<00:02,  1.01s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:32<00:01,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:33<00:00,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:38<00:00,  1.02it/s]
:10,  1.00s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:25<00:09,  1.00s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:26<00:08,  1.00s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:27<00:07,  1.00s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:28<00:06,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:29<00:05,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:30<00:04,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:31<00:03,  1.01s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:32<00:02,  1.01s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:33<00:01,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:34<00:00,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:39<00:00,  1.00it/s]
:10,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:26<00:09,  1.04s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:27<00:08,  1.04s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:28<00:07,  1.03s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:29<00:06,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:30<00:05,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:31<00:04,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:32<00:03,  1.03s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:33<00:02,  1.03s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:34<00:01,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:35<00:00,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:40<00:00,  1.01s/it]
:10,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:26<00:09,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:27<00:08,  1.02s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:28<00:07,  1.02s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:29<00:06,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:30<00:05,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:31<00:04,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:32<00:03,  1.02s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:33<00:02,  1.02s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:34<00:01,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:35<00:00,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:40<00:00,  1.01s/it]
:10,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:27<00:09,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:28<00:08,  1.03s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:29<00:07,  1.03s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:30<00:06,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:31<00:05,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:32<00:04,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:33<00:03,  1.03s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:34<00:02,  1.03s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:36<00:01,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:37<00:00,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:41<00:00,  1.02s/it]
:10,  1.05s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:29<00:09,  1.05s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:30<00:08,  1.05s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:31<00:07,  1.05s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:32<00:06,  1.05s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:33<00:05,  1.05s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:34<00:04,  1.05s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:35<00:03,  1.05s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:36<00:02,  1.05s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:37<00:01,  1.04s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:38<00:00,  1.04s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:43<00:00,  1.03s/it]
Validation DataLoader 0: 100%|██████████| 1/1 [01:36<00:00,  0.01it/s][A
                                                                      [AEpoch 0:   2%|▏         | 5000/203307 [5:47:36<229:46:26,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5001/203307 [5:47:40<229:46:41,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5001/203307 [5:47:40<229:46:41,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5002/203307 [5:47:45<229:46:46,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5002/203307 [5:47:45<229:46:46,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5003/203307 [5:47:49<229:46:45,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5003/203307 [5:47:49<229:46:45,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5004/203307 [5:47:53<229:46:23,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5004/203307 [5:47:53<229:46:23,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5005/203307 [5:47:56<229:46:00,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5005/203307 [5:47:56<229:46:00,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5006/203307 [5:48:00<229:45:38,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5006/203307 [5:48:00<229:45:38,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5007/203307 [5:48:04<229:45:08,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5007/203307 [5:48:04<229:45:08,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5008/203307 [5:48:08<229:45:09,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5008/203307 [5:48:08<229:45:09,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5009/203307 [5:48:12<229:44:48,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5009/203307 [5:48:12<229:44:48,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5010/203307 [5:48:16<229:45:03,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5010/203307 [5:48:16<229:45:03,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5011/203307 [5:48:20<229:44:55,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5011/203307 [5:48:20<229:44:55,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5012/203307 [5:48:25<229:44:55,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5012/203307 [5:48:25<229:44:55,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5013/203307 [5:48:28<229:44:29,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5013/203307 [5:48:28<229:44:30,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5014/203307 [5:48:32<229:44:02,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5014/203307 [5:48:32<229:44:02,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5015/203307 [5:48:36<229:43:45,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5015/203307 [5:48:36<229:43:45,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5016/203307 [5:48:40<229:43:28,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5016/203307 [5:48:40<229:43:28,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5017/203307 [5:48:44<229:43:38,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5017/203307 [5:48:44<229:43:38,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5018/203307 [5:48:48<229:43:15,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5018/203307 [5:48:48<229:43:15,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5019/203307 [5:48:52<229:43:17,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5019/203307 [5:48:52<229:43:17,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5020/203307 [5:48:56<229:43:16,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5020/203307 [5:48:56<229:43:16,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5021/203307 [5:49:00<229:42:57,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   2%|▏         | 5021/203307 [5:49:00<229:42:57,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5022/203307 [5:49:04<229:42:39,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5022/203307 [5:49:04<229:42:39,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5023/203307 [5:49:08<229:42:21,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5023/203307 [5:49:08<229:42:21,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5024/203307 [5:49:12<229:41:56,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5024/203307 [5:49:12<229:41:56,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5025/203307 [5:49:16<229:42:08,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5025/203307 [5:49:16<229:42:08,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5026/203307 [5:49:20<229:41:46,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5026/203307 [5:49:20<229:41:47,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5027/203307 [5:49:24<229:41:23,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5027/203307 [5:49:24<229:41:24,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5028/203307 [5:49:28<229:41:38,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5028/203307 [5:49:28<229:41:38,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5029/203307 [5:49:32<229:41:23,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5029/203307 [5:49:32<229:41:23,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5030/203307 [5:49:36<229:40:59,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5030/203307 [5:49:36<229:40:59,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5031/203307 [5:49:39<229:40:34,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5031/203307 [5:49:39<229:40:35,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5032/203307 [5:49:43<229:40:09,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5032/203307 [5:49:43<229:40:10,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5033/203307 [5:49:47<229:39:50,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5033/203307 [5:49:47<229:39:50,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5034/203307 [5:49:51<229:39:58,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5034/203307 [5:49:51<229:39:59,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5035/203307 [5:49:55<229:39:35,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5035/203307 [5:49:55<229:39:35,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5036/203307 [5:49:59<229:39:12,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5036/203307 [5:49:59<229:39:12,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5037/203307 [5:50:03<229:39:17,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5037/203307 [5:50:03<229:39:17,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5038/203307 [5:50:07<229:39:10,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5038/203307 [5:50:07<229:39:10,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5039/203307 [5:50:11<229:38:46,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5039/203307 [5:50:11<229:38:46,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5040/203307 [5:50:15<229:38:22,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5040/203307 [5:50:15<229:38:22,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5041/203307 [5:50:18<229:38:01,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   2%|▏         | 5041/203307 [5:50:18<229:38:01,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5042/203307 [5:50:23<229:38:11,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5042/203307 [5:50:23<229:38:11,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5043/203307 [5:50:26<229:37:49,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5043/203307 [5:50:26<229:37:49,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5044/203307 [5:50:30<229:37:28,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5044/203307 [5:50:30<229:37:28,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5045/203307 [5:50:35<229:37:33,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5045/203307 [5:50:35<229:37:33,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5046/203307 [5:50:39<229:37:32,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5046/203307 [5:50:39<229:37:32,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5047/203307 [5:50:43<229:37:12,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5047/203307 [5:50:43<229:37:12,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5048/203307 [5:50:46<229:36:55,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5048/203307 [5:50:46<229:36:55,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5049/203307 [5:50:50<229:36:41,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5049/203307 [5:50:50<229:36:42,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5050/203307 [5:50:55<229:36:49,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5050/203307 [5:50:55<229:36:49,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5051/203307 [5:50:59<229:36:28,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5051/203307 [5:50:59<229:36:28,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5052/203307 [5:51:02<229:36:08,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5052/203307 [5:51:02<229:36:09,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5053/203307 [5:51:07<229:36:13,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5053/203307 [5:51:07<229:36:13,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5054/203307 [5:51:11<229:36:22,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5054/203307 [5:51:11<229:36:22,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5055/203307 [5:51:15<229:36:15,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5055/203307 [5:51:15<229:36:16,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5056/203307 [5:51:19<229:35:57,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5056/203307 [5:51:19<229:35:58,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5057/203307 [5:51:23<229:35:35,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5057/203307 [5:51:23<229:35:35,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5058/203307 [5:51:27<229:35:18,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5058/203307 [5:51:27<229:35:18,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5059/203307 [5:51:31<229:35:26,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5059/203307 [5:51:31<229:35:26,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5060/203307 [5:51:35<229:35:04,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5060/203307 [5:51:35<229:35:04,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5061/203307 [5:51:39<229:34:44,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   2%|▏         | 5061/203307 [5:51:39<229:34:44,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5062/203307 [5:51:43<229:34:49,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5062/203307 [5:51:43<229:34:49,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5063/203307 [5:51:48<229:34:55,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5063/203307 [5:51:48<229:34:55,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5064/203307 [5:51:51<229:34:33,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5064/203307 [5:51:51<229:34:33,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5065/203307 [5:51:55<229:34:26,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5065/203307 [5:51:55<229:34:27,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5066/203307 [5:51:59<229:34:05,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5066/203307 [5:51:59<229:34:06,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5067/203307 [5:52:04<229:34:13,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5067/203307 [5:52:04<229:34:14,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5068/203307 [5:52:07<229:33:53,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5068/203307 [5:52:07<229:33:53,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5069/203307 [5:52:11<229:33:30,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5069/203307 [5:52:11<229:33:30,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5070/203307 [5:52:15<229:33:31,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5070/203307 [5:52:15<229:33:31,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5071/203307 [5:52:20<229:33:38,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5071/203307 [5:52:20<229:33:39,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5072/203307 [5:52:24<229:33:18,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5072/203307 [5:52:24<229:33:19,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5073/203307 [5:52:27<229:32:57,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5073/203307 [5:52:27<229:32:57,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5074/203307 [5:52:31<229:32:53,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5074/203307 [5:52:31<229:32:54,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5075/203307 [5:52:36<229:33:00,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5075/203307 [5:52:36<229:33:01,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5076/203307 [5:52:40<229:32:37,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5076/203307 [5:52:40<229:32:37,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5077/203307 [5:52:43<229:32:15,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5077/203307 [5:52:43<229:32:16,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5078/203307 [5:52:48<229:32:17,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5078/203307 [5:52:48<229:32:17,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5079/203307 [5:52:51<229:31:55,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5079/203307 [5:52:51<229:31:55,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5080/203307 [5:52:56<229:32:01,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5080/203307 [5:52:56<229:32:01,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5081/203307 [5:52:59<229:31:38,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   2%|▏         | 5081/203307 [5:52:59<229:31:38,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 5082/203307 [5:53:03<229:31:14,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   2%|▏         | 5082/203307 [5:53:03<229:31:14,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5083/203307 [5:53:07<229:31:13,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5083/203307 [5:53:07<229:31:13,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5084/203307 [5:53:12<229:31:19,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5084/203307 [5:53:12<229:31:19,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5085/203307 [5:53:15<229:30:56,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5085/203307 [5:53:15<229:30:56,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5086/203307 [5:53:19<229:30:34,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5086/203307 [5:53:19<229:30:34,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5087/203307 [5:53:24<229:30:42,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5087/203307 [5:53:24<229:30:42,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5088/203307 [5:53:27<229:30:16,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5088/203307 [5:53:27<229:30:16,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5089/203307 [5:53:32<229:30:23,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5089/203307 [5:53:32<229:30:23,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5090/203307 [5:53:35<229:30:00,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5090/203307 [5:53:35<229:30:00,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5091/203307 [5:53:39<229:29:33,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5091/203307 [5:53:39<229:29:34,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5092/203307 [5:53:43<229:29:39,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5092/203307 [5:53:43<229:29:39,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5093/203307 [5:53:47<229:29:15,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5093/203307 [5:53:47<229:29:16,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5094/203307 [5:53:51<229:28:51,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5094/203307 [5:53:51<229:28:52,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5095/203307 [5:53:55<229:28:52,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5095/203307 [5:53:55<229:28:52,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5096/203307 [5:53:59<229:28:29,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5096/203307 [5:53:59<229:28:30,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5097/203307 [5:54:03<229:28:33,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5097/203307 [5:54:03<229:28:33,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5098/203307 [5:54:07<229:28:11,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5098/203307 [5:54:07<229:28:11,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5099/203307 [5:54:10<229:27:47,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5099/203307 [5:54:11<229:27:47,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5100/203307 [5:54:15<229:27:55,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5100/203307 [5:54:15<229:27:55,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5101/203307 [5:54:19<229:27:52,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   3%|▎         | 5101/203307 [5:54:19<229:27:52,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5102/203307 [5:54:23<229:27:32,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5102/203307 [5:54:23<229:27:32,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5103/203307 [5:54:27<229:27:35,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5103/203307 [5:54:27<229:27:35,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5104/203307 [5:54:31<229:27:16,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5104/203307 [5:54:31<229:27:16,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5105/203307 [5:54:35<229:26:58,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5105/203307 [5:54:35<229:26:58,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5106/203307 [5:54:39<229:27:05,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5106/203307 [5:54:39<229:27:05,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5107/203307 [5:54:43<229:26:45,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5107/203307 [5:54:43<229:26:45,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5108/203307 [5:54:47<229:26:25,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5108/203307 [5:54:47<229:26:26,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5109/203307 [5:54:51<229:26:34,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5109/203307 [5:54:51<229:26:34,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5110/203307 [5:54:55<229:26:24,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5110/203307 [5:54:55<229:26:24,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5111/203307 [5:54:59<229:26:04,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5111/203307 [5:54:59<229:26:04,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5112/203307 [5:55:04<229:26:09,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5112/203307 [5:55:04<229:26:09,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5113/203307 [5:55:07<229:25:47,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5113/203307 [5:55:07<229:25:47,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5114/203307 [5:55:11<229:25:26,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5114/203307 [5:55:11<229:25:27,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5115/203307 [5:55:16<229:25:36,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5115/203307 [5:55:16<229:25:36,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5116/203307 [5:55:19<229:25:12,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5116/203307 [5:55:19<229:25:12,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5117/203307 [5:55:24<229:25:16,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5117/203307 [5:55:24<229:25:16,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5118/203307 [5:55:27<229:24:54,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5118/203307 [5:55:27<229:24:54,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5119/203307 [5:55:31<229:24:48,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5119/203307 [5:55:31<229:24:49,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5120/203307 [5:55:36<229:24:50,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5120/203307 [5:55:36<229:24:50,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5121/203307 [5:55:39<229:24:30,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   3%|▎         | 5121/203307 [5:55:39<229:24:30,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5122/203307 [5:55:43<229:24:07,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5122/203307 [5:55:43<229:24:07,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5123/203307 [5:55:48<229:24:15,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5123/203307 [5:55:48<229:24:15,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5124/203307 [5:55:51<229:23:52,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5124/203307 [5:55:51<229:23:52,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5125/203307 [5:55:56<229:23:59,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5125/203307 [5:55:56<229:23:59,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5126/203307 [5:55:59<229:23:38,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5126/203307 [5:55:59<229:23:38,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5127/203307 [5:56:03<229:23:17,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5127/203307 [5:56:03<229:23:17,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5128/203307 [5:56:08<229:23:20,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5128/203307 [5:56:08<229:23:21,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5129/203307 [5:56:11<229:23:01,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5129/203307 [5:56:11<229:23:01,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5130/203307 [5:56:15<229:22:38,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5130/203307 [5:56:15<229:22:38,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5131/203307 [5:56:19<229:22:18,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5131/203307 [5:56:19<229:22:18,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5132/203307 [5:56:23<229:22:23,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5132/203307 [5:56:23<229:22:23,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5133/203307 [5:56:27<229:22:01,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5133/203307 [5:56:27<229:22:02,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5134/203307 [5:56:31<229:22:09,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5134/203307 [5:56:31<229:22:09,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5135/203307 [5:56:35<229:21:45,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5135/203307 [5:56:35<229:21:45,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5136/203307 [5:56:39<229:21:25,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5136/203307 [5:56:39<229:21:25,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5137/203307 [5:56:43<229:21:25,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5137/203307 [5:56:43<229:21:25,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5138/203307 [5:56:47<229:21:02,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5138/203307 [5:56:47<229:21:02,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5139/203307 [5:56:50<229:20:39,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5139/203307 [5:56:50<229:20:39,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5140/203307 [5:56:54<229:20:18,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5140/203307 [5:56:54<229:20:18,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5141/203307 [5:56:59<229:20:24,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5141/203307 [5:56:59<229:20:24,  0.24it/s, v_num=t5e6, training/loss=0.101] Epoch 0:   3%|▎         | 5142/203307 [5:57:03<229:20:30,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5142/203307 [5:57:03<229:20:30,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5143/203307 [5:57:07<229:20:07,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5143/203307 [5:57:07<229:20:07,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5144/203307 [5:57:10<229:19:42,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5144/203307 [5:57:10<229:19:43,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5145/203307 [5:57:15<229:19:43,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5145/203307 [5:57:15<229:19:43,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5146/203307 [5:57:19<229:19:38,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5146/203307 [5:57:19<229:19:38,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5147/203307 [5:57:22<229:19:15,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5147/203307 [5:57:22<229:19:15,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5148/203307 [5:57:26<229:18:50,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5148/203307 [5:57:26<229:18:50,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5149/203307 [5:57:30<229:18:54,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5149/203307 [5:57:30<229:18:55,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5150/203307 [5:57:35<229:19:08,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5150/203307 [5:57:35<229:19:08,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5151/203307 [5:57:39<229:18:46,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5151/203307 [5:57:39<229:18:46,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5152/203307 [5:57:42<229:18:23,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5152/203307 [5:57:42<229:18:23,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5153/203307 [5:57:47<229:18:22,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5153/203307 [5:57:47<229:18:23,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5154/203307 [5:57:50<229:17:59,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5154/203307 [5:57:50<229:17:59,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5155/203307 [5:57:55<229:17:54,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5155/203307 [5:57:55<229:17:54,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5156/203307 [5:57:58<229:17:29,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5156/203307 [5:57:58<229:17:29,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5157/203307 [5:58:02<229:17:08,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5157/203307 [5:58:02<229:17:08,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5158/203307 [5:58:06<229:17:11,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5158/203307 [5:58:06<229:17:11,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5159/203307 [5:58:11<229:17:15,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5159/203307 [5:58:11<229:17:15,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5160/203307 [5:58:14<229:16:53,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5160/203307 [5:58:14<229:16:53,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5161/203307 [5:58:18<229:16:33,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5161/203307 [5:58:18<229:16:33,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5162/203307 [5:58:22<229:16:34,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5162/203307 [5:58:22<229:16:34,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5163/203307 [5:58:26<229:16:09,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5163/203307 [5:58:26<229:16:09,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5164/203307 [5:58:30<229:16:05,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5164/203307 [5:58:30<229:16:05,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5165/203307 [5:58:34<229:15:44,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5165/203307 [5:58:34<229:15:44,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5166/203307 [5:58:38<229:15:22,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5166/203307 [5:58:38<229:15:23,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5167/203307 [5:58:42<229:15:29,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5167/203307 [5:58:42<229:15:29,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5168/203307 [5:58:46<229:15:06,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5168/203307 [5:58:46<229:15:07,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5169/203307 [5:58:49<229:14:44,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5169/203307 [5:58:49<229:14:44,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5170/203307 [5:58:54<229:14:58,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5170/203307 [5:58:54<229:14:58,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5171/203307 [5:58:58<229:14:35,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5171/203307 [5:58:58<229:14:35,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5172/203307 [5:59:01<229:14:12,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5172/203307 [5:59:01<229:14:12,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5173/203307 [5:59:06<229:14:13,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5173/203307 [5:59:06<229:14:13,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5174/203307 [5:59:09<229:13:51,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5174/203307 [5:59:09<229:13:51,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5175/203307 [5:59:14<229:13:55,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5175/203307 [5:59:14<229:13:55,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5176/203307 [5:59:18<229:13:39,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5176/203307 [5:59:18<229:13:39,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5177/203307 [5:59:21<229:13:22,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5177/203307 [5:59:21<229:13:23,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5178/203307 [5:59:26<229:13:26,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5178/203307 [5:59:26<229:13:26,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5179/203307 [5:59:30<229:13:07,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5179/203307 [5:59:30<229:13:07,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5180/203307 [5:59:33<229:12:47,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5180/203307 [5:59:33<229:12:47,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5181/203307 [5:59:37<229:12:27,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5181/203307 [5:59:37<229:12:27,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5182/203307 [5:59:41<229:12:25,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5182/203307 [5:59:41<229:12:25,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5183/203307 [5:59:45<229:12:05,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5183/203307 [5:59:45<229:12:05,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5184/203307 [5:59:50<229:12:13,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5184/203307 [5:59:50<229:12:13,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5185/203307 [5:59:53<229:11:50,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5185/203307 [5:59:53<229:11:50,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5186/203307 [5:59:57<229:11:32,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5186/203307 [5:59:57<229:11:32,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5187/203307 [6:00:01<229:11:37,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5187/203307 [6:00:01<229:11:37,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5188/203307 [6:00:05<229:11:17,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5188/203307 [6:00:05<229:11:17,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5189/203307 [6:00:09<229:11:00,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5189/203307 [6:00:09<229:11:00,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5190/203307 [6:00:13<229:10:38,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5190/203307 [6:00:13<229:10:39,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5191/203307 [6:00:17<229:10:34,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5191/203307 [6:00:17<229:10:35,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5192/203307 [6:00:21<229:10:42,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5192/203307 [6:00:21<229:10:42,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5193/203307 [6:00:26<229:10:47,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5193/203307 [6:00:26<229:10:47,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5194/203307 [6:00:30<229:10:26,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5194/203307 [6:00:30<229:10:26,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5195/203307 [6:00:34<229:10:29,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5195/203307 [6:00:34<229:10:29,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5196/203307 [6:00:38<229:10:10,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5196/203307 [6:00:38<229:10:10,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5197/203307 [6:00:41<229:09:48,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5197/203307 [6:00:41<229:09:48,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5198/203307 [6:00:45<229:09:28,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5198/203307 [6:00:45<229:09:29,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5199/203307 [6:00:49<229:09:09,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5199/203307 [6:00:49<229:09:09,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5200/203307 [6:00:53<229:09:17,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5200/203307 [6:00:53<229:09:17,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5201/203307 [6:00:58<229:09:25,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5201/203307 [6:00:58<229:09:25,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5202/203307 [6:01:02<229:09:06,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5202/203307 [6:01:02<229:09:07,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5203/203307 [6:01:06<229:09:09,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5203/203307 [6:01:06<229:09:09,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5204/203307 [6:01:10<229:08:47,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5204/203307 [6:01:10<229:08:48,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5205/203307 [6:01:13<229:08:28,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5205/203307 [6:01:13<229:08:28,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5206/203307 [6:01:17<229:08:11,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5206/203307 [6:01:17<229:08:11,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5207/203307 [6:01:21<229:07:54,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5207/203307 [6:01:21<229:07:55,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5208/203307 [6:01:25<229:07:34,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5208/203307 [6:01:25<229:07:35,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5209/203307 [6:01:29<229:07:45,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5209/203307 [6:01:29<229:07:45,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5210/203307 [6:01:34<229:07:53,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5210/203307 [6:01:34<229:07:53,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5211/203307 [6:01:38<229:07:31,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5211/203307 [6:01:38<229:07:31,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5212/203307 [6:01:42<229:07:31,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5212/203307 [6:01:42<229:07:31,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5213/203307 [6:01:46<229:07:11,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5213/203307 [6:01:46<229:07:11,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5214/203307 [6:01:49<229:06:52,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5214/203307 [6:01:49<229:06:52,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5215/203307 [6:01:53<229:06:32,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5215/203307 [6:01:53<229:06:32,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5216/203307 [6:01:57<229:06:11,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5216/203307 [6:01:57<229:06:11,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5217/203307 [6:02:01<229:06:17,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5217/203307 [6:02:01<229:06:17,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5218/203307 [6:02:06<229:06:17,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5218/203307 [6:02:06<229:06:17,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5219/203307 [6:02:10<229:06:21,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5219/203307 [6:02:10<229:06:21,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5220/203307 [6:02:14<229:06:21,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5220/203307 [6:02:14<229:06:21,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5221/203307 [6:02:18<229:06:04,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   3%|▎         | 5221/203307 [6:02:18<229:06:04,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5222/203307 [6:02:22<229:05:46,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5222/203307 [6:02:22<229:05:46,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5223/203307 [6:02:26<229:05:28,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5223/203307 [6:02:26<229:05:28,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5224/203307 [6:02:29<229:05:08,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5224/203307 [6:02:29<229:05:09,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5225/203307 [6:02:34<229:05:17,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5225/203307 [6:02:34<229:05:17,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5226/203307 [6:02:38<229:04:59,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5226/203307 [6:02:38<229:04:59,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5227/203307 [6:02:42<229:05:04,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5227/203307 [6:02:42<229:05:04,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5228/203307 [6:02:46<229:05:06,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5228/203307 [6:02:46<229:05:06,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5229/203307 [6:02:50<229:04:46,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5229/203307 [6:02:50<229:04:46,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5230/203307 [6:02:54<229:04:27,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5230/203307 [6:02:54<229:04:27,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5231/203307 [6:02:58<229:04:09,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5231/203307 [6:02:58<229:04:09,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5232/203307 [6:03:01<229:03:47,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5232/203307 [6:03:01<229:03:47,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5233/203307 [6:03:05<229:03:27,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5233/203307 [6:03:05<229:03:27,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5234/203307 [6:03:10<229:03:35,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5234/203307 [6:03:10<229:03:36,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5235/203307 [6:03:14<229:03:22,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5235/203307 [6:03:14<229:03:22,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5236/203307 [6:03:18<229:03:28,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5236/203307 [6:03:18<229:03:28,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5237/203307 [6:03:22<229:03:27,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5237/203307 [6:03:22<229:03:28,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5238/203307 [6:03:26<229:03:04,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5238/203307 [6:03:26<229:03:04,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5239/203307 [6:03:30<229:02:41,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5239/203307 [6:03:30<229:02:41,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5240/203307 [6:03:33<229:02:24,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5240/203307 [6:03:33<229:02:24,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5241/203307 [6:03:37<229:02:01,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   3%|▎         | 5241/203307 [6:03:37<229:02:01,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5242/203307 [6:03:42<229:02:08,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5242/203307 [6:03:42<229:02:08,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5243/203307 [6:03:45<229:01:45,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5243/203307 [6:03:45<229:01:45,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5244/203307 [6:03:49<229:01:22,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5244/203307 [6:03:49<229:01:22,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5245/203307 [6:03:53<229:01:27,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5245/203307 [6:03:53<229:01:27,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5246/203307 [6:03:57<229:01:06,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5246/203307 [6:03:57<229:01:06,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5247/203307 [6:04:01<229:00:43,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5247/203307 [6:04:01<229:00:43,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5248/203307 [6:04:04<229:00:21,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5248/203307 [6:04:04<229:00:21,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5249/203307 [6:04:08<228:59:58,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5249/203307 [6:04:08<228:59:58,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5250/203307 [6:04:12<229:00:06,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5250/203307 [6:04:12<229:00:06,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5251/203307 [6:04:16<228:59:44,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5251/203307 [6:04:16<228:59:44,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5252/203307 [6:04:20<228:59:24,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5252/203307 [6:04:20<228:59:25,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5253/203307 [6:04:24<228:59:34,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5253/203307 [6:04:24<228:59:34,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5254/203307 [6:04:29<228:59:34,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5254/203307 [6:04:29<228:59:34,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5255/203307 [6:04:33<228:59:20,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5255/203307 [6:04:33<228:59:20,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5256/203307 [6:04:36<228:59:02,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5256/203307 [6:04:36<228:59:02,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5257/203307 [6:04:40<228:58:44,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5257/203307 [6:04:40<228:58:44,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5258/203307 [6:04:44<228:58:24,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5258/203307 [6:04:44<228:58:24,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5259/203307 [6:04:48<228:58:31,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5259/203307 [6:04:48<228:58:31,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5260/203307 [6:04:52<228:58:11,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5260/203307 [6:04:52<228:58:11,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5261/203307 [6:04:56<228:57:52,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   3%|▎         | 5261/203307 [6:04:56<228:57:52,  0.24it/s, v_num=t5e6, training/loss=0.101] Epoch 0:   3%|▎         | 5262/203307 [6:05:00<228:57:55,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5262/203307 [6:05:00<228:57:55,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5263/203307 [6:05:04<228:57:53,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5263/203307 [6:05:05<228:57:54,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5264/203307 [6:05:08<228:57:34,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5264/203307 [6:05:08<228:57:35,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5265/203307 [6:05:12<228:57:13,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5265/203307 [6:05:12<228:57:13,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5266/203307 [6:05:16<228:56:52,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5266/203307 [6:05:16<228:56:52,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5267/203307 [6:05:20<228:57:01,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5267/203307 [6:05:20<228:57:01,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5268/203307 [6:05:24<228:56:43,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5268/203307 [6:05:24<228:56:43,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5269/203307 [6:05:28<228:56:22,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5269/203307 [6:05:28<228:56:23,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5270/203307 [6:05:32<228:56:24,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5270/203307 [6:05:32<228:56:24,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5271/203307 [6:05:36<228:56:29,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5271/203307 [6:05:36<228:56:30,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5272/203307 [6:05:41<228:56:27,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5272/203307 [6:05:41<228:56:27,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5273/203307 [6:05:44<228:56:07,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5273/203307 [6:05:44<228:56:07,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5274/203307 [6:05:48<228:55:46,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5274/203307 [6:05:48<228:55:46,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5275/203307 [6:05:53<228:55:53,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5275/203307 [6:05:53<228:55:53,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5276/203307 [6:05:56<228:55:32,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5276/203307 [6:05:56<228:55:32,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5277/203307 [6:06:00<228:55:11,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5277/203307 [6:06:00<228:55:11,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5278/203307 [6:06:04<228:55:09,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5278/203307 [6:06:04<228:55:09,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5279/203307 [6:06:09<228:55:12,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5279/203307 [6:06:09<228:55:13,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5280/203307 [6:06:12<228:54:52,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5280/203307 [6:06:12<228:54:52,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5281/203307 [6:06:17<228:54:50,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5281/203307 [6:06:17<228:54:50,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5282/203307 [6:06:20<228:54:32,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5282/203307 [6:06:20<228:54:32,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5283/203307 [6:06:24<228:54:12,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5283/203307 [6:06:24<228:54:12,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5284/203307 [6:06:29<228:54:20,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5284/203307 [6:06:29<228:54:20,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5285/203307 [6:06:32<228:53:59,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5285/203307 [6:06:32<228:53:59,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5286/203307 [6:06:36<228:53:41,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5286/203307 [6:06:36<228:53:41,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5287/203307 [6:06:41<228:53:49,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5287/203307 [6:06:41<228:53:49,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5288/203307 [6:06:45<228:53:54,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5288/203307 [6:06:45<228:53:54,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5289/203307 [6:06:49<228:53:33,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5289/203307 [6:06:49<228:53:33,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5290/203307 [6:06:53<228:53:27,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5290/203307 [6:06:53<228:53:27,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5291/203307 [6:06:56<228:53:07,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5291/203307 [6:06:57<228:53:07,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5292/203307 [6:07:01<228:53:13,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5292/203307 [6:07:01<228:53:13,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5293/203307 [6:07:05<228:52:56,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5293/203307 [6:07:05<228:52:56,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5294/203307 [6:07:08<228:52:34,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5294/203307 [6:07:08<228:52:35,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5295/203307 [6:07:13<228:52:37,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5295/203307 [6:07:13<228:52:37,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5296/203307 [6:07:17<228:52:19,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5296/203307 [6:07:17<228:52:19,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5297/203307 [6:07:21<228:52:25,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5297/203307 [6:07:21<228:52:26,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5298/203307 [6:07:25<228:52:06,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5298/203307 [6:07:25<228:52:06,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5299/203307 [6:07:29<228:51:59,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5299/203307 [6:07:29<228:51:59,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5300/203307 [6:07:33<228:52:06,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5300/203307 [6:07:33<228:52:06,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5301/203307 [6:07:37<228:51:47,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   3%|▎         | 5301/203307 [6:07:37<228:51:47,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5302/203307 [6:07:41<228:51:23,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5302/203307 [6:07:41<228:51:23,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5303/203307 [6:07:45<228:51:28,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5303/203307 [6:07:45<228:51:28,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5304/203307 [6:07:49<228:51:05,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5304/203307 [6:07:49<228:51:05,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5305/203307 [6:07:53<228:51:06,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5305/203307 [6:07:53<228:51:06,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5306/203307 [6:07:57<228:50:43,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5306/203307 [6:07:57<228:50:43,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5307/203307 [6:08:00<228:50:18,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5307/203307 [6:08:00<228:50:19,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5308/203307 [6:08:05<228:50:17,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5308/203307 [6:08:05<228:50:17,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5309/203307 [6:08:09<228:50:22,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5309/203307 [6:08:09<228:50:22,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5310/203307 [6:08:13<228:49:58,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5310/203307 [6:08:13<228:49:59,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5311/203307 [6:08:16<228:49:39,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5311/203307 [6:08:16<228:49:39,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5312/203307 [6:08:21<228:49:43,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5312/203307 [6:08:21<228:49:43,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5313/203307 [6:08:24<228:49:22,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5313/203307 [6:08:24<228:49:23,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5314/203307 [6:08:29<228:49:27,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5314/203307 [6:08:29<228:49:28,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5315/203307 [6:08:33<228:49:12,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5315/203307 [6:08:33<228:49:12,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5316/203307 [6:08:36<228:48:51,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5316/203307 [6:08:36<228:48:51,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5317/203307 [6:08:41<228:48:57,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5317/203307 [6:08:41<228:48:57,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5318/203307 [6:08:45<228:48:39,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5318/203307 [6:08:45<228:48:40,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5319/203307 [6:08:48<228:48:19,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5319/203307 [6:08:48<228:48:19,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5320/203307 [6:08:53<228:48:19,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5320/203307 [6:08:53<228:48:20,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5321/203307 [6:08:56<228:47:57,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   3%|▎         | 5321/203307 [6:08:56<228:47:57,  0.24it/s, v_num=t5e6, training/loss=0.100] Epoch 0:   3%|▎         | 5322/203307 [6:09:00<228:47:36,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5322/203307 [6:09:00<228:47:36,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5323/203307 [6:09:04<228:47:42,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5323/203307 [6:09:04<228:47:42,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5324/203307 [6:09:08<228:47:21,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5324/203307 [6:09:08<228:47:21,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5325/203307 [6:09:13<228:47:27,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5325/203307 [6:09:13<228:47:27,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5326/203307 [6:09:17<228:47:22,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5326/203307 [6:09:17<228:47:22,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5327/203307 [6:09:21<228:47:04,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5327/203307 [6:09:21<228:47:04,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5328/203307 [6:09:25<228:47:08,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5328/203307 [6:09:25<228:47:08,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5329/203307 [6:09:29<228:46:52,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5329/203307 [6:09:29<228:46:52,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5330/203307 [6:09:33<228:46:34,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5330/203307 [6:09:33<228:46:34,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5331/203307 [6:09:37<228:46:40,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5331/203307 [6:09:37<228:46:41,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5332/203307 [6:09:41<228:46:23,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5332/203307 [6:09:41<228:46:24,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5333/203307 [6:09:45<228:46:03,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5333/203307 [6:09:45<228:46:04,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5334/203307 [6:09:49<228:46:14,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5334/203307 [6:09:49<228:46:14,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5335/203307 [6:09:53<228:46:10,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5335/203307 [6:09:53<228:46:10,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5336/203307 [6:09:57<228:45:52,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5336/203307 [6:09:57<228:45:52,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5337/203307 [6:10:01<228:45:56,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5337/203307 [6:10:01<228:45:57,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5338/203307 [6:10:05<228:45:37,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5338/203307 [6:10:05<228:45:37,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5339/203307 [6:10:09<228:45:17,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5339/203307 [6:10:09<228:45:18,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5340/203307 [6:10:13<228:45:26,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5340/203307 [6:10:13<228:45:26,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5341/203307 [6:10:17<228:45:06,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 5341/203307 [6:10:17<228:45:06,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5342/203307 [6:10:22<228:45:10,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5342/203307 [6:10:22<228:45:10,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5343/203307 [6:10:25<228:44:51,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5343/203307 [6:10:25<228:44:51,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5344/203307 [6:10:30<228:44:49,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5344/203307 [6:10:30<228:44:50,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5345/203307 [6:10:34<228:44:51,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5345/203307 [6:10:34<228:44:51,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5346/203307 [6:10:38<228:44:31,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5346/203307 [6:10:38<228:44:31,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5347/203307 [6:10:41<228:44:07,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5347/203307 [6:10:41<228:44:07,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5348/203307 [6:10:45<228:43:46,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5348/203307 [6:10:45<228:43:46,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5349/203307 [6:10:49<228:43:53,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5349/203307 [6:10:49<228:43:53,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5350/203307 [6:10:54<228:43:57,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5350/203307 [6:10:54<228:43:57,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5351/203307 [6:10:58<228:43:39,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5351/203307 [6:10:58<228:43:39,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5352/203307 [6:11:01<228:43:19,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5352/203307 [6:11:01<228:43:19,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5353/203307 [6:11:06<228:43:22,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5353/203307 [6:11:06<228:43:22,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5354/203307 [6:11:09<228:43:03,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5354/203307 [6:11:09<228:43:03,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5355/203307 [6:11:13<228:42:43,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5355/203307 [6:11:13<228:42:43,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5356/203307 [6:11:17<228:42:21,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5356/203307 [6:11:17<228:42:22,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5357/203307 [6:11:21<228:42:28,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5357/203307 [6:11:21<228:42:28,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5358/203307 [6:11:25<228:42:07,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5358/203307 [6:11:25<228:42:07,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5359/203307 [6:11:29<228:42:15,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5359/203307 [6:11:29<228:42:15,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5360/203307 [6:11:33<228:41:54,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5360/203307 [6:11:33<228:41:54,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5361/203307 [6:11:37<228:41:32,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   3%|▎         | 5361/203307 [6:11:37<228:41:32,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5362/203307 [6:11:41<228:41:36,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5362/203307 [6:11:41<228:41:36,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5363/203307 [6:11:45<228:41:14,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5363/203307 [6:11:45<228:41:14,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5364/203307 [6:11:49<228:40:53,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5364/203307 [6:11:49<228:40:53,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5365/203307 [6:11:52<228:40:32,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5365/203307 [6:11:52<228:40:32,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5366/203307 [6:11:57<228:40:40,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5366/203307 [6:11:57<228:40:41,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5367/203307 [6:12:01<228:40:46,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5367/203307 [6:12:01<228:40:46,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5368/203307 [6:12:05<228:40:23,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5368/203307 [6:12:05<228:40:23,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5369/203307 [6:12:09<228:40:02,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5369/203307 [6:12:09<228:40:02,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5370/203307 [6:12:13<228:40:06,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5370/203307 [6:12:13<228:40:06,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5371/203307 [6:12:17<228:40:04,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5371/203307 [6:12:17<228:40:04,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5372/203307 [6:12:21<228:39:44,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5372/203307 [6:12:21<228:39:44,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5373/203307 [6:12:25<228:39:27,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5373/203307 [6:12:25<228:39:27,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5374/203307 [6:12:28<228:39:06,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5374/203307 [6:12:28<228:39:06,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5375/203307 [6:12:33<228:39:23,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5375/203307 [6:12:33<228:39:24,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5376/203307 [6:12:37<228:39:08,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5376/203307 [6:12:37<228:39:09,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5377/203307 [6:12:41<228:38:50,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5377/203307 [6:12:41<228:38:51,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5378/203307 [6:12:45<228:38:56,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5378/203307 [6:12:45<228:38:56,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5379/203307 [6:12:49<228:38:41,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5379/203307 [6:12:49<228:38:41,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5380/203307 [6:12:53<228:38:39,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5380/203307 [6:12:53<228:38:40,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5381/203307 [6:12:57<228:38:25,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   3%|▎         | 5381/203307 [6:12:57<228:38:25,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5382/203307 [6:13:01<228:38:05,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5382/203307 [6:13:01<228:38:05,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5383/203307 [6:13:05<228:38:16,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5383/203307 [6:13:06<228:38:16,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5384/203307 [6:13:10<228:38:27,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5384/203307 [6:13:10<228:38:27,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5385/203307 [6:13:14<228:38:10,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5385/203307 [6:13:14<228:38:10,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5386/203307 [6:13:18<228:37:53,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5386/203307 [6:13:18<228:37:53,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5387/203307 [6:13:22<228:37:58,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5387/203307 [6:13:22<228:37:58,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5388/203307 [6:13:26<228:37:39,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5388/203307 [6:13:26<228:37:40,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5389/203307 [6:13:30<228:37:37,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5389/203307 [6:13:30<228:37:37,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5390/203307 [6:13:34<228:37:19,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5390/203307 [6:13:34<228:37:19,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5391/203307 [6:13:38<228:36:57,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5391/203307 [6:13:38<228:36:57,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5392/203307 [6:13:42<228:37:07,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5392/203307 [6:13:42<228:37:07,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5393/203307 [6:13:46<228:36:49,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5393/203307 [6:13:46<228:36:49,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5394/203307 [6:13:50<228:36:30,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5394/203307 [6:13:50<228:36:31,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5395/203307 [6:13:54<228:36:34,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5395/203307 [6:13:54<228:36:34,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5396/203307 [6:13:58<228:36:16,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5396/203307 [6:13:58<228:36:16,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5397/203307 [6:14:01<228:35:55,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5397/203307 [6:14:01<228:35:55,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5398/203307 [6:14:06<228:35:55,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5398/203307 [6:14:06<228:35:56,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5399/203307 [6:14:10<228:35:36,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5399/203307 [6:14:10<228:35:37,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5400/203307 [6:14:14<228:35:47,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5400/203307 [6:14:14<228:35:48,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5401/203307 [6:14:19<228:35:54,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 5401/203307 [6:14:19<228:35:54,  0.24it/s, v_num=t5e6, training/loss=0.103] Epoch 0:   3%|▎         | 5402/203307 [6:14:22<228:35:37,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5402/203307 [6:14:22<228:35:37,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5403/203307 [6:14:27<228:35:37,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5403/203307 [6:14:27<228:35:37,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5404/203307 [6:14:30<228:35:17,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5404/203307 [6:14:30<228:35:17,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5405/203307 [6:14:34<228:34:55,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5405/203307 [6:14:34<228:34:55,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5406/203307 [6:14:38<228:34:36,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5406/203307 [6:14:38<228:34:36,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5407/203307 [6:14:42<228:34:33,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5407/203307 [6:14:42<228:34:33,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5408/203307 [6:14:46<228:34:14,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5408/203307 [6:14:46<228:34:14,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5409/203307 [6:14:50<228:34:22,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5409/203307 [6:14:50<228:34:22,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5410/203307 [6:14:54<228:34:02,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5410/203307 [6:14:54<228:34:02,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5411/203307 [6:14:58<228:33:40,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5411/203307 [6:14:58<228:33:40,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5412/203307 [6:15:02<228:33:44,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5412/203307 [6:15:02<228:33:45,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5413/203307 [6:15:06<228:33:23,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5413/203307 [6:15:06<228:33:23,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5414/203307 [6:15:09<228:33:01,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5414/203307 [6:15:09<228:33:01,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5415/203307 [6:15:13<228:32:41,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5415/203307 [6:15:13<228:32:41,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5416/203307 [6:15:17<228:32:40,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5416/203307 [6:15:17<228:32:40,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5417/203307 [6:15:22<228:32:49,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5417/203307 [6:15:22<228:32:50,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5418/203307 [6:15:26<228:33:00,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5418/203307 [6:15:26<228:33:00,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5419/203307 [6:15:30<228:32:40,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5419/203307 [6:15:30<228:32:40,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5420/203307 [6:15:34<228:32:40,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5420/203307 [6:15:34<228:32:40,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5421/203307 [6:15:38<228:32:20,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 5421/203307 [6:15:38<228:32:21,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5422/203307 [6:15:42<228:32:00,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5422/203307 [6:15:42<228:32:00,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5423/203307 [6:15:46<228:31:40,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5423/203307 [6:15:46<228:31:40,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5424/203307 [6:15:50<228:31:29,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5424/203307 [6:15:50<228:31:29,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5425/203307 [6:15:54<228:31:35,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5425/203307 [6:15:54<228:31:35,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5426/203307 [6:15:58<228:31:17,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5426/203307 [6:15:58<228:31:17,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5427/203307 [6:16:02<228:31:20,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5427/203307 [6:16:02<228:31:20,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5428/203307 [6:16:06<228:31:22,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5428/203307 [6:16:06<228:31:23,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5429/203307 [6:16:10<228:31:02,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5429/203307 [6:16:10<228:31:02,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5430/203307 [6:16:14<228:30:43,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5430/203307 [6:16:14<228:30:43,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5431/203307 [6:16:18<228:30:25,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5431/203307 [6:16:18<228:30:25,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5432/203307 [6:16:21<228:30:08,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5432/203307 [6:16:21<228:30:08,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5433/203307 [6:16:25<228:29:49,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5433/203307 [6:16:25<228:29:49,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5434/203307 [6:16:30<228:29:59,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5434/203307 [6:16:30<228:29:59,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5435/203307 [6:16:34<228:29:58,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5435/203307 [6:16:34<228:29:59,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5436/203307 [6:16:38<228:29:37,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5436/203307 [6:16:38<228:29:37,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5437/203307 [6:16:42<228:29:38,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5437/203307 [6:16:42<228:29:38,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5438/203307 [6:16:46<228:29:15,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5438/203307 [6:16:46<228:29:15,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5439/203307 [6:16:49<228:28:56,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5439/203307 [6:16:49<228:28:56,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5440/203307 [6:16:53<228:28:34,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5440/203307 [6:16:53<228:28:34,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5441/203307 [6:16:57<228:28:11,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 5441/203307 [6:16:57<228:28:11,  0.24it/s, v_num=t5e6, training/loss=0.101] Epoch 0:   3%|▎         | 5442/203307 [6:17:01<228:28:17,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5442/203307 [6:17:01<228:28:17,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5443/203307 [6:17:05<228:28:13,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5443/203307 [6:17:05<228:28:13,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5444/203307 [6:17:10<228:28:16,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5444/203307 [6:17:10<228:28:16,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5445/203307 [6:17:14<228:28:13,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5445/203307 [6:17:14<228:28:14,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5446/203307 [6:17:18<228:27:53,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5446/203307 [6:17:18<228:27:53,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5447/203307 [6:17:21<228:27:33,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5447/203307 [6:17:21<228:27:33,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5448/203307 [6:17:25<228:27:14,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5448/203307 [6:17:25<228:27:14,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5449/203307 [6:17:29<228:26:56,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5449/203307 [6:17:29<228:26:56,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5450/203307 [6:17:33<228:27:03,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5450/203307 [6:17:33<228:27:04,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5451/203307 [6:17:37<228:26:42,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5451/203307 [6:17:37<228:26:42,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5452/203307 [6:17:41<228:26:39,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5452/203307 [6:17:41<228:26:39,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5453/203307 [6:17:46<228:26:47,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5453/203307 [6:17:46<228:26:47,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5454/203307 [6:17:49<228:26:25,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5454/203307 [6:17:49<228:26:25,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5455/203307 [6:17:53<228:26:06,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5455/203307 [6:17:53<228:26:06,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5456/203307 [6:17:57<228:25:49,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5456/203307 [6:17:57<228:25:50,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5457/203307 [6:18:01<228:25:30,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5457/203307 [6:18:01<228:25:30,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5458/203307 [6:18:04<228:25:13,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5458/203307 [6:18:04<228:25:13,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5459/203307 [6:18:09<228:25:22,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5459/203307 [6:18:09<228:25:22,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5460/203307 [6:18:13<228:25:02,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5460/203307 [6:18:13<228:25:02,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5461/203307 [6:18:17<228:25:08,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 5461/203307 [6:18:17<228:25:08,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5462/203307 [6:18:21<228:25:10,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5462/203307 [6:18:21<228:25:10,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5463/203307 [6:18:25<228:24:50,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5463/203307 [6:18:25<228:24:50,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5464/203307 [6:18:29<228:24:30,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5464/203307 [6:18:29<228:24:30,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5465/203307 [6:18:33<228:24:09,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5465/203307 [6:18:33<228:24:09,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5466/203307 [6:18:36<228:23:49,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5466/203307 [6:18:36<228:23:49,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5467/203307 [6:18:41<228:24:00,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5467/203307 [6:18:41<228:24:00,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5468/203307 [6:18:45<228:23:40,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5468/203307 [6:18:45<228:23:40,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5469/203307 [6:18:48<228:23:17,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5469/203307 [6:18:48<228:23:18,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5470/203307 [6:18:53<228:23:26,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5470/203307 [6:18:53<228:23:27,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5471/203307 [6:18:56<228:23:09,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5471/203307 [6:18:56<228:23:09,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5472/203307 [6:19:00<228:22:48,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5472/203307 [6:19:00<228:22:49,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5473/203307 [6:19:04<228:22:31,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5473/203307 [6:19:04<228:22:31,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5474/203307 [6:19:08<228:22:12,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5474/203307 [6:19:08<228:22:12,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5475/203307 [6:19:12<228:22:20,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5475/203307 [6:19:12<228:22:21,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5476/203307 [6:19:16<228:22:00,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5476/203307 [6:19:16<228:22:00,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5477/203307 [6:19:20<228:21:39,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5477/203307 [6:19:20<228:21:39,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5478/203307 [6:19:24<228:21:42,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5478/203307 [6:19:24<228:21:42,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5479/203307 [6:19:28<228:21:46,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5479/203307 [6:19:28<228:21:46,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5480/203307 [6:19:32<228:21:23,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5480/203307 [6:19:32<228:21:24,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5481/203307 [6:19:36<228:21:03,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5481/203307 [6:19:36<228:21:03,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5482/203307 [6:19:39<228:20:42,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5482/203307 [6:19:39<228:20:42,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5483/203307 [6:19:43<228:20:25,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5483/203307 [6:19:43<228:20:25,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5484/203307 [6:19:48<228:20:31,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5484/203307 [6:19:48<228:20:31,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5485/203307 [6:19:51<228:20:10,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5485/203307 [6:19:51<228:20:10,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5486/203307 [6:19:55<228:19:46,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5486/203307 [6:19:55<228:19:47,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5487/203307 [6:19:59<228:19:53,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5487/203307 [6:19:59<228:19:53,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5488/203307 [6:20:04<228:19:48,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5488/203307 [6:20:04<228:19:48,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5489/203307 [6:20:07<228:19:30,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5489/203307 [6:20:07<228:19:30,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5490/203307 [6:20:11<228:19:08,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5490/203307 [6:20:11<228:19:08,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5491/203307 [6:20:15<228:18:47,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5491/203307 [6:20:15<228:18:47,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5492/203307 [6:20:19<228:18:53,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5492/203307 [6:20:19<228:18:53,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5493/203307 [6:20:23<228:18:34,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5493/203307 [6:20:23<228:18:34,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5494/203307 [6:20:27<228:18:12,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5494/203307 [6:20:27<228:18:12,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5495/203307 [6:20:31<228:18:14,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5495/203307 [6:20:31<228:18:14,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5496/203307 [6:20:35<228:18:19,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5496/203307 [6:20:35<228:18:19,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5497/203307 [6:20:39<228:18:16,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5497/203307 [6:20:39<228:18:16,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5498/203307 [6:20:43<228:17:54,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5498/203307 [6:20:43<228:17:54,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5499/203307 [6:20:47<228:17:33,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5499/203307 [6:20:47<228:17:33,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5500/203307 [6:20:51<228:17:40,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5500/203307 [6:20:51<228:17:40,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5501/203307 [6:20:55<228:17:20,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   3%|▎         | 5501/203307 [6:20:55<228:17:20,  0.24it/s, v_num=t5e6, training/loss=0.104] Epoch 0:   3%|▎         | 5502/203307 [6:20:59<228:17:00,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5502/203307 [6:20:59<228:17:00,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5503/203307 [6:21:03<228:16:59,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5503/203307 [6:21:03<228:17:00,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5504/203307 [6:21:07<228:16:42,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5504/203307 [6:21:07<228:16:42,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5505/203307 [6:21:11<228:16:47,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5505/203307 [6:21:11<228:16:47,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5506/203307 [6:21:15<228:16:46,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5506/203307 [6:21:15<228:16:46,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5507/203307 [6:21:19<228:16:24,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5507/203307 [6:21:19<228:16:25,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5508/203307 [6:21:23<228:16:05,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5508/203307 [6:21:23<228:16:06,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5509/203307 [6:21:27<228:16:12,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5509/203307 [6:21:27<228:16:12,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5510/203307 [6:21:31<228:15:50,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5510/203307 [6:21:31<228:15:50,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5511/203307 [6:21:35<228:15:29,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5511/203307 [6:21:35<228:15:29,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5512/203307 [6:21:39<228:15:31,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5512/203307 [6:21:39<228:15:31,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5513/203307 [6:21:43<228:15:34,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5513/203307 [6:21:43<228:15:34,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5514/203307 [6:21:47<228:15:12,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5514/203307 [6:21:47<228:15:12,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5515/203307 [6:21:51<228:15:08,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5515/203307 [6:21:51<228:15:08,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5516/203307 [6:21:55<228:14:46,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5516/203307 [6:21:55<228:14:47,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5517/203307 [6:21:59<228:14:50,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5517/203307 [6:21:59<228:14:50,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5518/203307 [6:22:03<228:14:30,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5518/203307 [6:22:03<228:14:31,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5519/203307 [6:22:06<228:14:08,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5519/203307 [6:22:06<228:14:08,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5520/203307 [6:22:11<228:14:08,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5520/203307 [6:22:11<228:14:08,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5521/203307 [6:22:14<228:13:49,  0.24it/s, v_num=t5e6, training/loss=0.104]Epoch 0:   3%|▎         | 5521/203307 [6:22:14<228:13:49,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5522/203307 [6:22:19<228:13:55,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5522/203307 [6:22:19<228:13:55,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5523/203307 [6:22:23<228:13:37,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5523/203307 [6:22:23<228:13:38,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5524/203307 [6:22:27<228:13:32,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5524/203307 [6:22:27<228:13:32,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5525/203307 [6:22:31<228:13:39,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5525/203307 [6:22:31<228:13:39,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5526/203307 [6:22:35<228:13:17,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5526/203307 [6:22:35<228:13:17,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5527/203307 [6:22:39<228:12:54,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5527/203307 [6:22:39<228:12:54,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5528/203307 [6:22:43<228:12:58,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5528/203307 [6:22:43<228:12:58,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5529/203307 [6:22:47<228:12:37,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5529/203307 [6:22:47<228:12:37,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5530/203307 [6:22:50<228:12:16,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5530/203307 [6:22:50<228:12:16,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5531/203307 [6:22:55<228:12:23,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5531/203307 [6:22:55<228:12:23,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5532/203307 [6:22:58<228:12:02,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5532/203307 [6:22:58<228:12:02,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5533/203307 [6:23:03<228:11:57,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5533/203307 [6:23:03<228:11:57,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5534/203307 [6:23:07<228:12:00,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5534/203307 [6:23:07<228:12:00,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5535/203307 [6:23:11<228:11:36,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5535/203307 [6:23:11<228:11:36,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5536/203307 [6:23:14<228:11:17,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5536/203307 [6:23:14<228:11:17,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5537/203307 [6:23:19<228:11:19,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5537/203307 [6:23:19<228:11:20,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5538/203307 [6:23:22<228:11:00,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5538/203307 [6:23:22<228:11:00,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5539/203307 [6:23:27<228:11:04,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5539/203307 [6:23:27<228:11:04,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5540/203307 [6:23:31<228:10:47,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5540/203307 [6:23:31<228:10:47,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5541/203307 [6:23:34<228:10:26,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 5541/203307 [6:23:34<228:10:26,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5542/203307 [6:23:39<228:10:31,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5542/203307 [6:23:39<228:10:31,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5543/203307 [6:23:42<228:10:11,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5543/203307 [6:23:42<228:10:12,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5544/203307 [6:23:46<228:09:51,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5544/203307 [6:23:46<228:09:51,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5545/203307 [6:23:50<228:09:52,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5545/203307 [6:23:50<228:09:52,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5546/203307 [6:23:54<228:09:30,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5546/203307 [6:23:54<228:09:30,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5547/203307 [6:23:58<228:09:12,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5547/203307 [6:23:58<228:09:12,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5548/203307 [6:24:02<228:09:18,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5548/203307 [6:24:02<228:09:18,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5549/203307 [6:24:06<228:08:56,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5549/203307 [6:24:06<228:08:56,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5550/203307 [6:24:10<228:09:00,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5550/203307 [6:24:10<228:09:00,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5551/203307 [6:24:14<228:08:54,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5551/203307 [6:24:14<228:08:54,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5552/203307 [6:24:18<228:08:38,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5552/203307 [6:24:18<228:08:38,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5553/203307 [6:24:22<228:08:39,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5553/203307 [6:24:22<228:08:40,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5554/203307 [6:24:26<228:08:25,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5554/203307 [6:24:26<228:08:26,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5555/203307 [6:24:30<228:08:06,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5555/203307 [6:24:30<228:08:06,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5556/203307 [6:24:34<228:07:47,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5556/203307 [6:24:34<228:07:48,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5557/203307 [6:24:38<228:07:53,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5557/203307 [6:24:38<228:07:53,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5558/203307 [6:24:42<228:07:31,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5558/203307 [6:24:42<228:07:31,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5559/203307 [6:24:46<228:07:37,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5559/203307 [6:24:46<228:07:37,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5560/203307 [6:24:50<228:07:31,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5560/203307 [6:24:50<228:07:31,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5561/203307 [6:24:54<228:07:11,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   3%|▎         | 5561/203307 [6:24:54<228:07:11,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5562/203307 [6:24:58<228:07:14,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5562/203307 [6:24:58<228:07:14,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5563/203307 [6:25:02<228:06:54,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5563/203307 [6:25:02<228:06:54,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5564/203307 [6:25:06<228:06:35,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5564/203307 [6:25:06<228:06:35,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5565/203307 [6:25:10<228:06:40,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5565/203307 [6:25:10<228:06:40,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5566/203307 [6:25:14<228:06:21,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5566/203307 [6:25:14<228:06:21,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5567/203307 [6:25:19<228:06:27,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5567/203307 [6:25:19<228:06:28,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5568/203307 [6:25:22<228:06:11,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5568/203307 [6:25:22<228:06:11,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5569/203307 [6:25:27<228:06:09,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5569/203307 [6:25:27<228:06:09,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5570/203307 [6:25:31<228:06:11,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5570/203307 [6:25:31<228:06:11,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5571/203307 [6:25:35<228:05:51,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5571/203307 [6:25:35<228:05:51,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5572/203307 [6:25:38<228:05:30,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5572/203307 [6:25:38<228:05:30,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5573/203307 [6:25:42<228:05:12,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5573/203307 [6:25:42<228:05:13,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5574/203307 [6:25:46<228:05:18,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5574/203307 [6:25:46<228:05:18,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5575/203307 [6:25:51<228:05:27,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5575/203307 [6:25:51<228:05:27,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5576/203307 [6:25:55<228:05:07,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5576/203307 [6:25:55<228:05:07,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5577/203307 [6:25:58<228:04:45,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5577/203307 [6:25:58<228:04:45,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5578/203307 [6:26:03<228:04:47,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5578/203307 [6:26:03<228:04:47,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5579/203307 [6:26:06<228:04:27,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5579/203307 [6:26:06<228:04:27,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5580/203307 [6:26:10<228:04:07,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5580/203307 [6:26:10<228:04:08,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5581/203307 [6:26:14<228:03:48,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 5581/203307 [6:26:14<228:03:48,  0.24it/s, v_num=t5e6, training/loss=0.105] Epoch 0:   3%|▎         | 5582/203307 [6:26:18<228:03:30,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5582/203307 [6:26:18<228:03:30,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5583/203307 [6:26:22<228:03:39,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5583/203307 [6:26:22<228:03:39,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5584/203307 [6:26:27<228:03:45,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5584/203307 [6:26:27<228:03:45,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5585/203307 [6:26:30<228:03:26,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5585/203307 [6:26:30<228:03:26,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5586/203307 [6:26:34<228:03:07,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5586/203307 [6:26:34<228:03:07,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5587/203307 [6:26:38<228:03:11,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5587/203307 [6:26:38<228:03:12,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5588/203307 [6:26:42<228:02:50,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5588/203307 [6:26:42<228:02:50,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5589/203307 [6:26:46<228:02:31,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5589/203307 [6:26:46<228:02:31,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5590/203307 [6:26:49<228:02:09,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5590/203307 [6:26:49<228:02:10,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5591/203307 [6:26:54<228:02:13,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5591/203307 [6:26:54<228:02:14,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5592/203307 [6:26:58<228:02:19,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5592/203307 [6:26:58<228:02:19,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5593/203307 [6:27:02<228:02:00,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5593/203307 [6:27:02<228:02:00,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5594/203307 [6:27:06<228:01:42,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5594/203307 [6:27:06<228:01:42,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5595/203307 [6:27:10<228:01:45,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5595/203307 [6:27:10<228:01:46,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5596/203307 [6:27:14<228:01:43,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5596/203307 [6:27:14<228:01:43,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5597/203307 [6:27:18<228:01:25,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5597/203307 [6:27:18<228:01:25,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5598/203307 [6:27:22<228:01:04,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5598/203307 [6:27:22<228:01:05,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5599/203307 [6:27:26<228:00:47,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5599/203307 [6:27:26<228:00:47,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5600/203307 [6:27:30<228:00:58,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5600/203307 [6:27:30<228:00:58,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5601/203307 [6:27:34<228:00:41,  0.24it/s, v_num=t5e6, training/loss=0.105]Epoch 0:   3%|▎         | 5601/203307 [6:27:34<228:00:41,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5602/203307 [6:27:38<228:00:20,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5602/203307 [6:27:38<228:00:21,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5603/203307 [6:27:42<228:00:25,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5603/203307 [6:27:42<228:00:25,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5604/203307 [6:27:46<228:00:05,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5604/203307 [6:27:46<228:00:05,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5605/203307 [6:27:50<228:00:02,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5605/203307 [6:27:50<228:00:02,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5606/203307 [6:27:54<227:59:43,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5606/203307 [6:27:54<227:59:43,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5607/203307 [6:27:57<227:59:22,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5607/203307 [6:27:57<227:59:22,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5608/203307 [6:28:01<227:59:04,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5608/203307 [6:28:01<227:59:04,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5609/203307 [6:28:06<227:59:12,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5609/203307 [6:28:06<227:59:12,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5610/203307 [6:28:09<227:58:53,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5610/203307 [6:28:09<227:58:54,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5611/203307 [6:28:13<227:58:33,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5611/203307 [6:28:13<227:58:33,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5612/203307 [6:28:17<227:58:36,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5612/203307 [6:28:17<227:58:36,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5613/203307 [6:28:21<227:58:16,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5613/203307 [6:28:21<227:58:17,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5614/203307 [6:28:25<227:58:12,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5614/203307 [6:28:25<227:58:12,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5615/203307 [6:28:29<227:57:52,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5615/203307 [6:28:29<227:57:52,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5616/203307 [6:28:33<227:57:31,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5616/203307 [6:28:33<227:57:31,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5617/203307 [6:28:37<227:57:40,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5617/203307 [6:28:37<227:57:40,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5618/203307 [6:28:41<227:57:20,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5618/203307 [6:28:41<227:57:20,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5619/203307 [6:28:44<227:57:00,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5619/203307 [6:28:44<227:57:00,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5620/203307 [6:28:49<227:57:06,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5620/203307 [6:28:49<227:57:06,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5621/203307 [6:28:53<227:56:46,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   3%|▎         | 5621/203307 [6:28:53<227:56:46,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5622/203307 [6:28:56<227:56:28,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5622/203307 [6:28:56<227:56:28,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5623/203307 [6:29:01<227:56:24,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5623/203307 [6:29:01<227:56:24,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5624/203307 [6:29:04<227:56:05,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5624/203307 [6:29:04<227:56:05,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5625/203307 [6:29:09<227:56:10,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5625/203307 [6:29:09<227:56:10,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5626/203307 [6:29:13<227:56:15,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5626/203307 [6:29:13<227:56:15,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5627/203307 [6:29:17<227:55:57,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5627/203307 [6:29:17<227:55:57,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5628/203307 [6:29:21<227:55:59,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5628/203307 [6:29:21<227:55:59,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5629/203307 [6:29:25<227:55:41,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5629/203307 [6:29:25<227:55:41,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5630/203307 [6:29:29<227:55:22,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5630/203307 [6:29:29<227:55:22,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5631/203307 [6:29:32<227:55:03,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5631/203307 [6:29:32<227:55:03,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5632/203307 [6:29:37<227:55:03,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5632/203307 [6:29:37<227:55:04,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5633/203307 [6:29:40<227:54:41,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5633/203307 [6:29:40<227:54:41,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5634/203307 [6:29:45<227:54:48,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5634/203307 [6:29:45<227:54:48,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5635/203307 [6:29:49<227:54:51,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5635/203307 [6:29:49<227:54:51,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5636/203307 [6:29:53<227:54:32,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5636/203307 [6:29:53<227:54:32,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5637/203307 [6:29:57<227:54:32,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5637/203307 [6:29:57<227:54:32,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5638/203307 [6:30:01<227:54:13,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5638/203307 [6:30:01<227:54:13,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5639/203307 [6:30:05<227:53:52,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5639/203307 [6:30:05<227:53:53,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5640/203307 [6:30:08<227:53:33,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5640/203307 [6:30:08<227:53:33,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5641/203307 [6:30:13<227:53:33,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   3%|▎         | 5641/203307 [6:30:13<227:53:34,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5642/203307 [6:30:17<227:53:35,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5642/203307 [6:30:17<227:53:35,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5643/203307 [6:30:21<227:53:40,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5643/203307 [6:30:21<227:53:40,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5644/203307 [6:30:25<227:53:19,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5644/203307 [6:30:25<227:53:19,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5645/203307 [6:30:29<227:53:21,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5645/203307 [6:30:29<227:53:21,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5646/203307 [6:30:33<227:53:03,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5646/203307 [6:30:33<227:53:03,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5647/203307 [6:30:37<227:52:45,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5647/203307 [6:30:37<227:52:45,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5648/203307 [6:30:40<227:52:25,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5648/203307 [6:30:40<227:52:25,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5649/203307 [6:30:44<227:52:06,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5649/203307 [6:30:44<227:52:06,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5650/203307 [6:30:49<227:52:12,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5650/203307 [6:30:49<227:52:12,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5651/203307 [6:30:52<227:51:52,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5651/203307 [6:30:52<227:51:52,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5652/203307 [6:30:57<227:51:55,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5652/203307 [6:30:57<227:51:56,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5653/203307 [6:31:01<227:51:58,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5653/203307 [6:31:01<227:51:58,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5654/203307 [6:31:05<227:51:40,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5654/203307 [6:31:05<227:51:40,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5655/203307 [6:31:08<227:51:19,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5655/203307 [6:31:08<227:51:19,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5656/203307 [6:31:12<227:51:01,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5656/203307 [6:31:12<227:51:01,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5657/203307 [6:31:16<227:50:42,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5657/203307 [6:31:16<227:50:42,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5658/203307 [6:31:20<227:50:21,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5658/203307 [6:31:20<227:50:22,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5659/203307 [6:31:24<227:50:29,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5659/203307 [6:31:24<227:50:29,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5660/203307 [6:31:28<227:50:06,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5660/203307 [6:31:28<227:50:07,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5661/203307 [6:31:32<227:50:12,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 5661/203307 [6:31:32<227:50:12,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5662/203307 [6:31:36<227:50:11,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5662/203307 [6:31:36<227:50:11,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5663/203307 [6:31:40<227:50:01,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5663/203307 [6:31:40<227:50:01,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5664/203307 [6:31:44<227:49:41,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5664/203307 [6:31:44<227:49:41,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5665/203307 [6:31:48<227:49:20,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5665/203307 [6:31:48<227:49:20,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5666/203307 [6:31:51<227:48:59,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5666/203307 [6:31:51<227:48:59,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5667/203307 [6:31:56<227:49:03,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5667/203307 [6:31:56<227:49:03,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5668/203307 [6:32:00<227:48:58,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5668/203307 [6:32:00<227:48:58,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5669/203307 [6:32:04<227:48:58,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5669/203307 [6:32:04<227:48:58,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5670/203307 [6:32:08<227:48:56,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5670/203307 [6:32:08<227:48:56,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5671/203307 [6:32:12<227:48:35,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5671/203307 [6:32:12<227:48:35,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5672/203307 [6:32:16<227:48:14,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5672/203307 [6:32:16<227:48:14,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5673/203307 [6:32:19<227:47:56,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5673/203307 [6:32:19<227:47:56,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5674/203307 [6:32:23<227:47:35,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5674/203307 [6:32:23<227:47:35,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5675/203307 [6:32:28<227:47:43,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5675/203307 [6:32:28<227:47:43,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5676/203307 [6:32:31<227:47:20,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5676/203307 [6:32:31<227:47:20,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5677/203307 [6:32:35<227:47:14,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5677/203307 [6:32:35<227:47:14,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5678/203307 [6:32:40<227:47:16,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5678/203307 [6:32:40<227:47:16,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5679/203307 [6:32:43<227:46:55,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5679/203307 [6:32:43<227:46:55,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5680/203307 [6:32:47<227:46:33,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5680/203307 [6:32:47<227:46:33,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5681/203307 [6:32:51<227:46:13,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 5681/203307 [6:32:51<227:46:13,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5682/203307 [6:32:54<227:45:53,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5682/203307 [6:32:54<227:45:53,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5683/203307 [6:32:58<227:45:33,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5683/203307 [6:32:58<227:45:33,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5684/203307 [6:33:02<227:45:39,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5684/203307 [6:33:02<227:45:39,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5685/203307 [6:33:06<227:45:17,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5685/203307 [6:33:06<227:45:17,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5686/203307 [6:33:10<227:45:17,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5686/203307 [6:33:10<227:45:17,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5687/203307 [6:33:15<227:45:20,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5687/203307 [6:33:15<227:45:20,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5688/203307 [6:33:18<227:44:59,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5688/203307 [6:33:18<227:44:59,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5689/203307 [6:33:22<227:44:40,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5689/203307 [6:33:22<227:44:40,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5690/203307 [6:33:26<227:44:22,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5690/203307 [6:33:26<227:44:22,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5691/203307 [6:33:30<227:44:04,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5691/203307 [6:33:30<227:44:04,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5692/203307 [6:33:34<227:44:12,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5692/203307 [6:33:34<227:44:12,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5693/203307 [6:33:38<227:43:53,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5693/203307 [6:33:38<227:43:53,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5694/203307 [6:33:41<227:43:32,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5694/203307 [6:33:41<227:43:32,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5695/203307 [6:33:46<227:43:42,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5695/203307 [6:33:46<227:43:42,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5696/203307 [6:33:50<227:43:22,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5696/203307 [6:33:50<227:43:22,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5697/203307 [6:33:53<227:43:02,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5697/203307 [6:33:53<227:43:02,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5698/203307 [6:33:57<227:42:48,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5698/203307 [6:33:57<227:42:48,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5699/203307 [6:34:01<227:42:27,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5699/203307 [6:34:01<227:42:27,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5700/203307 [6:34:05<227:42:33,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5700/203307 [6:34:05<227:42:34,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5701/203307 [6:34:09<227:42:16,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   3%|▎         | 5701/203307 [6:34:09<227:42:16,  0.24it/s, v_num=t5e6, training/loss=0.092] Epoch 0:   3%|▎         | 5702/203307 [6:34:13<227:41:56,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5702/203307 [6:34:13<227:41:56,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5703/203307 [6:34:17<227:42:02,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5703/203307 [6:34:17<227:42:02,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5704/203307 [6:34:22<227:42:08,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5704/203307 [6:34:22<227:42:09,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5705/203307 [6:34:26<227:41:52,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5705/203307 [6:34:26<227:41:52,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5706/203307 [6:34:29<227:41:35,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5706/203307 [6:34:29<227:41:35,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5707/203307 [6:34:33<227:41:17,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5707/203307 [6:34:33<227:41:17,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5708/203307 [6:34:37<227:41:01,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5708/203307 [6:34:37<227:41:01,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5709/203307 [6:34:41<227:41:13,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5709/203307 [6:34:41<227:41:13,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5710/203307 [6:34:45<227:40:54,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5710/203307 [6:34:45<227:40:54,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5711/203307 [6:34:49<227:40:34,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5711/203307 [6:34:49<227:40:34,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5712/203307 [6:34:53<227:40:39,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5712/203307 [6:34:53<227:40:39,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5713/203307 [6:34:58<227:40:46,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5713/203307 [6:34:58<227:40:47,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5714/203307 [6:35:02<227:40:28,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5714/203307 [6:35:02<227:40:28,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5715/203307 [6:35:05<227:40:11,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5715/203307 [6:35:05<227:40:11,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5716/203307 [6:35:09<227:39:52,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5716/203307 [6:35:09<227:39:53,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5717/203307 [6:35:14<227:39:59,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5717/203307 [6:35:14<227:39:59,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5718/203307 [6:35:17<227:39:43,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5718/203307 [6:35:17<227:39:43,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5719/203307 [6:35:21<227:39:23,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5719/203307 [6:35:21<227:39:23,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5720/203307 [6:35:25<227:39:27,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5720/203307 [6:35:25<227:39:27,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5721/203307 [6:35:30<227:39:33,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   3%|▎         | 5721/203307 [6:35:30<227:39:33,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5722/203307 [6:35:34<227:39:30,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5722/203307 [6:35:34<227:39:30,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5723/203307 [6:35:38<227:39:10,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5723/203307 [6:35:38<227:39:10,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5724/203307 [6:35:41<227:38:49,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5724/203307 [6:35:41<227:38:49,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5725/203307 [6:35:46<227:38:57,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5725/203307 [6:35:46<227:38:57,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5726/203307 [6:35:49<227:38:35,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5726/203307 [6:35:49<227:38:35,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5727/203307 [6:35:53<227:38:12,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5727/203307 [6:35:53<227:38:12,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5728/203307 [6:35:57<227:38:14,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5728/203307 [6:35:57<227:38:15,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5729/203307 [6:36:01<227:37:54,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5729/203307 [6:36:01<227:37:54,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5730/203307 [6:36:05<227:37:57,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5730/203307 [6:36:05<227:37:57,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5731/203307 [6:36:10<227:37:54,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5731/203307 [6:36:10<227:37:54,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5732/203307 [6:36:13<227:37:32,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5732/203307 [6:36:13<227:37:32,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5733/203307 [6:36:17<227:37:14,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5733/203307 [6:36:17<227:37:14,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5734/203307 [6:36:21<227:37:21,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5734/203307 [6:36:21<227:37:21,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5735/203307 [6:36:25<227:37:03,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5735/203307 [6:36:25<227:37:03,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5736/203307 [6:36:29<227:36:47,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5736/203307 [6:36:29<227:36:47,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5737/203307 [6:36:33<227:36:51,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5737/203307 [6:36:33<227:36:52,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5738/203307 [6:36:37<227:36:32,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5738/203307 [6:36:37<227:36:32,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5739/203307 [6:36:42<227:36:36,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5739/203307 [6:36:42<227:36:37,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5740/203307 [6:36:46<227:36:34,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5740/203307 [6:36:46<227:36:34,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5741/203307 [6:36:49<227:36:12,  0.24it/s, v_num=t5e6, training/loss=0.099]Epoch 0:   3%|▎         | 5741/203307 [6:36:49<227:36:12,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5742/203307 [6:36:54<227:36:21,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5742/203307 [6:36:54<227:36:21,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5743/203307 [6:36:58<227:36:02,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5743/203307 [6:36:58<227:36:02,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5744/203307 [6:37:01<227:35:43,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5744/203307 [6:37:01<227:35:43,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5745/203307 [6:37:06<227:35:44,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5745/203307 [6:37:06<227:35:44,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5746/203307 [6:37:09<227:35:26,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5746/203307 [6:37:09<227:35:26,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5747/203307 [6:37:14<227:35:29,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5747/203307 [6:37:14<227:35:29,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5748/203307 [6:37:18<227:35:15,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5748/203307 [6:37:18<227:35:15,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5749/203307 [6:37:22<227:35:10,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5749/203307 [6:37:22<227:35:10,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5750/203307 [6:37:26<227:35:16,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5750/203307 [6:37:26<227:35:16,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5751/203307 [6:37:30<227:34:58,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5751/203307 [6:37:30<227:34:58,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5752/203307 [6:37:34<227:34:40,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5752/203307 [6:37:34<227:34:40,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5753/203307 [6:37:38<227:34:42,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5753/203307 [6:37:38<227:34:42,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5754/203307 [6:37:42<227:34:25,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5754/203307 [6:37:42<227:34:25,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5755/203307 [6:37:45<227:34:08,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5755/203307 [6:37:45<227:34:08,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5756/203307 [6:37:50<227:34:13,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5756/203307 [6:37:50<227:34:13,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5757/203307 [6:37:54<227:33:54,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5757/203307 [6:37:54<227:33:54,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5758/203307 [6:37:58<227:33:55,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5758/203307 [6:37:58<227:33:55,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5759/203307 [6:38:02<227:34:02,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5759/203307 [6:38:02<227:34:02,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5760/203307 [6:38:06<227:33:42,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5760/203307 [6:38:06<227:33:42,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5761/203307 [6:38:10<227:33:25,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   3%|▎         | 5761/203307 [6:38:10<227:33:25,  0.24it/s, v_num=t5e6, training/loss=0.108] Epoch 0:   3%|▎         | 5762/203307 [6:38:14<227:33:32,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5762/203307 [6:38:14<227:33:32,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5763/203307 [6:38:18<227:33:14,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5763/203307 [6:38:18<227:33:14,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5764/203307 [6:38:22<227:32:54,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5764/203307 [6:38:22<227:32:54,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5765/203307 [6:38:26<227:33:00,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5765/203307 [6:38:26<227:33:00,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5766/203307 [6:38:30<227:32:42,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5766/203307 [6:38:30<227:32:42,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5767/203307 [6:38:34<227:32:48,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5767/203307 [6:38:34<227:32:48,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5768/203307 [6:38:38<227:32:31,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5768/203307 [6:38:38<227:32:31,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5769/203307 [6:38:42<227:32:12,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5769/203307 [6:38:42<227:32:12,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5770/203307 [6:38:46<227:32:15,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5770/203307 [6:38:46<227:32:15,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5771/203307 [6:38:50<227:31:56,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5771/203307 [6:38:50<227:31:56,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5772/203307 [6:38:54<227:31:37,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5772/203307 [6:38:54<227:31:37,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5773/203307 [6:38:58<227:31:41,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5773/203307 [6:38:58<227:31:41,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5774/203307 [6:39:02<227:31:23,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5774/203307 [6:39:02<227:31:23,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5775/203307 [6:39:06<227:31:27,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5775/203307 [6:39:06<227:31:27,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5776/203307 [6:39:10<227:31:25,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5776/203307 [6:39:10<227:31:26,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5777/203307 [6:39:14<227:31:05,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5777/203307 [6:39:14<227:31:05,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5778/203307 [6:39:18<227:31:08,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5778/203307 [6:39:18<227:31:09,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5779/203307 [6:39:22<227:30:50,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5779/203307 [6:39:22<227:30:50,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5780/203307 [6:39:26<227:30:31,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5780/203307 [6:39:26<227:30:31,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5781/203307 [6:39:30<227:30:14,  0.24it/s, v_num=t5e6, training/loss=0.108]Epoch 0:   3%|▎         | 5781/203307 [6:39:30<227:30:14,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5782/203307 [6:39:34<227:30:18,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5782/203307 [6:39:34<227:30:18,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5783/203307 [6:39:38<227:30:00,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5783/203307 [6:39:38<227:30:00,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5784/203307 [6:39:42<227:30:05,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5784/203307 [6:39:42<227:30:06,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5785/203307 [6:39:46<227:30:01,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5785/203307 [6:39:46<227:30:02,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5786/203307 [6:39:50<227:29:41,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5786/203307 [6:39:50<227:29:41,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5787/203307 [6:39:54<227:29:42,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5787/203307 [6:39:54<227:29:43,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5788/203307 [6:39:58<227:29:21,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5788/203307 [6:39:58<227:29:21,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5789/203307 [6:40:02<227:29:03,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5789/203307 [6:40:02<227:29:03,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5790/203307 [6:40:05<227:28:43,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5790/203307 [6:40:05<227:28:43,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5791/203307 [6:40:10<227:28:46,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5791/203307 [6:40:10<227:28:46,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5792/203307 [6:40:14<227:28:50,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5792/203307 [6:40:14<227:28:50,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5793/203307 [6:40:18<227:28:34,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5793/203307 [6:40:18<227:28:34,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5794/203307 [6:40:22<227:28:32,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5794/203307 [6:40:22<227:28:32,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5795/203307 [6:40:26<227:28:33,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5795/203307 [6:40:26<227:28:33,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5796/203307 [6:40:30<227:28:13,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5796/203307 [6:40:30<227:28:13,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5797/203307 [6:40:34<227:27:54,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5797/203307 [6:40:34<227:27:54,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5798/203307 [6:40:37<227:27:34,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5798/203307 [6:40:37<227:27:34,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5799/203307 [6:40:42<227:27:37,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5799/203307 [6:40:42<227:27:38,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5800/203307 [6:40:46<227:27:46,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5800/203307 [6:40:46<227:27:46,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5801/203307 [6:40:50<227:27:26,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 5801/203307 [6:40:50<227:27:26,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5802/203307 [6:40:54<227:27:05,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5802/203307 [6:40:54<227:27:05,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5803/203307 [6:40:58<227:27:09,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5803/203307 [6:40:58<227:27:09,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5804/203307 [6:41:02<227:26:51,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5804/203307 [6:41:02<227:26:51,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5805/203307 [6:41:05<227:26:29,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5805/203307 [6:41:05<227:26:29,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5806/203307 [6:41:09<227:26:10,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5806/203307 [6:41:09<227:26:10,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5807/203307 [6:41:13<227:25:51,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5807/203307 [6:41:13<227:25:51,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5808/203307 [6:41:17<227:25:57,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5808/203307 [6:41:17<227:25:57,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5809/203307 [6:41:22<227:26:02,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5809/203307 [6:41:22<227:26:02,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5810/203307 [6:41:25<227:25:42,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5810/203307 [6:41:25<227:25:42,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5811/203307 [6:41:29<227:25:23,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5811/203307 [6:41:29<227:25:23,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5812/203307 [6:41:33<227:25:25,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5812/203307 [6:41:33<227:25:25,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5813/203307 [6:41:37<227:25:05,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5813/203307 [6:41:37<227:25:05,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5814/203307 [6:41:41<227:24:44,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5814/203307 [6:41:41<227:24:45,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5815/203307 [6:41:44<227:24:25,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5815/203307 [6:41:44<227:24:25,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5816/203307 [6:41:48<227:24:04,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5816/203307 [6:41:48<227:24:04,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5817/203307 [6:41:53<227:24:12,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5817/203307 [6:41:53<227:24:12,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5818/203307 [6:41:56<227:23:53,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5818/203307 [6:41:56<227:23:53,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5819/203307 [6:42:00<227:23:32,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5819/203307 [6:42:00<227:23:33,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5820/203307 [6:42:04<227:23:34,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5820/203307 [6:42:04<227:23:34,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5821/203307 [6:42:09<227:23:34,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   3%|▎         | 5821/203307 [6:42:09<227:23:34,  0.24it/s, v_num=t5e6, training/loss=0.102] Epoch 0:   3%|▎         | 5822/203307 [6:42:12<227:23:13,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5822/203307 [6:42:12<227:23:13,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5823/203307 [6:42:16<227:22:52,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5823/203307 [6:42:16<227:22:52,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5824/203307 [6:42:20<227:22:33,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5824/203307 [6:42:20<227:22:33,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5825/203307 [6:42:24<227:22:39,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5825/203307 [6:42:24<227:22:40,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5826/203307 [6:42:28<227:22:20,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5826/203307 [6:42:28<227:22:20,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5827/203307 [6:42:31<227:21:59,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5827/203307 [6:42:31<227:21:59,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5828/203307 [6:42:36<227:22:00,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5828/203307 [6:42:36<227:22:00,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5829/203307 [6:42:39<227:21:39,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5829/203307 [6:42:39<227:21:39,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5830/203307 [6:42:44<227:21:36,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5830/203307 [6:42:44<227:21:36,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5831/203307 [6:42:47<227:21:15,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5831/203307 [6:42:47<227:21:15,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5832/203307 [6:42:51<227:20:55,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5832/203307 [6:42:51<227:20:55,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5833/203307 [6:42:55<227:20:36,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5833/203307 [6:42:55<227:20:36,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5834/203307 [6:42:59<227:20:41,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5834/203307 [6:42:59<227:20:41,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5835/203307 [6:43:03<227:20:21,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5835/203307 [6:43:03<227:20:21,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5836/203307 [6:43:06<227:20:01,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5836/203307 [6:43:06<227:20:01,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5837/203307 [6:43:11<227:20:02,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5837/203307 [6:43:11<227:20:02,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5838/203307 [6:43:14<227:19:48,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5838/203307 [6:43:14<227:19:48,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5839/203307 [6:43:19<227:19:47,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5839/203307 [6:43:19<227:19:47,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5840/203307 [6:43:22<227:19:27,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5840/203307 [6:43:22<227:19:27,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5841/203307 [6:43:26<227:19:08,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 5841/203307 [6:43:26<227:19:08,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5842/203307 [6:43:30<227:19:13,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5842/203307 [6:43:30<227:19:13,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5843/203307 [6:43:35<227:19:17,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5843/203307 [6:43:35<227:19:18,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5844/203307 [6:43:39<227:18:57,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5844/203307 [6:43:39<227:18:57,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5845/203307 [6:43:43<227:18:57,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5845/203307 [6:43:43<227:18:57,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5846/203307 [6:43:47<227:18:38,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5846/203307 [6:43:47<227:18:38,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5847/203307 [6:43:50<227:18:18,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5847/203307 [6:43:50<227:18:18,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5848/203307 [6:43:54<227:18:15,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5848/203307 [6:43:54<227:18:15,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5849/203307 [6:43:58<227:17:52,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5849/203307 [6:43:58<227:17:53,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5850/203307 [6:44:02<227:17:55,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5850/203307 [6:44:02<227:17:55,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5851/203307 [6:44:07<227:17:57,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5851/203307 [6:44:07<227:17:57,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5852/203307 [6:44:10<227:17:36,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5852/203307 [6:44:10<227:17:36,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5853/203307 [6:44:15<227:17:36,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5853/203307 [6:44:15<227:17:37,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5854/203307 [6:44:18<227:17:19,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5854/203307 [6:44:18<227:17:19,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5855/203307 [6:44:22<227:17:00,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5855/203307 [6:44:22<227:17:00,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5856/203307 [6:44:26<227:16:41,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5856/203307 [6:44:26<227:16:41,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5857/203307 [6:44:30<227:16:40,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5857/203307 [6:44:30<227:16:41,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5858/203307 [6:44:34<227:16:20,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5858/203307 [6:44:34<227:16:20,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5859/203307 [6:44:38<227:16:26,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5859/203307 [6:44:38<227:16:27,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5860/203307 [6:44:42<227:16:30,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5860/203307 [6:44:42<227:16:30,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5861/203307 [6:44:46<227:16:10,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   3%|▎         | 5861/203307 [6:44:46<227:16:10,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5862/203307 [6:44:50<227:16:11,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5862/203307 [6:44:50<227:16:11,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5863/203307 [6:44:54<227:15:51,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5863/203307 [6:44:54<227:15:52,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5864/203307 [6:44:58<227:15:32,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5864/203307 [6:44:58<227:15:32,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5865/203307 [6:45:02<227:15:14,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5865/203307 [6:45:02<227:15:14,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5866/203307 [6:45:06<227:15:12,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5866/203307 [6:45:06<227:15:12,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5867/203307 [6:45:10<227:15:16,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5867/203307 [6:45:10<227:15:16,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5868/203307 [6:45:14<227:14:58,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5868/203307 [6:45:14<227:14:59,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5869/203307 [6:45:18<227:15:08,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5869/203307 [6:45:18<227:15:08,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5870/203307 [6:45:23<227:15:08,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5870/203307 [6:45:23<227:15:09,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5871/203307 [6:45:26<227:14:50,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5871/203307 [6:45:26<227:14:50,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5872/203307 [6:45:30<227:14:33,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5872/203307 [6:45:30<227:14:33,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5873/203307 [6:45:34<227:14:13,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5873/203307 [6:45:34<227:14:14,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5874/203307 [6:45:38<227:13:55,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5874/203307 [6:45:38<227:13:55,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5875/203307 [6:45:42<227:14:04,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5875/203307 [6:45:42<227:14:04,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5876/203307 [6:45:46<227:13:46,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5876/203307 [6:45:46<227:13:46,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5877/203307 [6:45:50<227:13:49,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5877/203307 [6:45:50<227:13:49,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5878/203307 [6:45:55<227:13:52,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5878/203307 [6:45:55<227:13:53,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5879/203307 [6:45:58<227:13:34,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5879/203307 [6:45:58<227:13:34,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5880/203307 [6:46:02<227:13:15,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5880/203307 [6:46:02<227:13:15,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5881/203307 [6:46:06<227:12:58,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5881/203307 [6:46:06<227:12:58,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5882/203307 [6:46:10<227:12:41,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5882/203307 [6:46:10<227:12:41,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5883/203307 [6:46:13<227:12:24,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5883/203307 [6:46:13<227:12:24,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5884/203307 [6:46:18<227:12:31,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5884/203307 [6:46:18<227:12:31,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5885/203307 [6:46:21<227:12:14,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5885/203307 [6:46:21<227:12:14,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5886/203307 [6:46:26<227:12:19,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5886/203307 [6:46:26<227:12:19,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5887/203307 [6:46:30<227:12:24,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5887/203307 [6:46:30<227:12:24,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5888/203307 [6:46:34<227:12:05,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5888/203307 [6:46:34<227:12:05,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5889/203307 [6:46:38<227:11:46,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5889/203307 [6:46:38<227:11:47,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5890/203307 [6:46:41<227:11:28,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5890/203307 [6:46:41<227:11:28,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5891/203307 [6:46:45<227:11:10,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5891/203307 [6:46:45<227:11:10,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5892/203307 [6:46:50<227:11:17,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5892/203307 [6:46:50<227:11:18,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5893/203307 [6:46:54<227:11:14,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5893/203307 [6:46:54<227:11:14,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5894/203307 [6:46:58<227:10:54,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5894/203307 [6:46:58<227:10:54,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5895/203307 [6:47:02<227:10:59,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5895/203307 [6:47:02<227:10:59,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5896/203307 [6:47:06<227:10:43,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5896/203307 [6:47:06<227:10:43,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5897/203307 [6:47:09<227:10:22,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5897/203307 [6:47:09<227:10:23,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5898/203307 [6:47:13<227:10:04,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5898/203307 [6:47:13<227:10:05,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5899/203307 [6:47:17<227:09:51,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5899/203307 [6:47:17<227:09:51,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5900/203307 [6:47:21<227:09:57,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5900/203307 [6:47:21<227:09:57,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5901/203307 [6:47:25<227:09:40,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   3%|▎         | 5901/203307 [6:47:25<227:09:40,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5902/203307 [6:47:29<227:09:34,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5902/203307 [6:47:29<227:09:34,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5903/203307 [6:47:34<227:09:40,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5903/203307 [6:47:34<227:09:41,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5904/203307 [6:47:37<227:09:24,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5904/203307 [6:47:37<227:09:24,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5905/203307 [6:47:41<227:09:02,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5905/203307 [6:47:41<227:09:02,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5906/203307 [6:47:45<227:08:40,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5906/203307 [6:47:45<227:08:40,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5907/203307 [6:47:48<227:08:20,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5907/203307 [6:47:48<227:08:21,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5908/203307 [6:47:52<227:08:02,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5908/203307 [6:47:52<227:08:03,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5909/203307 [6:47:57<227:08:08,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5909/203307 [6:47:57<227:08:08,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5910/203307 [6:48:00<227:07:46,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5910/203307 [6:48:00<227:07:46,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5911/203307 [6:48:04<227:07:42,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5911/203307 [6:48:04<227:07:42,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5912/203307 [6:48:09<227:07:49,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5912/203307 [6:48:09<227:07:49,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5913/203307 [6:48:12<227:07:28,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5913/203307 [6:48:12<227:07:29,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5914/203307 [6:48:16<227:07:13,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5914/203307 [6:48:16<227:07:13,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5915/203307 [6:48:20<227:06:58,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5915/203307 [6:48:20<227:06:58,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5916/203307 [6:48:24<227:06:40,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5916/203307 [6:48:24<227:06:40,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5917/203307 [6:48:28<227:06:44,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5917/203307 [6:48:28<227:06:44,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5918/203307 [6:48:32<227:06:26,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5918/203307 [6:48:32<227:06:26,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5919/203307 [6:48:35<227:06:04,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5919/203307 [6:48:36<227:06:04,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5920/203307 [6:48:40<227:06:07,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5920/203307 [6:48:40<227:06:07,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5921/203307 [6:48:44<227:06:10,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   3%|▎         | 5921/203307 [6:48:44<227:06:10,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5922/203307 [6:48:48<227:05:52,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5922/203307 [6:48:48<227:05:52,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5923/203307 [6:48:52<227:05:32,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5923/203307 [6:48:52<227:05:32,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5924/203307 [6:48:55<227:05:13,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5924/203307 [6:48:55<227:05:13,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5925/203307 [6:49:00<227:05:20,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5925/203307 [6:49:00<227:05:20,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5926/203307 [6:49:03<227:05:01,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5926/203307 [6:49:03<227:05:02,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5927/203307 [6:49:07<227:04:42,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5927/203307 [6:49:07<227:04:42,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5928/203307 [6:49:11<227:04:43,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5928/203307 [6:49:11<227:04:43,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5929/203307 [6:49:16<227:04:49,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5929/203307 [6:49:16<227:04:49,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5930/203307 [6:49:20<227:04:34,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5930/203307 [6:49:20<227:04:34,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5931/203307 [6:49:23<227:04:16,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5931/203307 [6:49:23<227:04:16,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5932/203307 [6:49:27<227:03:58,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5932/203307 [6:49:27<227:03:58,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5933/203307 [6:49:31<227:03:43,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5933/203307 [6:49:31<227:03:43,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5934/203307 [6:49:36<227:03:51,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5934/203307 [6:49:36<227:03:51,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5935/203307 [6:49:39<227:03:31,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5935/203307 [6:49:39<227:03:31,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5936/203307 [6:49:43<227:03:14,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5936/203307 [6:49:43<227:03:14,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5937/203307 [6:49:47<227:03:20,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5937/203307 [6:49:47<227:03:20,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5938/203307 [6:49:52<227:03:24,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5938/203307 [6:49:52<227:03:24,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5939/203307 [6:49:55<227:03:06,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5939/203307 [6:49:55<227:03:06,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5940/203307 [6:49:59<227:02:50,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5940/203307 [6:49:59<227:02:50,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5941/203307 [6:50:03<227:02:30,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 5941/203307 [6:50:03<227:02:30,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5942/203307 [6:50:07<227:02:35,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5942/203307 [6:50:07<227:02:35,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5943/203307 [6:50:11<227:02:20,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5943/203307 [6:50:11<227:02:20,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5944/203307 [6:50:15<227:02:03,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5944/203307 [6:50:15<227:02:03,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5945/203307 [6:50:19<227:02:05,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5945/203307 [6:50:19<227:02:05,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5946/203307 [6:50:23<227:01:48,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5946/203307 [6:50:23<227:01:48,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5947/203307 [6:50:27<227:01:53,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5947/203307 [6:50:27<227:01:53,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5948/203307 [6:50:31<227:01:33,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5948/203307 [6:50:31<227:01:33,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5949/203307 [6:50:35<227:01:14,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5949/203307 [6:50:35<227:01:14,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5950/203307 [6:50:39<227:01:20,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5950/203307 [6:50:39<227:01:20,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5951/203307 [6:50:43<227:01:00,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5951/203307 [6:50:43<227:01:00,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5952/203307 [6:50:47<227:00:39,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5952/203307 [6:50:47<227:00:39,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5953/203307 [6:50:51<227:00:41,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5953/203307 [6:50:51<227:00:42,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5954/203307 [6:50:55<227:00:23,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5954/203307 [6:50:55<227:00:23,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5955/203307 [6:50:59<227:00:26,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5955/203307 [6:50:59<227:00:26,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5956/203307 [6:51:03<227:00:21,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5956/203307 [6:51:03<227:00:21,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5957/203307 [6:51:07<227:00:00,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5957/203307 [6:51:07<227:00:00,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5958/203307 [6:51:10<226:59:41,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5958/203307 [6:51:10<226:59:41,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5959/203307 [6:51:15<226:59:47,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5959/203307 [6:51:15<226:59:47,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5960/203307 [6:51:19<226:59:31,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5960/203307 [6:51:19<226:59:31,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5961/203307 [6:51:22<226:59:13,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   3%|▎         | 5961/203307 [6:51:22<226:59:13,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5962/203307 [6:51:27<226:59:16,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5962/203307 [6:51:27<226:59:16,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5963/203307 [6:51:30<226:58:59,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5963/203307 [6:51:30<226:58:59,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5964/203307 [6:51:35<226:59:05,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5964/203307 [6:51:35<226:59:05,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5965/203307 [6:51:39<226:59:04,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5965/203307 [6:51:39<226:59:04,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5966/203307 [6:51:43<226:58:45,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5966/203307 [6:51:43<226:58:46,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5967/203307 [6:51:47<226:59:00,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5967/203307 [6:51:48<226:59:00,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5968/203307 [6:51:51<226:58:42,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5968/203307 [6:51:51<226:58:43,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5969/203307 [6:51:55<226:58:25,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5969/203307 [6:51:55<226:58:25,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5970/203307 [6:51:59<226:58:29,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5970/203307 [6:51:59<226:58:29,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5971/203307 [6:52:03<226:58:18,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5971/203307 [6:52:03<226:58:18,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5972/203307 [6:52:07<226:57:58,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5972/203307 [6:52:07<226:57:59,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5973/203307 [6:52:12<226:58:09,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5973/203307 [6:52:12<226:58:09,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5974/203307 [6:52:16<226:58:05,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5974/203307 [6:52:16<226:58:05,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5975/203307 [6:52:20<226:58:21,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5975/203307 [6:52:20<226:58:21,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5976/203307 [6:52:24<226:58:04,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5976/203307 [6:52:24<226:58:04,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5977/203307 [6:52:28<226:57:48,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5977/203307 [6:52:28<226:57:49,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5978/203307 [6:52:32<226:57:50,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5978/203307 [6:52:32<226:57:50,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5979/203307 [6:52:36<226:57:45,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5979/203307 [6:52:36<226:57:45,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5980/203307 [6:52:40<226:57:28,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5980/203307 [6:52:40<226:57:28,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5981/203307 [6:52:45<226:57:34,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5981/203307 [6:52:45<226:57:34,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5982/203307 [6:52:48<226:57:17,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5982/203307 [6:52:48<226:57:17,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5983/203307 [6:52:53<226:57:18,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5983/203307 [6:52:53<226:57:18,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5984/203307 [6:52:57<226:57:27,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5984/203307 [6:52:57<226:57:27,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5985/203307 [6:53:01<226:57:10,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5985/203307 [6:53:01<226:57:10,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5986/203307 [6:53:05<226:56:51,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5986/203307 [6:53:05<226:56:51,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5987/203307 [6:53:09<226:57:03,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5987/203307 [6:53:09<226:57:03,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5988/203307 [6:53:13<226:56:43,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5988/203307 [6:53:13<226:56:44,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5989/203307 [6:53:17<226:56:26,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5989/203307 [6:53:17<226:56:27,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5990/203307 [6:53:21<226:56:35,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5990/203307 [6:53:21<226:56:35,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5991/203307 [6:53:25<226:56:24,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5991/203307 [6:53:25<226:56:24,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5992/203307 [6:53:30<226:56:30,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5992/203307 [6:53:30<226:56:30,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5993/203307 [6:53:33<226:56:13,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5993/203307 [6:53:33<226:56:13,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5994/203307 [6:53:37<226:55:54,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5994/203307 [6:53:37<226:55:54,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5995/203307 [6:53:42<226:56:03,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5995/203307 [6:53:42<226:56:03,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5996/203307 [6:53:45<226:55:47,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5996/203307 [6:53:45<226:55:47,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5997/203307 [6:53:49<226:55:30,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5997/203307 [6:53:49<226:55:30,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5998/203307 [6:53:53<226:55:10,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5998/203307 [6:53:53<226:55:11,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5999/203307 [6:53:57<226:55:23,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 5999/203307 [6:53:57<226:55:23,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6000/203307 [6:54:02<226:55:28,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6000/203307 [6:54:02<226:55:28,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6001/203307 [6:54:06<226:55:29,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6001/203307 [6:54:06<226:55:29,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6002/203307 [6:54:10<226:55:12,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6002/203307 [6:54:10<226:55:12,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6003/203307 [6:54:14<226:55:21,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6003/203307 [6:54:14<226:55:21,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6004/203307 [6:54:18<226:55:04,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6004/203307 [6:54:18<226:55:04,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6005/203307 [6:54:22<226:54:44,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6005/203307 [6:54:22<226:54:44,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6006/203307 [6:54:26<226:54:26,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6006/203307 [6:54:26<226:54:26,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6007/203307 [6:54:30<226:54:38,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6007/203307 [6:54:30<226:54:39,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6008/203307 [6:54:34<226:54:21,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6008/203307 [6:54:34<226:54:21,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6009/203307 [6:54:38<226:54:28,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6009/203307 [6:54:38<226:54:28,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6010/203307 [6:54:43<226:54:22,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6010/203307 [6:54:43<226:54:22,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6011/203307 [6:54:47<226:54:13,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6011/203307 [6:54:47<226:54:14,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6012/203307 [6:54:51<226:54:15,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6012/203307 [6:54:51<226:54:15,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6013/203307 [6:54:55<226:53:58,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6013/203307 [6:54:55<226:53:58,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6014/203307 [6:54:58<226:53:39,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6014/203307 [6:54:58<226:53:39,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6015/203307 [6:55:02<226:53:33,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6015/203307 [6:55:02<226:53:33,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6016/203307 [6:55:07<226:53:39,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6016/203307 [6:55:07<226:53:39,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6017/203307 [6:55:11<226:53:47,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6017/203307 [6:55:11<226:53:47,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6018/203307 [6:55:15<226:53:31,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6018/203307 [6:55:15<226:53:31,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6019/203307 [6:55:19<226:53:30,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6019/203307 [6:55:19<226:53:30,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6020/203307 [6:55:24<226:53:34,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6020/203307 [6:55:24<226:53:34,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6021/203307 [6:55:27<226:53:17,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   3%|▎         | 6021/203307 [6:55:27<226:53:17,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6022/203307 [6:55:31<226:53:00,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6022/203307 [6:55:31<226:53:00,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6023/203307 [6:55:35<226:52:51,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6023/203307 [6:55:35<226:52:51,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6024/203307 [6:55:39<226:52:34,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6024/203307 [6:55:39<226:52:34,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6025/203307 [6:55:43<226:52:43,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6025/203307 [6:55:43<226:52:43,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6026/203307 [6:55:47<226:52:27,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6026/203307 [6:55:47<226:52:27,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6027/203307 [6:55:51<226:52:18,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6027/203307 [6:55:51<226:52:18,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6028/203307 [6:55:56<226:52:22,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6028/203307 [6:55:56<226:52:22,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6029/203307 [6:55:59<226:52:05,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6029/203307 [6:55:59<226:52:05,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6030/203307 [6:56:03<226:51:47,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6030/203307 [6:56:03<226:51:48,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6031/203307 [6:56:07<226:51:41,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6031/203307 [6:56:07<226:51:41,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6032/203307 [6:56:11<226:51:22,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6032/203307 [6:56:11<226:51:22,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6033/203307 [6:56:15<226:51:26,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6033/203307 [6:56:15<226:51:26,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6034/203307 [6:56:20<226:51:35,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6034/203307 [6:56:20<226:51:35,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6035/203307 [6:56:24<226:51:24,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6035/203307 [6:56:24<226:51:24,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6036/203307 [6:56:27<226:51:05,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6036/203307 [6:56:27<226:51:05,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6037/203307 [6:56:32<226:51:07,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6037/203307 [6:56:32<226:51:07,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6038/203307 [6:56:35<226:50:48,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6038/203307 [6:56:35<226:50:48,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6039/203307 [6:56:39<226:50:38,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6039/203307 [6:56:39<226:50:38,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6040/203307 [6:56:43<226:50:22,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6040/203307 [6:56:43<226:50:22,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6041/203307 [6:56:47<226:50:03,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   3%|▎         | 6041/203307 [6:56:47<226:50:03,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6042/203307 [6:56:51<226:50:12,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6042/203307 [6:56:51<226:50:12,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6043/203307 [6:56:55<226:49:59,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6043/203307 [6:56:55<226:49:59,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6044/203307 [6:56:59<226:49:39,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6044/203307 [6:56:59<226:49:39,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6045/203307 [6:57:03<226:49:39,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6045/203307 [6:57:03<226:49:39,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6046/203307 [6:57:07<226:49:36,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6046/203307 [6:57:07<226:49:36,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6047/203307 [6:57:11<226:49:26,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6047/203307 [6:57:11<226:49:27,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6048/203307 [6:57:15<226:49:08,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6048/203307 [6:57:15<226:49:08,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6049/203307 [6:57:19<226:48:51,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6049/203307 [6:57:19<226:48:51,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6050/203307 [6:57:23<226:49:00,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6050/203307 [6:57:23<226:49:01,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6051/203307 [6:57:28<226:49:10,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6051/203307 [6:57:28<226:49:10,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6052/203307 [6:57:32<226:48:51,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6052/203307 [6:57:32<226:48:51,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6053/203307 [6:57:36<226:48:52,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6053/203307 [6:57:36<226:48:52,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6054/203307 [6:57:40<226:48:34,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6054/203307 [6:57:40<226:48:34,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6055/203307 [6:57:44<226:48:35,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6055/203307 [6:57:44<226:48:35,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6056/203307 [6:57:48<226:48:17,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6056/203307 [6:57:48<226:48:17,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6057/203307 [6:57:51<226:47:56,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6057/203307 [6:57:51<226:47:56,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6058/203307 [6:57:55<226:47:36,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6058/203307 [6:57:55<226:47:36,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6059/203307 [6:58:00<226:47:52,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6059/203307 [6:58:00<226:47:52,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6060/203307 [6:58:03<226:47:37,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6060/203307 [6:58:03<226:47:37,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6061/203307 [6:58:07<226:47:20,  0.24it/s, v_num=t5e6, training/loss=0.0986]Epoch 0:   3%|▎         | 6061/203307 [6:58:07<226:47:20,  0.24it/s, v_num=t5e6, training/loss=0.102] Epoch 0:   3%|▎         | 6062/203307 [6:58:12<226:47:23,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6062/203307 [6:58:12<226:47:23,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6063/203307 [6:58:16<226:47:14,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6063/203307 [6:58:16<226:47:14,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6064/203307 [6:58:20<226:47:09,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6064/203307 [6:58:20<226:47:09,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6065/203307 [6:58:23<226:46:50,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6065/203307 [6:58:23<226:46:50,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6066/203307 [6:58:27<226:46:29,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6066/203307 [6:58:27<226:46:30,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6067/203307 [6:58:32<226:46:43,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6067/203307 [6:58:32<226:46:43,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6068/203307 [6:58:36<226:46:47,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6068/203307 [6:58:36<226:46:47,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6069/203307 [6:58:40<226:46:25,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6069/203307 [6:58:40<226:46:25,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6070/203307 [6:58:44<226:46:23,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6070/203307 [6:58:44<226:46:23,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6071/203307 [6:58:48<226:46:12,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6071/203307 [6:58:48<226:46:12,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6072/203307 [6:58:51<226:45:53,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6072/203307 [6:58:51<226:45:53,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6073/203307 [6:58:56<226:45:49,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6073/203307 [6:58:56<226:45:49,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6074/203307 [6:58:59<226:45:29,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6074/203307 [6:58:59<226:45:29,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6075/203307 [6:59:04<226:45:39,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6075/203307 [6:59:04<226:45:39,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6076/203307 [6:59:07<226:45:20,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6076/203307 [6:59:07<226:45:20,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6077/203307 [6:59:12<226:45:23,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6077/203307 [6:59:12<226:45:23,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6078/203307 [6:59:16<226:45:24,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6078/203307 [6:59:16<226:45:25,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6079/203307 [6:59:20<226:45:17,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6079/203307 [6:59:20<226:45:17,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6080/203307 [6:59:24<226:44:58,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6080/203307 [6:59:24<226:44:58,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6081/203307 [6:59:28<226:44:41,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6081/203307 [6:59:28<226:44:42,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6082/203307 [6:59:32<226:44:37,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6082/203307 [6:59:32<226:44:37,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6083/203307 [6:59:36<226:44:28,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6083/203307 [6:59:36<226:44:28,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6084/203307 [6:59:40<226:44:36,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6084/203307 [6:59:40<226:44:36,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6085/203307 [6:59:45<226:44:38,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6085/203307 [6:59:45<226:44:38,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6086/203307 [6:59:48<226:44:21,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6086/203307 [6:59:48<226:44:21,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6087/203307 [6:59:53<226:44:31,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6087/203307 [6:59:53<226:44:32,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6088/203307 [6:59:57<226:44:14,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6088/203307 [6:59:57<226:44:14,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6089/203307 [7:00:00<226:43:56,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6089/203307 [7:00:00<226:43:56,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6090/203307 [7:00:04<226:43:38,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6090/203307 [7:00:04<226:43:38,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6091/203307 [7:00:08<226:43:36,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6091/203307 [7:00:08<226:43:36,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6092/203307 [7:00:13<226:43:41,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6092/203307 [7:00:13<226:43:41,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6093/203307 [7:00:17<226:43:26,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6093/203307 [7:00:17<226:43:26,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6094/203307 [7:00:21<226:43:33,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6094/203307 [7:00:21<226:43:33,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6095/203307 [7:00:26<226:43:43,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6095/203307 [7:00:26<226:43:43,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6096/203307 [7:00:29<226:43:28,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6096/203307 [7:00:29<226:43:28,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6097/203307 [7:00:33<226:43:10,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6097/203307 [7:00:33<226:43:10,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6098/203307 [7:00:37<226:42:53,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6098/203307 [7:00:37<226:42:53,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6099/203307 [7:00:41<226:42:45,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6099/203307 [7:00:41<226:42:46,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6100/203307 [7:00:45<226:42:52,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6100/203307 [7:00:45<226:42:52,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6101/203307 [7:00:49<226:42:36,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   3%|▎         | 6101/203307 [7:00:49<226:42:36,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6102/203307 [7:00:53<226:42:18,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6102/203307 [7:00:53<226:42:18,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6103/203307 [7:00:58<226:42:33,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6103/203307 [7:00:58<226:42:33,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6104/203307 [7:01:01<226:42:17,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6104/203307 [7:01:01<226:42:17,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6105/203307 [7:01:05<226:41:59,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6105/203307 [7:01:05<226:41:59,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6106/203307 [7:01:09<226:41:42,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6106/203307 [7:01:09<226:41:42,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6107/203307 [7:01:13<226:41:35,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6107/203307 [7:01:13<226:41:35,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6108/203307 [7:01:17<226:41:20,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6108/203307 [7:01:17<226:41:20,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6109/203307 [7:01:21<226:41:27,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6109/203307 [7:01:21<226:41:27,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6110/203307 [7:01:25<226:41:09,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6110/203307 [7:01:25<226:41:09,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6111/203307 [7:01:29<226:41:21,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6111/203307 [7:01:29<226:41:21,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6112/203307 [7:01:34<226:41:23,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6112/203307 [7:01:34<226:41:23,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6113/203307 [7:01:38<226:41:07,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6113/203307 [7:01:38<226:41:07,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6114/203307 [7:01:41<226:40:48,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6114/203307 [7:01:41<226:40:48,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6115/203307 [7:01:45<226:40:40,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6115/203307 [7:01:45<226:40:40,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6116/203307 [7:01:49<226:40:21,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6116/203307 [7:01:49<226:40:21,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6117/203307 [7:01:53<226:40:28,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6117/203307 [7:01:53<226:40:29,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6118/203307 [7:01:58<226:40:28,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6118/203307 [7:01:58<226:40:29,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6119/203307 [7:02:02<226:40:17,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6119/203307 [7:02:02<226:40:17,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6120/203307 [7:02:06<226:40:24,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6120/203307 [7:02:06<226:40:24,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6121/203307 [7:02:10<226:40:09,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6121/203307 [7:02:10<226:40:09,  0.24it/s, v_num=t5e6, training/loss=0.102] Epoch 0:   3%|▎         | 6122/203307 [7:02:14<226:39:51,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6122/203307 [7:02:14<226:39:51,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6123/203307 [7:02:18<226:39:45,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6123/203307 [7:02:18<226:39:45,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6124/203307 [7:02:21<226:39:27,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6124/203307 [7:02:21<226:39:27,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6125/203307 [7:02:26<226:39:34,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6125/203307 [7:02:26<226:39:34,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6126/203307 [7:02:30<226:39:18,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6126/203307 [7:02:30<226:39:18,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6127/203307 [7:02:34<226:39:19,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6127/203307 [7:02:34<226:39:19,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6128/203307 [7:02:38<226:39:22,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6128/203307 [7:02:38<226:39:22,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6129/203307 [7:02:43<226:39:26,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6129/203307 [7:02:43<226:39:26,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6130/203307 [7:02:46<226:39:07,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6130/203307 [7:02:46<226:39:08,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6131/203307 [7:02:50<226:38:55,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6131/203307 [7:02:50<226:38:55,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6132/203307 [7:02:54<226:38:39,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6132/203307 [7:02:54<226:38:39,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6133/203307 [7:02:58<226:38:24,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6133/203307 [7:02:58<226:38:24,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6134/203307 [7:03:02<226:38:32,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6134/203307 [7:03:02<226:38:32,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6135/203307 [7:03:06<226:38:22,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6135/203307 [7:03:06<226:38:22,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6136/203307 [7:03:10<226:38:19,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6136/203307 [7:03:10<226:38:19,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6137/203307 [7:03:15<226:38:25,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6137/203307 [7:03:15<226:38:25,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6138/203307 [7:03:19<226:38:09,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6138/203307 [7:03:19<226:38:09,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6139/203307 [7:03:23<226:38:03,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6139/203307 [7:03:23<226:38:03,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6140/203307 [7:03:27<226:37:47,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6140/203307 [7:03:27<226:37:47,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6141/203307 [7:03:30<226:37:29,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   3%|▎         | 6141/203307 [7:03:30<226:37:29,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6142/203307 [7:03:35<226:37:35,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6142/203307 [7:03:35<226:37:35,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6143/203307 [7:03:39<226:37:27,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6143/203307 [7:03:39<226:37:28,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6144/203307 [7:03:42<226:37:08,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6144/203307 [7:03:42<226:37:08,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6145/203307 [7:03:47<226:37:09,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6145/203307 [7:03:47<226:37:09,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6146/203307 [7:03:51<226:37:12,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6146/203307 [7:03:51<226:37:13,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6147/203307 [7:03:55<226:37:02,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6147/203307 [7:03:55<226:37:02,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6148/203307 [7:03:59<226:36:43,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6148/203307 [7:03:59<226:36:43,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6149/203307 [7:04:02<226:36:25,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6149/203307 [7:04:02<226:36:26,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6150/203307 [7:04:07<226:36:33,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6150/203307 [7:04:07<226:36:33,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6151/203307 [7:04:11<226:36:23,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6151/203307 [7:04:11<226:36:23,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6152/203307 [7:04:15<226:36:04,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6152/203307 [7:04:15<226:36:04,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6153/203307 [7:04:19<226:36:04,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6153/203307 [7:04:19<226:36:04,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6154/203307 [7:04:23<226:36:03,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6154/203307 [7:04:23<226:36:03,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6155/203307 [7:04:28<226:36:12,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6155/203307 [7:04:28<226:36:12,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6156/203307 [7:04:31<226:35:53,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6156/203307 [7:04:31<226:35:53,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6157/203307 [7:04:35<226:35:33,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6157/203307 [7:04:35<226:35:33,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6158/203307 [7:04:39<226:35:16,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6158/203307 [7:04:39<226:35:16,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6159/203307 [7:04:43<226:35:29,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6159/203307 [7:04:43<226:35:29,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6160/203307 [7:04:47<226:35:09,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6160/203307 [7:04:47<226:35:09,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6161/203307 [7:04:51<226:34:50,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   3%|▎         | 6161/203307 [7:04:51<226:34:50,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6162/203307 [7:04:55<226:34:53,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6162/203307 [7:04:55<226:34:54,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6163/203307 [7:05:00<226:35:04,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6163/203307 [7:05:00<226:35:04,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6164/203307 [7:05:03<226:34:51,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6164/203307 [7:05:03<226:34:51,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6165/203307 [7:05:07<226:34:32,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6165/203307 [7:05:07<226:34:32,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6166/203307 [7:05:11<226:34:13,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6166/203307 [7:05:11<226:34:13,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6167/203307 [7:05:15<226:34:26,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6167/203307 [7:05:15<226:34:26,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6168/203307 [7:05:19<226:34:09,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6168/203307 [7:05:19<226:34:09,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6169/203307 [7:05:23<226:33:53,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6169/203307 [7:05:23<226:33:53,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6170/203307 [7:05:27<226:33:53,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6170/203307 [7:05:27<226:33:53,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6171/203307 [7:05:31<226:33:43,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6171/203307 [7:05:31<226:33:44,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6172/203307 [7:05:36<226:33:48,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6172/203307 [7:05:36<226:33:48,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6173/203307 [7:05:39<226:33:31,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6173/203307 [7:05:39<226:33:31,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6174/203307 [7:05:43<226:33:13,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6174/203307 [7:05:43<226:33:13,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6175/203307 [7:05:48<226:33:27,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6175/203307 [7:05:48<226:33:27,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6176/203307 [7:05:51<226:33:08,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6176/203307 [7:05:51<226:33:08,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6177/203307 [7:05:55<226:32:50,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6177/203307 [7:05:55<226:32:51,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6178/203307 [7:05:59<226:32:52,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6178/203307 [7:05:59<226:32:52,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6179/203307 [7:06:03<226:32:42,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6179/203307 [7:06:03<226:32:42,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6180/203307 [7:06:07<226:32:23,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6180/203307 [7:06:07<226:32:24,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6181/203307 [7:06:11<226:32:28,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6181/203307 [7:06:12<226:32:28,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6182/203307 [7:06:15<226:32:12,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6182/203307 [7:06:15<226:32:12,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6183/203307 [7:06:19<226:32:02,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6183/203307 [7:06:19<226:32:02,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6184/203307 [7:06:24<226:32:07,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6184/203307 [7:06:24<226:32:07,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6185/203307 [7:06:27<226:31:45,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6185/203307 [7:06:27<226:31:45,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6186/203307 [7:06:31<226:31:26,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6186/203307 [7:06:31<226:31:26,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6187/203307 [7:06:35<226:31:36,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6187/203307 [7:06:35<226:31:36,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6188/203307 [7:06:39<226:31:15,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6188/203307 [7:06:39<226:31:15,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6189/203307 [7:06:43<226:31:15,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6189/203307 [7:06:43<226:31:16,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6190/203307 [7:06:47<226:31:11,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6190/203307 [7:06:47<226:31:11,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6191/203307 [7:06:51<226:31:01,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6191/203307 [7:06:51<226:31:01,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6192/203307 [7:06:56<226:31:04,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6192/203307 [7:06:56<226:31:04,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6193/203307 [7:06:59<226:30:45,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6193/203307 [7:06:59<226:30:46,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6194/203307 [7:07:03<226:30:27,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6194/203307 [7:07:03<226:30:27,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6195/203307 [7:07:08<226:30:36,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6195/203307 [7:07:08<226:30:37,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6196/203307 [7:07:11<226:30:17,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6196/203307 [7:07:11<226:30:17,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6197/203307 [7:07:15<226:29:58,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6197/203307 [7:07:15<226:29:59,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6198/203307 [7:07:20<226:30:05,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6198/203307 [7:07:20<226:30:05,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6199/203307 [7:07:24<226:30:01,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6199/203307 [7:07:24<226:30:01,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6200/203307 [7:07:28<226:30:09,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6200/203307 [7:07:28<226:30:10,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6201/203307 [7:07:32<226:29:53,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   3%|▎         | 6201/203307 [7:07:32<226:29:53,  0.24it/s, v_num=t5e6, training/loss=0.101] Epoch 0:   3%|▎         | 6202/203307 [7:07:36<226:29:34,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6202/203307 [7:07:36<226:29:34,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6203/203307 [7:07:40<226:29:43,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6203/203307 [7:07:40<226:29:43,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6204/203307 [7:07:44<226:29:26,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6204/203307 [7:07:44<226:29:26,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6205/203307 [7:07:48<226:29:06,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6205/203307 [7:07:48<226:29:06,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6206/203307 [7:07:51<226:28:46,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6206/203307 [7:07:51<226:28:47,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6207/203307 [7:07:56<226:28:58,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6207/203307 [7:07:56<226:28:58,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6208/203307 [7:08:00<226:28:59,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6208/203307 [7:08:00<226:28:59,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6209/203307 [7:08:05<226:29:04,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6209/203307 [7:08:05<226:29:04,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6210/203307 [7:08:08<226:28:45,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6210/203307 [7:08:08<226:28:45,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6211/203307 [7:08:12<226:28:35,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6211/203307 [7:08:12<226:28:35,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6212/203307 [7:08:17<226:28:39,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6212/203307 [7:08:17<226:28:39,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6213/203307 [7:08:20<226:28:24,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6213/203307 [7:08:20<226:28:24,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6214/203307 [7:08:24<226:28:08,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6214/203307 [7:08:24<226:28:08,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6215/203307 [7:08:29<226:28:21,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6215/203307 [7:08:29<226:28:21,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6216/203307 [7:08:33<226:28:05,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6216/203307 [7:08:33<226:28:05,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6217/203307 [7:08:37<226:28:13,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6217/203307 [7:08:37<226:28:13,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6218/203307 [7:08:41<226:27:56,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6218/203307 [7:08:41<226:27:56,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6219/203307 [7:08:45<226:27:48,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6219/203307 [7:08:45<226:27:48,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6220/203307 [7:08:49<226:27:51,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6220/203307 [7:08:49<226:27:51,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6221/203307 [7:08:53<226:27:36,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   3%|▎         | 6221/203307 [7:08:53<226:27:36,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6222/203307 [7:08:57<226:27:20,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6222/203307 [7:08:57<226:27:20,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6223/203307 [7:09:01<226:27:11,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6223/203307 [7:09:01<226:27:11,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6224/203307 [7:09:05<226:27:15,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6224/203307 [7:09:05<226:27:15,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6225/203307 [7:09:10<226:27:22,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6225/203307 [7:09:10<226:27:22,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6226/203307 [7:09:14<226:27:21,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6226/203307 [7:09:14<226:27:21,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6227/203307 [7:09:18<226:27:12,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6227/203307 [7:09:18<226:27:12,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6228/203307 [7:09:22<226:27:13,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6228/203307 [7:09:22<226:27:13,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6229/203307 [7:09:26<226:26:57,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6229/203307 [7:09:26<226:26:58,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6230/203307 [7:09:30<226:26:40,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6230/203307 [7:09:30<226:26:40,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6231/203307 [7:09:34<226:26:31,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6231/203307 [7:09:34<226:26:31,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6232/203307 [7:09:37<226:26:13,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6232/203307 [7:09:37<226:26:13,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6233/203307 [7:09:42<226:26:20,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6233/203307 [7:09:42<226:26:20,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6234/203307 [7:09:46<226:26:27,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6234/203307 [7:09:46<226:26:27,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6235/203307 [7:09:50<226:26:25,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6235/203307 [7:09:50<226:26:25,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6236/203307 [7:09:54<226:26:09,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6236/203307 [7:09:54<226:26:09,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6237/203307 [7:09:59<226:26:12,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6237/203307 [7:09:59<226:26:12,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6238/203307 [7:10:02<226:25:55,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6238/203307 [7:10:02<226:25:55,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6239/203307 [7:10:06<226:25:47,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6239/203307 [7:10:06<226:25:47,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6240/203307 [7:10:10<226:25:30,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6240/203307 [7:10:10<226:25:30,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6241/203307 [7:10:15<226:25:35,  0.24it/s, v_num=t5e6, training/loss=0.0972]Epoch 0:   3%|▎         | 6241/203307 [7:10:15<226:25:35,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6242/203307 [7:10:19<226:25:44,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6242/203307 [7:10:19<226:25:44,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6243/203307 [7:10:23<226:25:34,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6243/203307 [7:10:23<226:25:34,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6244/203307 [7:10:27<226:25:33,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6244/203307 [7:10:27<226:25:33,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6245/203307 [7:10:32<226:25:36,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6245/203307 [7:10:32<226:25:36,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6246/203307 [7:10:35<226:25:20,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6246/203307 [7:10:35<226:25:20,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6247/203307 [7:10:39<226:25:12,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6247/203307 [7:10:39<226:25:12,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6248/203307 [7:10:43<226:24:56,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6248/203307 [7:10:43<226:24:56,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6249/203307 [7:10:47<226:24:39,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6249/203307 [7:10:47<226:24:39,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6250/203307 [7:10:52<226:24:50,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6250/203307 [7:10:52<226:24:50,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6251/203307 [7:10:55<226:24:40,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6251/203307 [7:10:55<226:24:40,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6252/203307 [7:10:59<226:24:22,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6252/203307 [7:10:59<226:24:22,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6253/203307 [7:11:04<226:24:28,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6253/203307 [7:11:04<226:24:28,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6254/203307 [7:11:07<226:24:12,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6254/203307 [7:11:07<226:24:12,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6255/203307 [7:11:11<226:24:00,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6255/203307 [7:11:11<226:24:00,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6256/203307 [7:11:15<226:23:45,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6256/203307 [7:11:15<226:23:46,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6257/203307 [7:11:19<226:23:30,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6257/203307 [7:11:19<226:23:31,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6258/203307 [7:11:23<226:23:16,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6258/203307 [7:11:23<226:23:16,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6259/203307 [7:11:27<226:23:29,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6259/203307 [7:11:27<226:23:29,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6260/203307 [7:11:31<226:23:12,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6260/203307 [7:11:31<226:23:12,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6261/203307 [7:11:35<226:22:57,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6261/203307 [7:11:35<226:22:57,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6262/203307 [7:11:39<226:23:03,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6262/203307 [7:11:39<226:23:03,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6263/203307 [7:11:43<226:22:54,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6263/203307 [7:11:43<226:22:54,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6264/203307 [7:11:47<226:22:37,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6264/203307 [7:11:47<226:22:38,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6265/203307 [7:11:51<226:22:25,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6265/203307 [7:11:51<226:22:25,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6266/203307 [7:11:55<226:22:07,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6266/203307 [7:11:55<226:22:07,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6267/203307 [7:11:59<226:22:25,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6267/203307 [7:11:59<226:22:25,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6268/203307 [7:12:03<226:22:10,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6268/203307 [7:12:03<226:22:11,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6269/203307 [7:12:07<226:21:54,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6269/203307 [7:12:07<226:21:54,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6270/203307 [7:12:11<226:21:57,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6270/203307 [7:12:11<226:21:57,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6271/203307 [7:12:16<226:21:56,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6271/203307 [7:12:16<226:21:57,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6272/203307 [7:12:19<226:21:41,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6272/203307 [7:12:19<226:21:41,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6273/203307 [7:12:23<226:21:24,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6273/203307 [7:12:23<226:21:24,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6274/203307 [7:12:27<226:21:09,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6274/203307 [7:12:27<226:21:09,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6275/203307 [7:12:32<226:21:22,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6275/203307 [7:12:32<226:21:23,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6276/203307 [7:12:36<226:21:26,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6276/203307 [7:12:36<226:21:26,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6277/203307 [7:12:40<226:21:10,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6277/203307 [7:12:40<226:21:10,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6278/203307 [7:12:44<226:21:09,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6278/203307 [7:12:44<226:21:09,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6279/203307 [7:12:48<226:21:01,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6279/203307 [7:12:48<226:21:01,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6280/203307 [7:12:52<226:20:57,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6280/203307 [7:12:52<226:20:57,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6281/203307 [7:12:56<226:20:41,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   3%|▎         | 6281/203307 [7:12:56<226:20:41,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6282/203307 [7:12:59<226:20:21,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6282/203307 [7:12:59<226:20:21,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6283/203307 [7:13:04<226:20:13,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6283/203307 [7:13:04<226:20:14,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6284/203307 [7:13:08<226:20:21,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6284/203307 [7:13:08<226:20:21,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6285/203307 [7:13:12<226:20:21,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6285/203307 [7:13:12<226:20:22,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6286/203307 [7:13:16<226:20:06,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6286/203307 [7:13:16<226:20:07,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6287/203307 [7:13:21<226:20:17,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6287/203307 [7:13:21<226:20:17,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6288/203307 [7:13:24<226:20:00,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6288/203307 [7:13:24<226:20:00,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6289/203307 [7:13:29<226:19:59,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6289/203307 [7:13:29<226:19:59,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6290/203307 [7:13:32<226:19:42,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6290/203307 [7:13:32<226:19:42,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6291/203307 [7:13:36<226:19:31,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6291/203307 [7:13:36<226:19:31,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6292/203307 [7:13:41<226:19:35,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6292/203307 [7:13:41<226:19:35,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6293/203307 [7:13:45<226:19:42,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6293/203307 [7:13:45<226:19:42,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6294/203307 [7:13:49<226:19:23,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6294/203307 [7:13:49<226:19:24,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6295/203307 [7:13:53<226:19:33,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6295/203307 [7:13:53<226:19:33,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6296/203307 [7:13:57<226:19:14,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6296/203307 [7:13:57<226:19:15,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6297/203307 [7:14:01<226:18:59,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6297/203307 [7:14:01<226:18:59,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6298/203307 [7:14:05<226:18:57,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6298/203307 [7:14:05<226:18:57,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6299/203307 [7:14:09<226:18:48,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6299/203307 [7:14:09<226:18:48,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6300/203307 [7:14:13<226:18:50,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6300/203307 [7:14:13<226:18:50,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6301/203307 [7:14:17<226:18:38,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   3%|▎         | 6301/203307 [7:14:17<226:18:38,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6302/203307 [7:14:22<226:18:41,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6302/203307 [7:14:22<226:18:41,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6303/203307 [7:14:26<226:18:51,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6303/203307 [7:14:26<226:18:51,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6304/203307 [7:14:30<226:18:34,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6304/203307 [7:14:30<226:18:34,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6305/203307 [7:14:34<226:18:16,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6305/203307 [7:14:34<226:18:16,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6306/203307 [7:14:37<226:17:58,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6306/203307 [7:14:37<226:17:58,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6307/203307 [7:14:42<226:17:57,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6307/203307 [7:14:42<226:17:57,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6308/203307 [7:14:45<226:17:39,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6308/203307 [7:14:45<226:17:39,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6309/203307 [7:14:50<226:17:46,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6309/203307 [7:14:50<226:17:46,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6310/203307 [7:14:53<226:17:27,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6310/203307 [7:14:53<226:17:27,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6311/203307 [7:14:58<226:17:40,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6311/203307 [7:14:58<226:17:40,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6312/203307 [7:15:02<226:17:41,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6312/203307 [7:15:02<226:17:42,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6313/203307 [7:15:06<226:17:24,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6313/203307 [7:15:06<226:17:24,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6314/203307 [7:15:10<226:17:05,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6314/203307 [7:15:10<226:17:05,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6315/203307 [7:15:14<226:16:57,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6315/203307 [7:15:14<226:16:57,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6316/203307 [7:15:18<226:16:53,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6316/203307 [7:15:18<226:16:53,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6317/203307 [7:15:22<226:17:01,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6317/203307 [7:15:22<226:17:01,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6318/203307 [7:15:26<226:16:43,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6318/203307 [7:15:26<226:16:43,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6319/203307 [7:15:31<226:16:53,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6319/203307 [7:15:31<226:16:53,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6320/203307 [7:15:35<226:16:54,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6320/203307 [7:15:35<226:16:54,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6321/203307 [7:15:39<226:16:38,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6321/203307 [7:15:39<226:16:38,  0.24it/s, v_num=t5e6, training/loss=0.103] Epoch 0:   3%|▎         | 6322/203307 [7:15:42<226:16:18,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6322/203307 [7:15:42<226:16:18,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6323/203307 [7:15:46<226:16:12,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6323/203307 [7:15:46<226:16:12,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6324/203307 [7:15:50<226:15:53,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6324/203307 [7:15:50<226:15:54,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6325/203307 [7:15:55<226:16:00,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6325/203307 [7:15:55<226:16:00,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6326/203307 [7:15:58<226:15:43,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6326/203307 [7:15:58<226:15:44,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6327/203307 [7:16:02<226:15:36,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6327/203307 [7:16:02<226:15:37,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6328/203307 [7:16:07<226:15:45,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6328/203307 [7:16:07<226:15:45,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6329/203307 [7:16:11<226:15:30,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6329/203307 [7:16:11<226:15:30,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6330/203307 [7:16:15<226:15:15,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6330/203307 [7:16:15<226:15:15,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6331/203307 [7:16:19<226:15:10,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6331/203307 [7:16:19<226:15:10,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6332/203307 [7:16:22<226:14:52,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6332/203307 [7:16:22<226:14:52,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6333/203307 [7:16:26<226:14:35,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6333/203307 [7:16:26<226:14:35,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6334/203307 [7:16:31<226:14:43,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6334/203307 [7:16:31<226:14:43,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6335/203307 [7:16:35<226:14:34,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6335/203307 [7:16:35<226:14:34,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6336/203307 [7:16:38<226:14:16,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6336/203307 [7:16:38<226:14:16,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6337/203307 [7:16:43<226:14:24,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6337/203307 [7:16:43<226:14:24,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6338/203307 [7:16:47<226:14:09,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6338/203307 [7:16:47<226:14:09,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6339/203307 [7:16:51<226:13:59,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6339/203307 [7:16:51<226:14:00,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6340/203307 [7:16:54<226:13:44,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6340/203307 [7:16:54<226:13:44,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6341/203307 [7:16:58<226:13:27,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6341/203307 [7:16:58<226:13:27,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6342/203307 [7:17:03<226:13:34,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6342/203307 [7:17:03<226:13:34,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6343/203307 [7:17:07<226:13:30,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6343/203307 [7:17:07<226:13:31,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6344/203307 [7:17:10<226:13:14,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6344/203307 [7:17:10<226:13:14,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6345/203307 [7:17:15<226:13:19,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6345/203307 [7:17:15<226:13:19,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6346/203307 [7:17:19<226:13:04,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6346/203307 [7:17:19<226:13:04,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6347/203307 [7:17:23<226:12:57,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6347/203307 [7:17:23<226:12:57,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6348/203307 [7:17:26<226:12:39,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6348/203307 [7:17:26<226:12:39,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6349/203307 [7:17:30<226:12:23,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6349/203307 [7:17:30<226:12:23,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6350/203307 [7:17:35<226:12:31,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6350/203307 [7:17:35<226:12:31,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6351/203307 [7:17:39<226:12:24,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6351/203307 [7:17:39<226:12:24,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6352/203307 [7:17:43<226:12:20,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6352/203307 [7:17:43<226:12:20,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6353/203307 [7:17:47<226:12:23,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6353/203307 [7:17:47<226:12:23,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6354/203307 [7:17:52<226:12:30,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6354/203307 [7:17:52<226:12:30,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6355/203307 [7:17:56<226:12:19,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6355/203307 [7:17:56<226:12:19,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6356/203307 [7:17:59<226:12:04,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6356/203307 [7:17:59<226:12:05,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6357/203307 [7:18:03<226:11:50,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6357/203307 [7:18:03<226:11:50,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6358/203307 [7:18:07<226:11:38,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6358/203307 [7:18:07<226:11:38,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6359/203307 [7:18:12<226:11:52,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6359/203307 [7:18:12<226:11:52,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6360/203307 [7:18:16<226:11:37,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6360/203307 [7:18:16<226:11:37,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6361/203307 [7:18:20<226:11:34,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   3%|▎         | 6361/203307 [7:18:20<226:11:34,  0.24it/s, v_num=t5e6, training/loss=0.089] Epoch 0:   3%|▎         | 6362/203307 [7:18:24<226:11:38,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6362/203307 [7:18:24<226:11:38,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6363/203307 [7:18:29<226:11:49,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6363/203307 [7:18:29<226:11:49,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6364/203307 [7:18:33<226:11:34,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6364/203307 [7:18:33<226:11:34,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6365/203307 [7:18:36<226:11:19,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6365/203307 [7:18:36<226:11:19,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6366/203307 [7:18:40<226:11:02,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6366/203307 [7:18:40<226:11:02,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6367/203307 [7:18:45<226:11:16,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6367/203307 [7:18:45<226:11:16,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6368/203307 [7:18:48<226:10:59,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6368/203307 [7:18:48<226:10:59,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6369/203307 [7:18:52<226:10:42,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6369/203307 [7:18:52<226:10:42,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6370/203307 [7:18:57<226:10:43,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6370/203307 [7:18:57<226:10:43,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6371/203307 [7:19:01<226:10:55,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6371/203307 [7:19:01<226:10:55,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6372/203307 [7:19:05<226:10:37,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6372/203307 [7:19:05<226:10:37,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6373/203307 [7:19:09<226:10:22,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6373/203307 [7:19:09<226:10:22,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6374/203307 [7:19:12<226:10:07,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6374/203307 [7:19:12<226:10:07,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6375/203307 [7:19:17<226:10:24,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6375/203307 [7:19:17<226:10:24,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6376/203307 [7:19:21<226:10:11,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6376/203307 [7:19:21<226:10:11,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6377/203307 [7:19:25<226:09:53,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6377/203307 [7:19:25<226:09:53,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6378/203307 [7:19:29<226:09:58,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6378/203307 [7:19:29<226:09:58,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6379/203307 [7:19:33<226:09:58,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6379/203307 [7:19:33<226:09:58,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6380/203307 [7:19:38<226:10:01,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6380/203307 [7:19:38<226:10:01,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6381/203307 [7:19:42<226:09:44,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   3%|▎         | 6381/203307 [7:19:42<226:09:44,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6382/203307 [7:19:45<226:09:26,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6382/203307 [7:19:45<226:09:27,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6383/203307 [7:19:49<226:09:10,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6383/203307 [7:19:49<226:09:11,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6384/203307 [7:19:54<226:09:18,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6384/203307 [7:19:54<226:09:18,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6385/203307 [7:19:57<226:09:00,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6385/203307 [7:19:57<226:09:00,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6386/203307 [7:20:01<226:08:41,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6386/203307 [7:20:01<226:08:42,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6387/203307 [7:20:05<226:08:45,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6387/203307 [7:20:05<226:08:45,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6388/203307 [7:20:09<226:08:43,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6388/203307 [7:20:09<226:08:43,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6389/203307 [7:20:14<226:08:49,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6389/203307 [7:20:14<226:08:49,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6390/203307 [7:20:18<226:08:36,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6390/203307 [7:20:18<226:08:36,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6391/203307 [7:20:22<226:08:20,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6391/203307 [7:20:22<226:08:20,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6392/203307 [7:20:26<226:08:26,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6392/203307 [7:20:26<226:08:26,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6393/203307 [7:20:30<226:08:14,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6393/203307 [7:20:30<226:08:14,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6394/203307 [7:20:34<226:07:59,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6394/203307 [7:20:34<226:07:59,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6395/203307 [7:20:38<226:08:02,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6395/203307 [7:20:38<226:08:02,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6396/203307 [7:20:42<226:07:46,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6396/203307 [7:20:42<226:07:46,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6397/203307 [7:20:46<226:07:52,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6397/203307 [7:20:46<226:07:52,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6398/203307 [7:20:50<226:07:36,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6398/203307 [7:20:50<226:07:36,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6399/203307 [7:20:54<226:07:20,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6399/203307 [7:20:54<226:07:20,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6400/203307 [7:20:58<226:07:28,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6400/203307 [7:20:58<226:07:28,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6401/203307 [7:21:02<226:07:14,  0.24it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   3%|▎         | 6401/203307 [7:21:02<226:07:14,  0.24it/s, v_num=t5e6, training/loss=0.085] Epoch 0:   3%|▎         | 6402/203307 [7:21:06<226:06:58,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6402/203307 [7:21:06<226:06:58,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6403/203307 [7:21:10<226:07:01,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6403/203307 [7:21:10<226:07:01,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6404/203307 [7:21:14<226:06:45,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6404/203307 [7:21:14<226:06:45,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6405/203307 [7:21:18<226:06:33,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6405/203307 [7:21:18<226:06:33,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6406/203307 [7:21:22<226:06:39,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6406/203307 [7:21:22<226:06:39,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6407/203307 [7:21:26<226:06:23,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6407/203307 [7:21:26<226:06:23,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6408/203307 [7:21:30<226:06:05,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6408/203307 [7:21:30<226:06:06,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6409/203307 [7:21:34<226:06:12,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6409/203307 [7:21:34<226:06:13,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6410/203307 [7:21:38<226:06:00,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6410/203307 [7:21:38<226:06:00,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6411/203307 [7:21:42<226:05:43,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6411/203307 [7:21:42<226:05:43,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6412/203307 [7:21:46<226:05:46,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6412/203307 [7:21:46<226:05:46,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6413/203307 [7:21:50<226:05:29,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6413/203307 [7:21:50<226:05:29,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6414/203307 [7:21:54<226:05:13,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6414/203307 [7:21:54<226:05:13,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6415/203307 [7:21:58<226:05:17,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6415/203307 [7:21:58<226:05:17,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6416/203307 [7:22:02<226:04:59,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6416/203307 [7:22:02<226:04:59,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6417/203307 [7:22:06<226:05:03,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6417/203307 [7:22:06<226:05:03,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6418/203307 [7:22:10<226:04:47,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6418/203307 [7:22:10<226:04:47,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6419/203307 [7:22:14<226:04:31,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6419/203307 [7:22:14<226:04:32,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6420/203307 [7:22:18<226:04:40,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6420/203307 [7:22:18<226:04:40,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6421/203307 [7:22:22<226:04:26,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   3%|▎         | 6421/203307 [7:22:22<226:04:27,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6422/203307 [7:22:26<226:04:11,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6422/203307 [7:22:26<226:04:12,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6423/203307 [7:22:30<226:04:17,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6423/203307 [7:22:30<226:04:17,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6424/203307 [7:22:34<226:04:14,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6424/203307 [7:22:34<226:04:14,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6425/203307 [7:22:39<226:04:20,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6425/203307 [7:22:39<226:04:20,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6426/203307 [7:22:43<226:04:02,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6426/203307 [7:22:43<226:04:02,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6427/203307 [7:22:46<226:03:47,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6427/203307 [7:22:46<226:03:47,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6428/203307 [7:22:51<226:03:50,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6428/203307 [7:22:51<226:03:50,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6429/203307 [7:22:54<226:03:34,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6429/203307 [7:22:54<226:03:34,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6430/203307 [7:22:58<226:03:17,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6430/203307 [7:22:58<226:03:17,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6431/203307 [7:23:02<226:02:59,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6431/203307 [7:23:02<226:03:00,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6432/203307 [7:23:06<226:03:03,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6432/203307 [7:23:06<226:03:04,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6433/203307 [7:23:10<226:03:01,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6433/203307 [7:23:10<226:03:01,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6434/203307 [7:23:15<226:03:06,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6434/203307 [7:23:15<226:03:06,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6435/203307 [7:23:19<226:02:49,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6435/203307 [7:23:19<226:02:49,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6436/203307 [7:23:22<226:02:31,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6436/203307 [7:23:22<226:02:31,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6437/203307 [7:23:27<226:02:35,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6437/203307 [7:23:27<226:02:35,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6438/203307 [7:23:30<226:02:17,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6438/203307 [7:23:30<226:02:17,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6439/203307 [7:23:34<226:02:01,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6439/203307 [7:23:34<226:02:01,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6440/203307 [7:23:38<226:01:43,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6440/203307 [7:23:38<226:01:44,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6441/203307 [7:23:42<226:01:49,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   3%|▎         | 6441/203307 [7:23:42<226:01:49,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6442/203307 [7:23:47<226:01:54,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6442/203307 [7:23:47<226:01:55,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6443/203307 [7:23:50<226:01:40,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6443/203307 [7:23:50<226:01:40,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6444/203307 [7:23:54<226:01:23,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6444/203307 [7:23:54<226:01:23,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6445/203307 [7:23:59<226:01:27,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6445/203307 [7:23:59<226:01:27,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6446/203307 [7:24:02<226:01:10,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6446/203307 [7:24:02<226:01:10,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6447/203307 [7:24:06<226:00:53,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6447/203307 [7:24:06<226:00:53,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6448/203307 [7:24:10<226:00:36,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6448/203307 [7:24:10<226:00:36,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6449/203307 [7:24:14<226:00:41,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6449/203307 [7:24:14<226:00:41,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6450/203307 [7:24:19<226:00:47,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6450/203307 [7:24:19<226:00:47,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6451/203307 [7:24:23<226:00:42,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6451/203307 [7:24:23<226:00:42,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6452/203307 [7:24:26<226:00:24,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6452/203307 [7:24:26<226:00:24,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6453/203307 [7:24:31<226:00:23,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6453/203307 [7:24:31<226:00:24,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6454/203307 [7:24:34<226:00:06,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6454/203307 [7:24:34<226:00:06,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6455/203307 [7:24:38<225:59:48,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6455/203307 [7:24:38<225:59:48,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6456/203307 [7:24:42<225:59:30,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6456/203307 [7:24:42<225:59:30,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6457/203307 [7:24:45<225:59:12,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6457/203307 [7:24:45<225:59:12,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6458/203307 [7:24:50<225:59:20,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6458/203307 [7:24:50<225:59:20,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6459/203307 [7:24:54<225:59:27,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6459/203307 [7:24:54<225:59:28,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6460/203307 [7:24:58<225:59:22,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6460/203307 [7:24:58<225:59:22,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6461/203307 [7:25:02<225:59:05,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:   3%|▎         | 6461/203307 [7:25:02<225:59:05,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6462/203307 [7:25:06<225:59:05,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6462/203307 [7:25:06<225:59:05,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6463/203307 [7:25:10<225:58:48,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6463/203307 [7:25:10<225:58:48,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6464/203307 [7:25:14<225:58:30,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6464/203307 [7:25:14<225:58:30,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6465/203307 [7:25:18<225:58:15,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6465/203307 [7:25:18<225:58:15,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6466/203307 [7:25:21<225:57:58,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6466/203307 [7:25:21<225:57:58,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6467/203307 [7:25:26<225:58:08,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6467/203307 [7:25:26<225:58:08,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6468/203307 [7:25:30<225:57:52,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6468/203307 [7:25:30<225:57:53,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6469/203307 [7:25:34<225:57:50,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6469/203307 [7:25:34<225:57:50,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6470/203307 [7:25:38<225:57:52,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6470/203307 [7:25:38<225:57:52,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6471/203307 [7:25:42<225:57:35,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6471/203307 [7:25:42<225:57:35,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6472/203307 [7:25:46<225:57:17,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6472/203307 [7:25:46<225:57:17,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6473/203307 [7:25:49<225:57:02,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6473/203307 [7:25:49<225:57:02,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6474/203307 [7:25:53<225:56:49,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6474/203307 [7:25:53<225:56:49,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6475/203307 [7:25:58<225:56:56,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6475/203307 [7:25:58<225:56:56,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6476/203307 [7:26:01<225:56:40,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6476/203307 [7:26:01<225:56:40,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6477/203307 [7:26:05<225:56:22,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6477/203307 [7:26:05<225:56:22,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6478/203307 [7:26:10<225:56:26,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6478/203307 [7:26:10<225:56:26,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6479/203307 [7:26:13<225:56:09,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6479/203307 [7:26:13<225:56:09,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6480/203307 [7:26:17<225:55:55,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6480/203307 [7:26:17<225:55:55,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6481/203307 [7:26:21<225:55:41,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6481/203307 [7:26:21<225:55:42,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6482/203307 [7:26:25<225:55:28,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6482/203307 [7:26:25<225:55:28,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6483/203307 [7:26:29<225:55:16,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6483/203307 [7:26:29<225:55:16,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6484/203307 [7:26:33<225:55:24,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6484/203307 [7:26:33<225:55:25,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6485/203307 [7:26:37<225:55:09,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6485/203307 [7:26:37<225:55:10,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6486/203307 [7:26:41<225:54:58,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6486/203307 [7:26:41<225:54:59,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6487/203307 [7:26:45<225:55:01,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6487/203307 [7:26:45<225:55:01,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6488/203307 [7:26:49<225:54:44,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6488/203307 [7:26:49<225:54:44,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6489/203307 [7:26:53<225:54:27,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6489/203307 [7:26:53<225:54:27,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6490/203307 [7:26:56<225:54:12,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6490/203307 [7:26:56<225:54:12,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6491/203307 [7:27:00<225:53:55,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6491/203307 [7:27:00<225:53:55,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6492/203307 [7:27:05<225:54:01,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6492/203307 [7:27:05<225:54:01,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6493/203307 [7:27:09<225:54:05,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6493/203307 [7:27:09<225:54:05,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6494/203307 [7:27:13<225:53:48,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6494/203307 [7:27:13<225:53:48,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6495/203307 [7:27:17<225:53:50,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6495/203307 [7:27:17<225:53:50,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6496/203307 [7:27:21<225:53:46,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6496/203307 [7:27:21<225:53:46,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6497/203307 [7:27:25<225:53:31,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6497/203307 [7:27:25<225:53:31,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6498/203307 [7:27:29<225:53:19,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6498/203307 [7:27:29<225:53:19,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6499/203307 [7:27:32<225:53:03,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6499/203307 [7:27:32<225:53:03,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6500/203307 [7:27:37<225:53:09,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6500/203307 [7:27:37<225:53:09,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6501/203307 [7:27:41<225:53:15,  0.24it/s, v_num=t5e6, training/loss=0.0959]Epoch 0:   3%|▎         | 6501/203307 [7:27:41<225:53:15,  0.24it/s, v_num=t5e6, training/loss=0.100] Epoch 0:   3%|▎         | 6502/203307 [7:27:45<225:52:59,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6502/203307 [7:27:45<225:52:59,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6503/203307 [7:27:49<225:52:59,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6503/203307 [7:27:49<225:52:59,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6504/203307 [7:27:53<225:52:44,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6504/203307 [7:27:53<225:52:44,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6505/203307 [7:27:57<225:52:43,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6505/203307 [7:27:57<225:52:43,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6506/203307 [7:28:01<225:52:28,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6506/203307 [7:28:01<225:52:28,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6507/203307 [7:28:05<225:52:12,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6507/203307 [7:28:05<225:52:12,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6508/203307 [7:28:09<225:51:54,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6508/203307 [7:28:09<225:51:54,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6509/203307 [7:28:13<225:52:01,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6509/203307 [7:28:13<225:52:02,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6510/203307 [7:28:18<225:52:06,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6510/203307 [7:28:18<225:52:06,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6511/203307 [7:28:21<225:51:51,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6511/203307 [7:28:21<225:51:51,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6512/203307 [7:28:26<225:51:53,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6512/203307 [7:28:26<225:51:53,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6513/203307 [7:28:29<225:51:35,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6513/203307 [7:28:29<225:51:36,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6514/203307 [7:28:33<225:51:30,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6514/203307 [7:28:33<225:51:30,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6515/203307 [7:28:37<225:51:15,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6515/203307 [7:28:37<225:51:15,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6516/203307 [7:28:41<225:50:58,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6516/203307 [7:28:41<225:50:59,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6517/203307 [7:28:45<225:51:02,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6517/203307 [7:28:45<225:51:02,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6518/203307 [7:28:49<225:50:47,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6518/203307 [7:28:49<225:50:47,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6519/203307 [7:28:53<225:50:49,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6519/203307 [7:28:53<225:50:49,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6520/203307 [7:28:58<225:50:50,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6520/203307 [7:28:58<225:50:51,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6521/203307 [7:29:01<225:50:34,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 6521/203307 [7:29:01<225:50:34,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6522/203307 [7:29:05<225:50:16,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6522/203307 [7:29:05<225:50:16,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6523/203307 [7:29:09<225:50:13,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6523/203307 [7:29:09<225:50:13,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6524/203307 [7:29:13<225:49:55,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6524/203307 [7:29:13<225:49:55,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6525/203307 [7:29:17<225:50:02,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6525/203307 [7:29:17<225:50:02,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6526/203307 [7:29:21<225:49:44,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6526/203307 [7:29:21<225:49:44,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6527/203307 [7:29:25<225:49:47,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6527/203307 [7:29:25<225:49:47,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6528/203307 [7:29:30<225:49:49,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6528/203307 [7:29:30<225:49:49,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6529/203307 [7:29:33<225:49:30,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6529/203307 [7:29:33<225:49:30,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6530/203307 [7:29:37<225:49:12,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6530/203307 [7:29:37<225:49:12,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6531/203307 [7:29:41<225:48:55,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6531/203307 [7:29:41<225:48:55,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6532/203307 [7:29:45<225:48:52,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6532/203307 [7:29:45<225:48:52,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6533/203307 [7:29:49<225:48:33,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6533/203307 [7:29:49<225:48:33,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6534/203307 [7:29:53<225:48:37,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6534/203307 [7:29:53<225:48:37,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6535/203307 [7:29:57<225:48:19,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6535/203307 [7:29:57<225:48:19,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6536/203307 [7:30:01<225:48:21,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6536/203307 [7:30:01<225:48:21,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6537/203307 [7:30:05<225:48:19,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6537/203307 [7:30:05<225:48:19,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6538/203307 [7:30:09<225:47:59,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6538/203307 [7:30:09<225:48:00,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6539/203307 [7:30:13<225:47:41,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6539/203307 [7:30:13<225:47:41,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6540/203307 [7:30:16<225:47:28,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6540/203307 [7:30:16<225:47:28,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6541/203307 [7:30:21<225:47:27,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6541/203307 [7:30:21<225:47:27,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6542/203307 [7:30:25<225:47:33,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6542/203307 [7:30:25<225:47:33,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6543/203307 [7:30:29<225:47:20,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6543/203307 [7:30:29<225:47:20,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6544/203307 [7:30:33<225:47:04,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6544/203307 [7:30:33<225:47:04,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6545/203307 [7:30:37<225:47:08,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6545/203307 [7:30:37<225:47:08,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6546/203307 [7:30:41<225:46:51,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6546/203307 [7:30:41<225:46:51,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6547/203307 [7:30:44<225:46:33,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6547/203307 [7:30:44<225:46:33,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6548/203307 [7:30:48<225:46:17,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6548/203307 [7:30:48<225:46:17,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6549/203307 [7:30:52<225:45:58,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6549/203307 [7:30:52<225:45:58,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6550/203307 [7:30:56<225:46:04,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6550/203307 [7:30:56<225:46:04,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6551/203307 [7:31:00<225:45:49,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6551/203307 [7:31:00<225:45:49,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6552/203307 [7:31:04<225:45:31,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6552/203307 [7:31:04<225:45:31,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6553/203307 [7:31:08<225:45:34,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6553/203307 [7:31:08<225:45:34,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6554/203307 [7:31:12<225:45:18,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6554/203307 [7:31:12<225:45:18,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6555/203307 [7:31:16<225:45:01,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6555/203307 [7:31:16<225:45:01,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6556/203307 [7:31:19<225:44:46,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6556/203307 [7:31:19<225:44:46,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6557/203307 [7:31:23<225:44:28,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6557/203307 [7:31:23<225:44:28,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6558/203307 [7:31:27<225:44:12,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6558/203307 [7:31:27<225:44:12,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6559/203307 [7:31:31<225:44:17,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6559/203307 [7:31:31<225:44:18,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6560/203307 [7:31:35<225:44:00,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6560/203307 [7:31:35<225:44:00,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6561/203307 [7:31:38<225:43:41,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   3%|▎         | 6561/203307 [7:31:38<225:43:41,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6562/203307 [7:31:43<225:43:48,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6562/203307 [7:31:43<225:43:48,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6563/203307 [7:31:47<225:43:30,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6563/203307 [7:31:47<225:43:30,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6564/203307 [7:31:50<225:43:13,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6564/203307 [7:31:50<225:43:14,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6565/203307 [7:31:54<225:42:57,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6565/203307 [7:31:54<225:42:58,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6566/203307 [7:31:58<225:42:40,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6566/203307 [7:31:58<225:42:40,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6567/203307 [7:32:02<225:42:44,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6567/203307 [7:32:02<225:42:45,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6568/203307 [7:32:06<225:42:41,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6568/203307 [7:32:06<225:42:42,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6569/203307 [7:32:10<225:42:24,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6569/203307 [7:32:10<225:42:24,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6570/203307 [7:32:14<225:42:25,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6570/203307 [7:32:14<225:42:25,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6571/203307 [7:32:19<225:42:33,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6571/203307 [7:32:19<225:42:33,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6572/203307 [7:32:23<225:42:15,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6572/203307 [7:32:23<225:42:15,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6573/203307 [7:32:26<225:41:58,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6573/203307 [7:32:26<225:41:58,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6574/203307 [7:32:30<225:41:40,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6574/203307 [7:32:30<225:41:40,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6575/203307 [7:32:34<225:41:46,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6575/203307 [7:32:34<225:41:46,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6576/203307 [7:32:38<225:41:30,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6576/203307 [7:32:38<225:41:31,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6577/203307 [7:32:42<225:41:28,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6577/203307 [7:32:42<225:41:28,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6578/203307 [7:32:47<225:41:28,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6578/203307 [7:32:47<225:41:28,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6579/203307 [7:32:51<225:41:34,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6579/203307 [7:32:51<225:41:34,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6580/203307 [7:32:55<225:41:16,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6580/203307 [7:32:55<225:41:17,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6581/203307 [7:32:58<225:41:01,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 6581/203307 [7:32:58<225:41:01,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6582/203307 [7:33:02<225:40:43,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6582/203307 [7:33:02<225:40:43,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6583/203307 [7:33:06<225:40:27,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6583/203307 [7:33:06<225:40:27,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6584/203307 [7:33:10<225:40:35,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6584/203307 [7:33:10<225:40:35,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6585/203307 [7:33:14<225:40:17,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6585/203307 [7:33:14<225:40:18,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6586/203307 [7:33:18<225:40:16,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6586/203307 [7:33:18<225:40:17,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6587/203307 [7:33:23<225:40:19,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6587/203307 [7:33:23<225:40:19,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6588/203307 [7:33:27<225:40:23,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6588/203307 [7:33:27<225:40:23,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6589/203307 [7:33:31<225:40:06,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6589/203307 [7:33:31<225:40:06,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6590/203307 [7:33:34<225:39:49,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6590/203307 [7:33:34<225:39:49,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6591/203307 [7:33:38<225:39:31,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6591/203307 [7:33:38<225:39:32,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6592/203307 [7:33:43<225:39:38,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6592/203307 [7:33:43<225:39:38,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6593/203307 [7:33:46<225:39:20,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6593/203307 [7:33:46<225:39:21,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6594/203307 [7:33:50<225:39:04,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6594/203307 [7:33:50<225:39:04,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6595/203307 [7:33:54<225:39:06,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6595/203307 [7:33:54<225:39:06,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6596/203307 [7:33:58<225:38:50,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6596/203307 [7:33:58<225:38:50,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6597/203307 [7:34:03<225:38:55,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6597/203307 [7:34:03<225:38:55,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6598/203307 [7:34:06<225:38:38,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6598/203307 [7:34:06<225:38:38,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6599/203307 [7:34:10<225:38:20,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6599/203307 [7:34:10<225:38:20,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6600/203307 [7:34:14<225:38:26,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6600/203307 [7:34:14<225:38:26,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6601/203307 [7:34:18<225:38:11,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   3%|▎         | 6601/203307 [7:34:18<225:38:11,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6602/203307 [7:34:22<225:37:54,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6602/203307 [7:34:22<225:37:54,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6603/203307 [7:34:26<225:37:57,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6603/203307 [7:34:26<225:37:57,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6604/203307 [7:34:30<225:37:53,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6604/203307 [7:34:30<225:37:54,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6605/203307 [7:34:35<225:37:58,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6605/203307 [7:34:35<225:37:58,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6606/203307 [7:34:38<225:37:42,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6606/203307 [7:34:38<225:37:42,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6607/203307 [7:34:42<225:37:24,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6607/203307 [7:34:42<225:37:24,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6608/203307 [7:34:46<225:37:08,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6608/203307 [7:34:46<225:37:08,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6609/203307 [7:34:50<225:37:15,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6609/203307 [7:34:50<225:37:15,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6610/203307 [7:34:54<225:36:59,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6610/203307 [7:34:54<225:36:59,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6611/203307 [7:34:58<225:36:44,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6611/203307 [7:34:58<225:36:44,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6612/203307 [7:35:02<225:36:48,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6612/203307 [7:35:02<225:36:48,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6613/203307 [7:35:07<225:36:49,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6613/203307 [7:35:07<225:36:49,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6614/203307 [7:35:11<225:36:55,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6614/203307 [7:35:11<225:36:55,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6615/203307 [7:35:15<225:36:41,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6615/203307 [7:35:15<225:36:41,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6616/203307 [7:35:19<225:36:25,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6616/203307 [7:35:19<225:36:26,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6617/203307 [7:35:23<225:36:29,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6617/203307 [7:35:23<225:36:30,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6618/203307 [7:35:27<225:36:14,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6618/203307 [7:35:27<225:36:14,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6619/203307 [7:35:30<225:35:56,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6619/203307 [7:35:30<225:35:56,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6620/203307 [7:35:35<225:35:57,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6620/203307 [7:35:35<225:35:58,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6621/203307 [7:35:38<225:35:42,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   3%|▎         | 6621/203307 [7:35:39<225:35:42,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6622/203307 [7:35:43<225:35:40,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6622/203307 [7:35:43<225:35:40,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6623/203307 [7:35:47<225:35:43,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6623/203307 [7:35:47<225:35:43,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6624/203307 [7:35:51<225:35:24,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6624/203307 [7:35:51<225:35:24,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6625/203307 [7:35:55<225:35:27,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6625/203307 [7:35:55<225:35:27,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6626/203307 [7:35:59<225:35:09,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6626/203307 [7:35:59<225:35:10,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6627/203307 [7:36:02<225:34:51,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6627/203307 [7:36:02<225:34:52,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6628/203307 [7:36:07<225:34:54,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6628/203307 [7:36:07<225:34:54,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6629/203307 [7:36:10<225:34:37,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6629/203307 [7:36:10<225:34:37,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6630/203307 [7:36:14<225:34:18,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6630/203307 [7:36:14<225:34:18,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6631/203307 [7:36:19<225:34:24,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6631/203307 [7:36:19<225:34:24,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6632/203307 [7:36:22<225:34:07,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6632/203307 [7:36:22<225:34:07,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6633/203307 [7:36:26<225:33:50,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6633/203307 [7:36:26<225:33:50,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6634/203307 [7:36:30<225:33:55,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6634/203307 [7:36:30<225:33:55,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6635/203307 [7:36:34<225:33:37,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6635/203307 [7:36:34<225:33:38,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6636/203307 [7:36:38<225:33:22,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6636/203307 [7:36:38<225:33:22,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6637/203307 [7:36:42<225:33:25,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6637/203307 [7:36:42<225:33:25,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6638/203307 [7:36:46<225:33:09,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6638/203307 [7:36:46<225:33:09,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6639/203307 [7:36:50<225:32:53,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6639/203307 [7:36:50<225:32:53,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6640/203307 [7:36:54<225:32:57,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6640/203307 [7:36:54<225:32:57,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6641/203307 [7:36:58<225:32:39,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6641/203307 [7:36:58<225:32:39,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6642/203307 [7:37:02<225:32:43,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6642/203307 [7:37:02<225:32:43,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6643/203307 [7:37:06<225:32:29,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6643/203307 [7:37:06<225:32:29,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6644/203307 [7:37:10<225:32:13,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6644/203307 [7:37:10<225:32:14,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6645/203307 [7:37:14<225:32:18,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6645/203307 [7:37:14<225:32:18,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6646/203307 [7:37:18<225:32:12,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6646/203307 [7:37:18<225:32:12,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6647/203307 [7:37:22<225:31:56,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6647/203307 [7:37:22<225:31:57,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6648/203307 [7:37:26<225:31:42,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6648/203307 [7:37:26<225:31:42,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6649/203307 [7:37:30<225:31:48,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6649/203307 [7:37:30<225:31:48,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6650/203307 [7:37:35<225:31:53,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6650/203307 [7:37:35<225:31:53,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6651/203307 [7:37:38<225:31:39,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6651/203307 [7:37:38<225:31:39,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6652/203307 [7:37:42<225:31:23,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6652/203307 [7:37:42<225:31:23,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6653/203307 [7:37:46<225:31:26,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6653/203307 [7:37:46<225:31:26,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6654/203307 [7:37:50<225:31:11,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6654/203307 [7:37:50<225:31:12,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6655/203307 [7:37:54<225:30:59,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6655/203307 [7:37:54<225:30:59,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6656/203307 [7:37:58<225:30:43,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6656/203307 [7:37:58<225:30:43,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6657/203307 [7:38:02<225:30:48,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6657/203307 [7:38:02<225:30:48,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6658/203307 [7:38:07<225:30:50,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6658/203307 [7:38:07<225:30:50,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6659/203307 [7:38:11<225:30:54,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6659/203307 [7:38:11<225:30:54,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6660/203307 [7:38:15<225:30:37,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6660/203307 [7:38:15<225:30:37,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6661/203307 [7:38:19<225:30:27,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   3%|▎         | 6661/203307 [7:38:19<225:30:27,  0.24it/s, v_num=t5e6, training/loss=0.098] Epoch 0:   3%|▎         | 6662/203307 [7:38:23<225:30:30,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6662/203307 [7:38:23<225:30:31,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6663/203307 [7:38:27<225:30:13,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6663/203307 [7:38:27<225:30:13,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6664/203307 [7:38:30<225:29:58,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6664/203307 [7:38:30<225:29:58,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6665/203307 [7:38:34<225:29:41,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6665/203307 [7:38:34<225:29:41,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6666/203307 [7:38:39<225:29:50,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6666/203307 [7:38:39<225:29:50,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6667/203307 [7:38:43<225:29:54,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6667/203307 [7:38:43<225:29:54,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6668/203307 [7:38:47<225:29:39,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6668/203307 [7:38:47<225:29:39,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6669/203307 [7:38:51<225:29:22,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6669/203307 [7:38:51<225:29:22,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6670/203307 [7:38:55<225:29:26,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6670/203307 [7:38:55<225:29:26,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6671/203307 [7:38:59<225:29:09,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6671/203307 [7:38:59<225:29:10,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6672/203307 [7:39:02<225:28:56,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6672/203307 [7:39:02<225:28:56,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6673/203307 [7:39:06<225:28:40,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6673/203307 [7:39:06<225:28:40,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6674/203307 [7:39:10<225:28:26,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6674/203307 [7:39:10<225:28:26,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6675/203307 [7:39:14<225:28:33,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6675/203307 [7:39:14<225:28:34,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6676/203307 [7:39:19<225:28:35,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6676/203307 [7:39:19<225:28:35,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6677/203307 [7:39:22<225:28:18,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6677/203307 [7:39:23<225:28:19,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6678/203307 [7:39:27<225:28:21,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6678/203307 [7:39:27<225:28:21,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6679/203307 [7:39:31<225:28:08,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6679/203307 [7:39:31<225:28:08,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6680/203307 [7:39:34<225:27:54,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6680/203307 [7:39:34<225:27:54,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6681/203307 [7:39:38<225:27:39,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   3%|▎         | 6681/203307 [7:39:38<225:27:39,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6682/203307 [7:39:42<225:27:23,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6682/203307 [7:39:42<225:27:24,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6683/203307 [7:39:46<225:27:26,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6683/203307 [7:39:46<225:27:26,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6684/203307 [7:39:51<225:27:34,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6684/203307 [7:39:51<225:27:34,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6685/203307 [7:39:55<225:27:29,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6685/203307 [7:39:55<225:27:29,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6686/203307 [7:39:59<225:27:13,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6686/203307 [7:39:59<225:27:13,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6687/203307 [7:40:03<225:27:17,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6687/203307 [7:40:03<225:27:18,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6688/203307 [7:40:07<225:27:03,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6688/203307 [7:40:07<225:27:03,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6689/203307 [7:40:11<225:26:46,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6689/203307 [7:40:11<225:26:46,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6690/203307 [7:40:14<225:26:31,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6690/203307 [7:40:14<225:26:31,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6691/203307 [7:40:18<225:26:14,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6691/203307 [7:40:18<225:26:15,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6692/203307 [7:40:23<225:26:23,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6692/203307 [7:40:23<225:26:23,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6693/203307 [7:40:26<225:26:08,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6693/203307 [7:40:26<225:26:08,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6694/203307 [7:40:31<225:26:05,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6694/203307 [7:40:31<225:26:05,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6695/203307 [7:40:35<225:26:04,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6695/203307 [7:40:35<225:26:04,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6696/203307 [7:40:38<225:25:48,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6696/203307 [7:40:38<225:25:48,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6697/203307 [7:40:42<225:25:35,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6697/203307 [7:40:42<225:25:35,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6698/203307 [7:40:46<225:25:20,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6698/203307 [7:40:46<225:25:20,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6699/203307 [7:40:50<225:25:05,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6699/203307 [7:40:50<225:25:05,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6700/203307 [7:40:54<225:25:12,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6700/203307 [7:40:54<225:25:12,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6701/203307 [7:40:59<225:25:16,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   3%|▎         | 6701/203307 [7:40:59<225:25:16,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6702/203307 [7:41:02<225:24:59,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6702/203307 [7:41:02<225:25:00,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6703/203307 [7:41:07<225:25:02,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6703/203307 [7:41:07<225:25:02,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6704/203307 [7:41:10<225:24:45,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6704/203307 [7:41:11<225:24:45,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6705/203307 [7:41:14<225:24:30,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6705/203307 [7:41:14<225:24:30,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6706/203307 [7:41:18<225:24:15,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6706/203307 [7:41:18<225:24:15,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6707/203307 [7:41:22<225:23:58,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6707/203307 [7:41:22<225:23:58,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6708/203307 [7:41:25<225:23:45,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6708/203307 [7:41:25<225:23:45,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6709/203307 [7:41:30<225:23:54,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6709/203307 [7:41:30<225:23:54,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6710/203307 [7:41:34<225:23:40,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6710/203307 [7:41:34<225:23:40,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6711/203307 [7:41:38<225:23:26,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6711/203307 [7:41:38<225:23:27,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6712/203307 [7:41:42<225:23:32,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6712/203307 [7:41:42<225:23:32,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6713/203307 [7:41:46<225:23:16,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6713/203307 [7:41:46<225:23:17,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6714/203307 [7:41:50<225:23:01,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6714/203307 [7:41:50<225:23:01,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6715/203307 [7:41:53<225:22:49,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6715/203307 [7:41:53<225:22:49,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6716/203307 [7:41:57<225:22:35,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6716/203307 [7:41:57<225:22:35,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6717/203307 [7:42:02<225:22:43,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6717/203307 [7:42:02<225:22:43,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6718/203307 [7:42:06<225:22:47,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6718/203307 [7:42:06<225:22:48,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6719/203307 [7:42:10<225:22:31,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6719/203307 [7:42:10<225:22:31,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6720/203307 [7:42:14<225:22:32,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6720/203307 [7:42:14<225:22:32,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6721/203307 [7:42:19<225:22:33,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   3%|▎         | 6721/203307 [7:42:19<225:22:33,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6722/203307 [7:42:22<225:22:16,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6722/203307 [7:42:22<225:22:16,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6723/203307 [7:42:26<225:22:00,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6723/203307 [7:42:26<225:22:00,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6724/203307 [7:42:30<225:21:44,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6724/203307 [7:42:30<225:21:45,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6725/203307 [7:42:34<225:21:50,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6725/203307 [7:42:34<225:21:50,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6726/203307 [7:42:38<225:21:35,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6726/203307 [7:42:38<225:21:35,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6727/203307 [7:42:42<225:21:38,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6727/203307 [7:42:42<225:21:38,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6728/203307 [7:42:47<225:21:38,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6728/203307 [7:42:47<225:21:38,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6729/203307 [7:42:50<225:21:22,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6729/203307 [7:42:50<225:21:22,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6730/203307 [7:42:54<225:21:21,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6730/203307 [7:42:54<225:21:21,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6731/203307 [7:42:58<225:21:03,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6731/203307 [7:42:58<225:21:03,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6732/203307 [7:43:02<225:20:46,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6732/203307 [7:43:02<225:20:46,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6733/203307 [7:43:06<225:20:30,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6733/203307 [7:43:06<225:20:30,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6734/203307 [7:43:10<225:20:37,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6734/203307 [7:43:10<225:20:37,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6735/203307 [7:43:14<225:20:37,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6735/203307 [7:43:14<225:20:37,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6736/203307 [7:43:18<225:20:24,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6736/203307 [7:43:18<225:20:24,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6737/203307 [7:43:23<225:20:26,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6737/203307 [7:43:23<225:20:26,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6738/203307 [7:43:26<225:20:10,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6738/203307 [7:43:26<225:20:10,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6739/203307 [7:43:30<225:20:09,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6739/203307 [7:43:30<225:20:09,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6740/203307 [7:43:34<225:19:53,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6740/203307 [7:43:34<225:19:53,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6741/203307 [7:43:38<225:19:35,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   3%|▎         | 6741/203307 [7:43:38<225:19:35,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6742/203307 [7:43:42<225:19:40,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6742/203307 [7:43:42<225:19:40,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6743/203307 [7:43:46<225:19:27,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6743/203307 [7:43:46<225:19:27,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6744/203307 [7:43:50<225:19:29,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6744/203307 [7:43:50<225:19:30,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6745/203307 [7:43:55<225:19:31,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6745/203307 [7:43:55<225:19:31,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6746/203307 [7:43:58<225:19:16,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6746/203307 [7:43:58<225:19:16,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6747/203307 [7:44:02<225:19:01,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6747/203307 [7:44:02<225:19:01,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6748/203307 [7:44:06<225:19:00,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6748/203307 [7:44:06<225:19:00,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6749/203307 [7:44:10<225:18:42,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6749/203307 [7:44:10<225:18:43,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6750/203307 [7:44:15<225:18:48,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6750/203307 [7:44:15<225:18:49,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6751/203307 [7:44:18<225:18:32,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6751/203307 [7:44:18<225:18:32,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6752/203307 [7:44:22<225:18:16,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6752/203307 [7:44:22<225:18:16,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6753/203307 [7:44:27<225:18:21,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6753/203307 [7:44:27<225:18:21,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6754/203307 [7:44:30<225:18:05,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6754/203307 [7:44:30<225:18:05,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6755/203307 [7:44:34<225:17:47,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6755/203307 [7:44:34<225:17:48,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6756/203307 [7:44:38<225:17:31,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6756/203307 [7:44:38<225:17:32,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6757/203307 [7:44:42<225:17:30,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6757/203307 [7:44:42<225:17:30,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6758/203307 [7:44:46<225:17:15,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6758/203307 [7:44:46<225:17:15,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6759/203307 [7:44:50<225:17:20,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6759/203307 [7:44:50<225:17:21,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6760/203307 [7:44:54<225:17:03,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6760/203307 [7:44:54<225:17:03,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6761/203307 [7:44:58<225:17:06,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   3%|▎         | 6761/203307 [7:44:58<225:17:06,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6762/203307 [7:45:02<225:17:07,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6762/203307 [7:45:02<225:17:07,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6763/203307 [7:45:06<225:16:50,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6763/203307 [7:45:06<225:16:50,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6764/203307 [7:45:10<225:16:35,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6764/203307 [7:45:10<225:16:36,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6765/203307 [7:45:14<225:16:21,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6765/203307 [7:45:14<225:16:21,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6766/203307 [7:45:18<225:16:23,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6766/203307 [7:45:18<225:16:24,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6767/203307 [7:45:22<225:16:31,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6767/203307 [7:45:22<225:16:31,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6768/203307 [7:45:26<225:16:17,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6768/203307 [7:45:26<225:16:18,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6769/203307 [7:45:30<225:16:01,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6769/203307 [7:45:30<225:16:01,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6770/203307 [7:45:35<225:16:10,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6770/203307 [7:45:35<225:16:10,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6771/203307 [7:45:38<225:15:56,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6771/203307 [7:45:38<225:15:56,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6772/203307 [7:45:42<225:15:42,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6772/203307 [7:45:42<225:15:42,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6773/203307 [7:45:46<225:15:28,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6773/203307 [7:45:46<225:15:28,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6774/203307 [7:45:50<225:15:14,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6774/203307 [7:45:50<225:15:14,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6775/203307 [7:45:54<225:15:24,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6775/203307 [7:45:54<225:15:24,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6776/203307 [7:45:58<225:15:11,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6776/203307 [7:45:58<225:15:11,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6777/203307 [7:46:02<225:14:55,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6777/203307 [7:46:02<225:14:55,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6778/203307 [7:46:06<225:15:00,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6778/203307 [7:46:06<225:15:00,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6779/203307 [7:46:11<225:15:03,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6779/203307 [7:46:11<225:15:03,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6780/203307 [7:46:14<225:14:46,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6780/203307 [7:46:14<225:14:46,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6781/203307 [7:46:18<225:14:31,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   3%|▎         | 6781/203307 [7:46:18<225:14:31,  0.24it/s, v_num=t5e6, training/loss=0.103] Epoch 0:   3%|▎         | 6782/203307 [7:46:22<225:14:17,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6782/203307 [7:46:22<225:14:17,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6783/203307 [7:46:26<225:14:03,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6783/203307 [7:46:26<225:14:03,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6784/203307 [7:46:30<225:14:09,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6784/203307 [7:46:30<225:14:09,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6785/203307 [7:46:34<225:13:56,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6785/203307 [7:46:34<225:13:56,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6786/203307 [7:46:38<225:13:40,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6786/203307 [7:46:38<225:13:40,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6787/203307 [7:46:42<225:13:48,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6787/203307 [7:46:42<225:13:48,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6788/203307 [7:46:46<225:13:32,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6788/203307 [7:46:46<225:13:32,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6789/203307 [7:46:50<225:13:17,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6789/203307 [7:46:50<225:13:17,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6790/203307 [7:46:53<225:13:01,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6790/203307 [7:46:53<225:13:01,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6791/203307 [7:46:57<225:12:46,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6791/203307 [7:46:57<225:12:46,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6792/203307 [7:47:02<225:12:50,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6792/203307 [7:47:02<225:12:50,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6793/203307 [7:47:06<225:12:48,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6793/203307 [7:47:06<225:12:48,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6794/203307 [7:47:09<225:12:32,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6794/203307 [7:47:09<225:12:33,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6795/203307 [7:47:14<225:12:34,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6795/203307 [7:47:14<225:12:34,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6796/203307 [7:47:18<225:12:42,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6796/203307 [7:47:18<225:12:42,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6797/203307 [7:47:22<225:12:27,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6797/203307 [7:47:22<225:12:27,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6798/203307 [7:47:26<225:12:12,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6798/203307 [7:47:26<225:12:12,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6799/203307 [7:47:30<225:11:57,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6799/203307 [7:47:30<225:11:57,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6800/203307 [7:47:34<225:12:03,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6800/203307 [7:47:34<225:12:03,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6801/203307 [7:47:38<225:11:49,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   3%|▎         | 6801/203307 [7:47:38<225:11:49,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6802/203307 [7:47:42<225:11:46,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6802/203307 [7:47:42<225:11:46,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6803/203307 [7:47:46<225:11:46,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6803/203307 [7:47:46<225:11:46,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6804/203307 [7:47:50<225:11:31,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6804/203307 [7:47:50<225:11:31,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6805/203307 [7:47:54<225:11:33,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6805/203307 [7:47:54<225:11:33,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6806/203307 [7:47:58<225:11:17,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6806/203307 [7:47:58<225:11:17,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6807/203307 [7:48:02<225:10:59,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6807/203307 [7:48:02<225:10:59,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6808/203307 [7:48:06<225:10:48,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6808/203307 [7:48:06<225:10:48,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6809/203307 [7:48:10<225:10:54,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6809/203307 [7:48:10<225:10:54,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6810/203307 [7:48:14<225:10:37,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6810/203307 [7:48:14<225:10:37,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6811/203307 [7:48:18<225:10:37,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6811/203307 [7:48:18<225:10:37,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6812/203307 [7:48:22<225:10:39,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6812/203307 [7:48:22<225:10:39,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6813/203307 [7:48:27<225:10:43,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6813/203307 [7:48:27<225:10:44,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6814/203307 [7:48:31<225:10:29,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6814/203307 [7:48:31<225:10:29,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6815/203307 [7:48:34<225:10:14,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6815/203307 [7:48:34<225:10:14,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6816/203307 [7:48:38<225:09:56,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6816/203307 [7:48:38<225:09:57,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6817/203307 [7:48:42<225:10:02,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6817/203307 [7:48:42<225:10:02,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6818/203307 [7:48:46<225:09:44,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6818/203307 [7:48:46<225:09:44,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6819/203307 [7:48:50<225:09:26,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6819/203307 [7:48:50<225:09:26,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6820/203307 [7:48:54<225:09:30,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6820/203307 [7:48:54<225:09:30,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6821/203307 [7:48:58<225:09:14,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   3%|▎         | 6821/203307 [7:48:58<225:09:14,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6822/203307 [7:49:02<225:09:17,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6822/203307 [7:49:02<225:09:17,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6823/203307 [7:49:06<225:09:02,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6823/203307 [7:49:06<225:09:02,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6824/203307 [7:49:10<225:08:46,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6824/203307 [7:49:10<225:08:46,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6825/203307 [7:49:14<225:08:50,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6825/203307 [7:49:14<225:08:51,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6826/203307 [7:49:18<225:08:36,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6826/203307 [7:49:18<225:08:36,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6827/203307 [7:49:22<225:08:18,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6827/203307 [7:49:22<225:08:18,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6828/203307 [7:49:26<225:08:19,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6828/203307 [7:49:26<225:08:19,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6829/203307 [7:49:30<225:08:16,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6829/203307 [7:49:30<225:08:16,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6830/203307 [7:49:34<225:07:58,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6830/203307 [7:49:34<225:07:58,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6831/203307 [7:49:38<225:07:59,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6831/203307 [7:49:38<225:07:59,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6832/203307 [7:49:42<225:07:40,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6832/203307 [7:49:42<225:07:40,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6833/203307 [7:49:45<225:07:23,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6833/203307 [7:49:45<225:07:23,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6834/203307 [7:49:50<225:07:30,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6834/203307 [7:49:50<225:07:30,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6835/203307 [7:49:53<225:07:12,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6835/203307 [7:49:53<225:07:12,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6836/203307 [7:49:57<225:06:54,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6836/203307 [7:49:57<225:06:54,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6837/203307 [7:50:01<225:06:54,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6837/203307 [7:50:01<225:06:54,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6838/203307 [7:50:05<225:06:49,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6838/203307 [7:50:05<225:06:49,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6839/203307 [7:50:10<225:06:50,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6839/203307 [7:50:10<225:06:50,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6840/203307 [7:50:13<225:06:34,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6840/203307 [7:50:13<225:06:34,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6841/203307 [7:50:17<225:06:19,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   3%|▎         | 6841/203307 [7:50:17<225:06:19,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6842/203307 [7:50:22<225:06:26,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6842/203307 [7:50:22<225:06:26,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6843/203307 [7:50:25<225:06:13,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6843/203307 [7:50:25<225:06:13,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6844/203307 [7:50:29<225:05:58,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6844/203307 [7:50:29<225:05:58,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6845/203307 [7:50:34<225:06:00,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6845/203307 [7:50:34<225:06:00,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6846/203307 [7:50:37<225:05:45,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6846/203307 [7:50:37<225:05:45,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6847/203307 [7:50:42<225:05:45,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6847/203307 [7:50:42<225:05:45,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6848/203307 [7:50:46<225:05:50,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6848/203307 [7:50:46<225:05:51,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6849/203307 [7:50:50<225:05:35,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6849/203307 [7:50:50<225:05:35,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6850/203307 [7:50:54<225:05:41,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6850/203307 [7:50:54<225:05:42,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6851/203307 [7:50:58<225:05:28,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6851/203307 [7:50:58<225:05:28,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6852/203307 [7:51:02<225:05:13,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6852/203307 [7:51:02<225:05:13,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6853/203307 [7:51:06<225:05:18,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6853/203307 [7:51:06<225:05:18,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6854/203307 [7:51:10<225:05:04,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6854/203307 [7:51:10<225:05:04,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6855/203307 [7:51:14<225:04:46,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6855/203307 [7:51:14<225:04:46,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6856/203307 [7:51:18<225:04:44,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6856/203307 [7:51:18<225:04:44,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6857/203307 [7:51:22<225:04:49,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6857/203307 [7:51:22<225:04:49,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6858/203307 [7:51:26<225:04:34,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6858/203307 [7:51:26<225:04:34,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6859/203307 [7:51:31<225:04:41,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6859/203307 [7:51:31<225:04:41,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6860/203307 [7:51:34<225:04:24,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6860/203307 [7:51:34<225:04:24,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6861/203307 [7:51:38<225:04:10,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   3%|▎         | 6861/203307 [7:51:38<225:04:10,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6862/203307 [7:51:42<225:04:15,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6862/203307 [7:51:42<225:04:15,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6863/203307 [7:51:46<225:04:01,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6863/203307 [7:51:46<225:04:02,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6864/203307 [7:51:50<225:03:44,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6864/203307 [7:51:50<225:03:44,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6865/203307 [7:51:54<225:03:51,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6865/203307 [7:51:54<225:03:51,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6866/203307 [7:51:58<225:03:37,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6866/203307 [7:51:58<225:03:37,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6867/203307 [7:52:03<225:03:42,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6867/203307 [7:52:03<225:03:42,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6868/203307 [7:52:06<225:03:28,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6868/203307 [7:52:06<225:03:28,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6869/203307 [7:52:10<225:03:13,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6869/203307 [7:52:10<225:03:13,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6870/203307 [7:52:15<225:03:17,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6870/203307 [7:52:15<225:03:17,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6871/203307 [7:52:18<225:03:05,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6871/203307 [7:52:18<225:03:05,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6872/203307 [7:52:22<225:02:51,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6872/203307 [7:52:22<225:02:51,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6873/203307 [7:52:26<225:02:37,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6873/203307 [7:52:26<225:02:38,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6874/203307 [7:52:30<225:02:43,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6874/203307 [7:52:30<225:02:43,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6875/203307 [7:52:35<225:02:49,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6875/203307 [7:52:35<225:02:50,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6876/203307 [7:52:39<225:02:35,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6876/203307 [7:52:39<225:02:35,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6877/203307 [7:52:42<225:02:20,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6877/203307 [7:52:42<225:02:20,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6878/203307 [7:52:47<225:02:23,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6878/203307 [7:52:47<225:02:23,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6879/203307 [7:52:51<225:02:08,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6879/203307 [7:52:51<225:02:08,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6880/203307 [7:52:54<225:01:55,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6880/203307 [7:52:54<225:01:55,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6881/203307 [7:52:58<225:01:40,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   3%|▎         | 6881/203307 [7:52:58<225:01:41,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6882/203307 [7:53:02<225:01:26,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6882/203307 [7:53:02<225:01:26,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6883/203307 [7:53:06<225:01:31,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6883/203307 [7:53:06<225:01:31,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6884/203307 [7:53:11<225:01:37,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6884/203307 [7:53:11<225:01:37,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6885/203307 [7:53:15<225:01:22,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6885/203307 [7:53:15<225:01:22,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6886/203307 [7:53:18<225:01:06,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6886/203307 [7:53:18<225:01:06,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6887/203307 [7:53:23<225:01:10,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6887/203307 [7:53:23<225:01:11,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6888/203307 [7:53:26<225:00:53,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6888/203307 [7:53:26<225:00:53,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6889/203307 [7:53:30<225:00:37,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6889/203307 [7:53:30<225:00:37,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6890/203307 [7:53:34<225:00:22,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6890/203307 [7:53:34<225:00:22,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6891/203307 [7:53:38<225:00:25,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6891/203307 [7:53:38<225:00:25,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6892/203307 [7:53:43<225:00:27,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6892/203307 [7:53:43<225:00:27,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6893/203307 [7:53:46<225:00:10,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6893/203307 [7:53:46<225:00:10,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6894/203307 [7:53:50<224:59:54,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6894/203307 [7:53:50<224:59:54,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6895/203307 [7:53:54<224:59:58,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6895/203307 [7:53:54<224:59:58,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6896/203307 [7:53:58<224:59:41,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6896/203307 [7:53:58<224:59:41,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6897/203307 [7:54:02<224:59:25,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6897/203307 [7:54:02<224:59:25,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6898/203307 [7:54:05<224:59:10,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6898/203307 [7:54:05<224:59:10,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6899/203307 [7:54:09<224:58:54,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6899/203307 [7:54:09<224:58:54,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6900/203307 [7:54:14<224:59:01,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6900/203307 [7:54:14<224:59:01,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6901/203307 [7:54:18<224:59:03,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   3%|▎         | 6901/203307 [7:54:18<224:59:03,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6902/203307 [7:54:22<224:58:48,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6902/203307 [7:54:22<224:58:48,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6903/203307 [7:54:26<224:58:53,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6903/203307 [7:54:26<224:58:53,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6904/203307 [7:54:30<224:58:39,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6904/203307 [7:54:30<224:58:39,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6905/203307 [7:54:34<224:58:25,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6905/203307 [7:54:34<224:58:25,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6906/203307 [7:54:38<224:58:12,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6906/203307 [7:54:38<224:58:12,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6907/203307 [7:54:41<224:57:59,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6907/203307 [7:54:41<224:57:59,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6908/203307 [7:54:45<224:57:43,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6908/203307 [7:54:45<224:57:43,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6909/203307 [7:54:50<224:57:51,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6909/203307 [7:54:50<224:57:51,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6910/203307 [7:54:54<224:57:50,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6910/203307 [7:54:54<224:57:50,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6911/203307 [7:54:58<224:57:36,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6911/203307 [7:54:58<224:57:36,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6912/203307 [7:55:02<224:57:39,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6912/203307 [7:55:02<224:57:39,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6913/203307 [7:55:06<224:57:24,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6913/203307 [7:55:06<224:57:24,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6914/203307 [7:55:09<224:57:08,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6914/203307 [7:55:09<224:57:08,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6915/203307 [7:55:13<224:56:55,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6915/203307 [7:55:13<224:56:55,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6916/203307 [7:55:17<224:56:40,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6916/203307 [7:55:17<224:56:40,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6917/203307 [7:55:22<224:56:47,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6917/203307 [7:55:22<224:56:47,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6918/203307 [7:55:25<224:56:36,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6918/203307 [7:55:25<224:56:36,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6919/203307 [7:55:30<224:56:33,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6919/203307 [7:55:30<224:56:33,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6920/203307 [7:55:34<224:56:34,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6920/203307 [7:55:34<224:56:34,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6921/203307 [7:55:38<224:56:21,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   3%|▎         | 6921/203307 [7:55:38<224:56:21,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6922/203307 [7:55:42<224:56:09,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6922/203307 [7:55:42<224:56:09,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6923/203307 [7:55:45<224:55:55,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6923/203307 [7:55:45<224:55:55,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6924/203307 [7:55:49<224:55:39,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6924/203307 [7:55:49<224:55:39,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6925/203307 [7:55:54<224:55:46,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6925/203307 [7:55:54<224:55:46,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6926/203307 [7:55:58<224:55:48,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6926/203307 [7:55:58<224:55:48,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6927/203307 [7:56:02<224:55:31,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6927/203307 [7:56:02<224:55:32,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6928/203307 [7:56:06<224:55:34,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6928/203307 [7:56:06<224:55:34,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6929/203307 [7:56:10<224:55:18,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6929/203307 [7:56:10<224:55:18,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6930/203307 [7:56:13<224:55:01,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6930/203307 [7:56:13<224:55:01,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6931/203307 [7:56:17<224:54:47,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6931/203307 [7:56:17<224:54:47,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6932/203307 [7:56:21<224:54:31,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6932/203307 [7:56:21<224:54:31,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6933/203307 [7:56:24<224:54:15,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6933/203307 [7:56:24<224:54:16,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6934/203307 [7:56:29<224:54:24,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6934/203307 [7:56:29<224:54:25,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6935/203307 [7:56:33<224:54:28,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6935/203307 [7:56:33<224:54:28,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6936/203307 [7:56:37<224:54:13,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6936/203307 [7:56:37<224:54:13,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6937/203307 [7:56:42<224:54:15,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6937/203307 [7:56:42<224:54:15,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6938/203307 [7:56:45<224:53:59,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6938/203307 [7:56:45<224:53:59,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6939/203307 [7:56:49<224:53:42,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6939/203307 [7:56:49<224:53:42,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6940/203307 [7:56:53<224:53:31,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6940/203307 [7:56:53<224:53:31,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6941/203307 [7:56:57<224:53:17,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   3%|▎         | 6941/203307 [7:56:57<224:53:17,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6942/203307 [7:57:01<224:53:21,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6942/203307 [7:57:01<224:53:21,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6943/203307 [7:57:05<224:53:25,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6943/203307 [7:57:05<224:53:25,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6944/203307 [7:57:09<224:53:09,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6944/203307 [7:57:09<224:53:09,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6945/203307 [7:57:13<224:53:11,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6945/203307 [7:57:13<224:53:11,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6946/203307 [7:57:18<224:53:11,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6946/203307 [7:57:18<224:53:11,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6947/203307 [7:57:21<224:52:57,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6947/203307 [7:57:21<224:52:57,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6948/203307 [7:57:25<224:52:41,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6948/203307 [7:57:25<224:52:41,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6949/203307 [7:57:29<224:52:28,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6949/203307 [7:57:29<224:52:28,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6950/203307 [7:57:33<224:52:33,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6950/203307 [7:57:33<224:52:33,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6951/203307 [7:57:37<224:52:18,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6951/203307 [7:57:37<224:52:18,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6952/203307 [7:57:42<224:52:21,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6952/203307 [7:57:42<224:52:21,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6953/203307 [7:57:46<224:52:22,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6953/203307 [7:57:46<224:52:22,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6954/203307 [7:57:50<224:52:06,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6954/203307 [7:57:50<224:52:06,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6955/203307 [7:57:54<224:52:06,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6955/203307 [7:57:54<224:52:06,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6956/203307 [7:57:58<224:51:50,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6956/203307 [7:57:58<224:51:50,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6957/203307 [7:58:01<224:51:33,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6957/203307 [7:58:01<224:51:34,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6958/203307 [7:58:05<224:51:20,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6958/203307 [7:58:05<224:51:20,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6959/203307 [7:58:09<224:51:26,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6959/203307 [7:58:09<224:51:26,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6960/203307 [7:58:13<224:51:10,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6960/203307 [7:58:13<224:51:10,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6961/203307 [7:58:18<224:51:16,  0.24it/s, v_num=t5e6, training/loss=0.0987]Epoch 0:   3%|▎         | 6961/203307 [7:58:18<224:51:17,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6962/203307 [7:58:22<224:51:16,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6962/203307 [7:58:22<224:51:16,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6963/203307 [7:58:26<224:50:58,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6963/203307 [7:58:26<224:50:58,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6964/203307 [7:58:30<224:50:56,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6964/203307 [7:58:30<224:50:56,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6965/203307 [7:58:34<224:50:43,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6965/203307 [7:58:34<224:50:43,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6966/203307 [7:58:37<224:50:26,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6966/203307 [7:58:37<224:50:26,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6967/203307 [7:58:42<224:50:32,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6967/203307 [7:58:42<224:50:32,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6968/203307 [7:58:45<224:50:15,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6968/203307 [7:58:45<224:50:15,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6969/203307 [7:58:50<224:50:16,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6969/203307 [7:58:50<224:50:16,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6970/203307 [7:58:54<224:50:18,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6970/203307 [7:58:54<224:50:18,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6971/203307 [7:58:58<224:50:03,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6971/203307 [7:58:58<224:50:03,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6972/203307 [7:59:01<224:49:46,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6972/203307 [7:59:01<224:49:46,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6973/203307 [7:59:06<224:49:43,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6973/203307 [7:59:06<224:49:43,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6974/203307 [7:59:09<224:49:29,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6974/203307 [7:59:09<224:49:30,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6975/203307 [7:59:14<224:49:36,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6975/203307 [7:59:14<224:49:36,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6976/203307 [7:59:18<224:49:23,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6976/203307 [7:59:18<224:49:24,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6977/203307 [7:59:21<224:49:07,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6977/203307 [7:59:21<224:49:08,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6978/203307 [7:59:26<224:49:11,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6978/203307 [7:59:26<224:49:11,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6979/203307 [7:59:30<224:48:57,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6979/203307 [7:59:30<224:48:57,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6980/203307 [7:59:33<224:48:39,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6980/203307 [7:59:33<224:48:40,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6981/203307 [7:59:37<224:48:24,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   3%|▎         | 6981/203307 [7:59:37<224:48:24,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6982/203307 [7:59:41<224:48:23,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6982/203307 [7:59:41<224:48:23,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6983/203307 [7:59:45<224:48:07,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6983/203307 [7:59:45<224:48:08,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6984/203307 [7:59:49<224:48:12,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6984/203307 [7:59:49<224:48:12,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6985/203307 [7:59:53<224:47:56,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6985/203307 [7:59:53<224:47:56,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6986/203307 [7:59:57<224:47:39,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6986/203307 [7:59:57<224:47:40,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6987/203307 [8:00:01<224:47:43,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6987/203307 [8:00:01<224:47:43,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6988/203307 [8:00:05<224:47:25,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6988/203307 [8:00:05<224:47:26,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6989/203307 [8:00:08<224:47:08,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6989/203307 [8:00:08<224:47:08,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6990/203307 [8:00:12<224:46:51,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6990/203307 [8:00:12<224:46:52,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6991/203307 [8:00:16<224:46:51,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6991/203307 [8:00:16<224:46:52,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6992/203307 [8:00:21<224:46:57,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6992/203307 [8:00:21<224:46:57,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6993/203307 [8:00:24<224:46:41,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6993/203307 [8:00:24<224:46:41,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6994/203307 [8:00:28<224:46:27,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6994/203307 [8:00:28<224:46:27,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6995/203307 [8:00:33<224:46:34,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6995/203307 [8:00:33<224:46:34,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6996/203307 [8:00:37<224:46:21,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6996/203307 [8:00:37<224:46:22,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6997/203307 [8:00:40<224:46:07,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6997/203307 [8:00:40<224:46:07,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6998/203307 [8:00:44<224:45:54,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6998/203307 [8:00:44<224:45:54,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6999/203307 [8:00:48<224:45:37,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 6999/203307 [8:00:48<224:45:38,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 7000/203307 [8:00:52<224:45:46,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 7000/203307 [8:00:52<224:45:46,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 7001/203307 [8:00:56<224:45:33,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   3%|▎         | 7001/203307 [8:00:56<224:45:33,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7002/203307 [8:01:00<224:45:18,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7002/203307 [8:01:00<224:45:18,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7003/203307 [8:01:04<224:45:20,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7003/203307 [8:01:04<224:45:20,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7004/203307 [8:01:09<224:45:25,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7004/203307 [8:01:09<224:45:26,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7005/203307 [8:01:12<224:45:09,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7005/203307 [8:01:12<224:45:09,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7006/203307 [8:01:16<224:44:55,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7006/203307 [8:01:16<224:44:55,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7007/203307 [8:01:20<224:44:40,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7007/203307 [8:01:20<224:44:40,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7008/203307 [8:01:24<224:44:25,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7008/203307 [8:01:24<224:44:26,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7009/203307 [8:01:28<224:44:32,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7009/203307 [8:01:28<224:44:32,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7010/203307 [8:01:32<224:44:15,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7010/203307 [8:01:32<224:44:15,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7011/203307 [8:01:35<224:43:57,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7011/203307 [8:01:35<224:43:57,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7012/203307 [8:01:40<224:43:59,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7012/203307 [8:01:40<224:44:00,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7013/203307 [8:01:44<224:44:02,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7013/203307 [8:01:44<224:44:03,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7014/203307 [8:01:48<224:43:45,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7014/203307 [8:01:48<224:43:45,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7015/203307 [8:01:52<224:43:31,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7015/203307 [8:01:52<224:43:31,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7016/203307 [8:01:55<224:43:13,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7016/203307 [8:01:55<224:43:14,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7017/203307 [8:02:00<224:43:19,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7017/203307 [8:02:00<224:43:19,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7018/203307 [8:02:04<224:43:17,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7018/203307 [8:02:04<224:43:18,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7019/203307 [8:02:08<224:42:59,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7019/203307 [8:02:08<224:42:59,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7020/203307 [8:02:12<224:42:59,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7020/203307 [8:02:12<224:42:59,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7021/203307 [8:02:16<224:43:02,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   3%|▎         | 7021/203307 [8:02:16<224:43:02,  0.24it/s, v_num=t5e6, training/loss=0.107] Epoch 0:   3%|▎         | 7022/203307 [8:02:20<224:42:46,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7022/203307 [8:02:20<224:42:46,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7023/203307 [8:02:24<224:42:29,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7023/203307 [8:02:24<224:42:29,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7024/203307 [8:02:27<224:42:14,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7024/203307 [8:02:27<224:42:14,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7025/203307 [8:02:32<224:42:22,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7025/203307 [8:02:32<224:42:22,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7026/203307 [8:02:36<224:42:09,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7026/203307 [8:02:36<224:42:10,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7027/203307 [8:02:40<224:42:09,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7027/203307 [8:02:40<224:42:09,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7028/203307 [8:02:44<224:42:10,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7028/203307 [8:02:44<224:42:10,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7029/203307 [8:02:48<224:41:57,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7029/203307 [8:02:48<224:41:57,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7030/203307 [8:02:52<224:42:01,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7030/203307 [8:02:52<224:42:02,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7031/203307 [8:02:56<224:41:47,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7031/203307 [8:02:56<224:41:47,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7032/203307 [8:03:00<224:41:32,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7032/203307 [8:03:00<224:41:32,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7033/203307 [8:03:04<224:41:17,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7033/203307 [8:03:04<224:41:18,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7034/203307 [8:03:08<224:41:25,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7034/203307 [8:03:08<224:41:25,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7035/203307 [8:03:12<224:41:10,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7035/203307 [8:03:12<224:41:10,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7036/203307 [8:03:16<224:41:08,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7036/203307 [8:03:16<224:41:09,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7037/203307 [8:03:21<224:41:13,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7037/203307 [8:03:21<224:41:13,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7038/203307 [8:03:24<224:41:00,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7038/203307 [8:03:24<224:41:00,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7039/203307 [8:03:29<224:41:06,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7039/203307 [8:03:29<224:41:06,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7040/203307 [8:03:33<224:40:52,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7040/203307 [8:03:33<224:40:52,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7041/203307 [8:03:36<224:40:38,  0.24it/s, v_num=t5e6, training/loss=0.107]Epoch 0:   3%|▎         | 7041/203307 [8:03:36<224:40:38,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7042/203307 [8:03:41<224:40:47,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7042/203307 [8:03:41<224:40:47,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7043/203307 [8:03:45<224:40:32,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7043/203307 [8:03:45<224:40:32,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7044/203307 [8:03:48<224:40:17,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7044/203307 [8:03:48<224:40:18,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7045/203307 [8:03:53<224:40:19,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7045/203307 [8:03:53<224:40:19,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7046/203307 [8:03:57<224:40:07,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7046/203307 [8:03:57<224:40:07,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7047/203307 [8:04:01<224:40:10,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7047/203307 [8:04:01<224:40:10,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7048/203307 [8:04:05<224:39:56,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7048/203307 [8:04:05<224:39:56,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7049/203307 [8:04:08<224:39:41,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7049/203307 [8:04:08<224:39:41,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7050/203307 [8:04:13<224:39:51,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7050/203307 [8:04:13<224:39:51,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7051/203307 [8:04:17<224:39:37,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7051/203307 [8:04:17<224:39:37,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7052/203307 [8:04:21<224:39:23,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7052/203307 [8:04:21<224:39:23,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7053/203307 [8:04:25<224:39:26,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7053/203307 [8:04:25<224:39:26,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7054/203307 [8:04:29<224:39:24,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7054/203307 [8:04:29<224:39:24,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7055/203307 [8:04:33<224:39:09,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7055/203307 [8:04:33<224:39:09,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7056/203307 [8:04:37<224:39:13,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7056/203307 [8:04:37<224:39:13,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7057/203307 [8:04:41<224:38:59,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7057/203307 [8:04:41<224:38:59,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7058/203307 [8:04:45<224:38:45,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7058/203307 [8:04:45<224:38:45,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7059/203307 [8:04:49<224:38:52,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7059/203307 [8:04:49<224:38:52,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7060/203307 [8:04:53<224:38:37,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7060/203307 [8:04:53<224:38:37,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7061/203307 [8:04:57<224:38:22,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   3%|▎         | 7061/203307 [8:04:57<224:38:23,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7062/203307 [8:05:01<224:38:26,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7062/203307 [8:05:01<224:38:26,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7063/203307 [8:05:05<224:38:23,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7063/203307 [8:05:05<224:38:23,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7064/203307 [8:05:09<224:38:09,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7064/203307 [8:05:09<224:38:09,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7065/203307 [8:05:14<224:38:13,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7065/203307 [8:05:14<224:38:13,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7066/203307 [8:05:17<224:37:58,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7066/203307 [8:05:17<224:37:58,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7067/203307 [8:05:22<224:38:01,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7067/203307 [8:05:22<224:38:02,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7068/203307 [8:05:26<224:37:47,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7068/203307 [8:05:26<224:37:47,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7069/203307 [8:05:29<224:37:30,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7069/203307 [8:05:29<224:37:31,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7070/203307 [8:05:34<224:37:32,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7070/203307 [8:05:34<224:37:32,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7071/203307 [8:05:37<224:37:19,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7071/203307 [8:05:37<224:37:19,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7072/203307 [8:05:42<224:37:17,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7072/203307 [8:05:42<224:37:17,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7073/203307 [8:05:46<224:37:21,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7073/203307 [8:05:46<224:37:21,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7074/203307 [8:05:50<224:37:04,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7074/203307 [8:05:50<224:37:04,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7075/203307 [8:05:54<224:37:08,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7075/203307 [8:05:54<224:37:09,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7076/203307 [8:05:58<224:36:53,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7076/203307 [8:05:58<224:36:53,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7077/203307 [8:06:02<224:36:45,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7077/203307 [8:06:02<224:36:46,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7078/203307 [8:06:06<224:36:45,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7078/203307 [8:06:06<224:36:45,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7079/203307 [8:06:10<224:36:30,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7079/203307 [8:06:10<224:36:30,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7080/203307 [8:06:13<224:36:12,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7080/203307 [8:06:13<224:36:12,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7081/203307 [8:06:18<224:36:15,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   3%|▎         | 7081/203307 [8:06:18<224:36:15,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7082/203307 [8:06:22<224:36:18,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7082/203307 [8:06:22<224:36:18,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7083/203307 [8:06:26<224:36:00,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7083/203307 [8:06:26<224:36:01,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7084/203307 [8:06:30<224:36:05,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7084/203307 [8:06:30<224:36:06,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7085/203307 [8:06:34<224:35:48,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7085/203307 [8:06:34<224:35:49,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7086/203307 [8:06:38<224:35:35,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7086/203307 [8:06:38<224:35:35,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7087/203307 [8:06:42<224:35:39,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7087/203307 [8:06:42<224:35:39,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7088/203307 [8:06:46<224:35:25,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7088/203307 [8:06:46<224:35:25,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7089/203307 [8:06:49<224:35:08,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7089/203307 [8:06:49<224:35:08,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7090/203307 [8:06:54<224:35:09,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7090/203307 [8:06:54<224:35:09,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7091/203307 [8:06:58<224:35:11,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7091/203307 [8:06:58<224:35:11,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7092/203307 [8:07:02<224:35:13,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7092/203307 [8:07:02<224:35:13,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7093/203307 [8:07:06<224:34:56,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7093/203307 [8:07:06<224:34:57,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7094/203307 [8:07:10<224:34:42,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7094/203307 [8:07:10<224:34:42,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7095/203307 [8:07:14<224:34:45,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7095/203307 [8:07:14<224:34:45,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7096/203307 [8:07:18<224:34:30,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7096/203307 [8:07:18<224:34:31,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7097/203307 [8:07:22<224:34:16,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7097/203307 [8:07:22<224:34:16,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7098/203307 [8:07:25<224:33:59,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7098/203307 [8:07:25<224:33:59,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7099/203307 [8:07:30<224:34:04,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7099/203307 [8:07:30<224:34:05,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7100/203307 [8:07:34<224:34:10,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7100/203307 [8:07:34<224:34:11,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7101/203307 [8:07:38<224:33:55,  0.24it/s, v_num=t5e6, training/loss=0.0929]Epoch 0:   3%|▎         | 7101/203307 [8:07:38<224:33:56,  0.24it/s, v_num=t5e6, training/loss=0.100] Epoch 0:   3%|▎         | 7102/203307 [8:07:42<224:33:39,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 7102/203307 [8:07:42<224:33:39,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 7103/203307 [8:07:46<224:33:44,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 7103/203307 [8:07:46<224:33:44,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 7104/203307 [8:07:50<224:33:29,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 7104/203307 [8:07:50<224:33:29,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 7105/203307 [8:07:54<224:33:15,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 7105/203307 [8:07:54<224:33:15,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 7106/203307 [8:07:57<224:33:02,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 7106/203307 [8:07:57<224:33:02,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 7107/203307 [8:08:01<224:32:46,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 7107/203307 [8:08:01<224:32:46,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 7108/203307 [8:08:06<224:32:51,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 7108/203307 [8:08:06<224:32:51,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 7109/203307 [8:08:10<224:32:57,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 7109/203307 [8:08:10<224:32:57,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 7110/203307 [8:08:14<224:32:41,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 7110/203307 [8:08:14<224:32:41,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 7111/203307 [8:08:18<224:32:27,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 7111/203307 [8:08:18<224:32:27,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 7112/203307 [8:08:22<224:32:29,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 7112/203307 [8:08:22<224:32:29,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 7113/203307 [8:08:26<224:32:14,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 7113/203307 [8:08:26<224:32:14,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 7114/203307 [8:08:29<224:31:59,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 7114/203307 [8:08:29<224:31:59,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 7115/203307 [8:08:33<224:31:47,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   3%|▎         | 7115/203307 [8:08:33<224:31:47,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7116/203307 [8:08:37<224:31:30,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7116/203307 [8:08:37<224:31:30,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7117/203307 [8:08:41<224:31:37,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7117/203307 [8:08:41<224:31:37,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7118/203307 [8:08:45<224:31:23,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7118/203307 [8:08:45<224:31:23,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7119/203307 [8:08:49<224:31:08,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7119/203307 [8:08:49<224:31:08,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7120/203307 [8:08:53<224:31:09,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7120/203307 [8:08:53<224:31:10,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7121/203307 [8:08:57<224:30:55,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7121/203307 [8:08:57<224:30:56,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7122/203307 [8:09:01<224:30:39,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7122/203307 [8:09:01<224:30:40,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7123/203307 [8:09:04<224:30:25,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7123/203307 [8:09:04<224:30:25,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7124/203307 [8:09:08<224:30:11,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7124/203307 [8:09:08<224:30:12,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7125/203307 [8:09:13<224:30:18,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7125/203307 [8:09:13<224:30:18,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7126/203307 [8:09:17<224:30:17,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7126/203307 [8:09:17<224:30:17,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7127/203307 [8:09:21<224:30:02,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7127/203307 [8:09:21<224:30:02,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7128/203307 [8:09:25<224:30:06,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7128/203307 [8:09:25<224:30:06,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7129/203307 [8:09:29<224:29:52,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7129/203307 [8:09:29<224:29:52,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7130/203307 [8:09:32<224:29:35,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7130/203307 [8:09:32<224:29:35,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7131/203307 [8:09:36<224:29:20,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7131/203307 [8:09:36<224:29:20,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7132/203307 [8:09:40<224:29:04,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7132/203307 [8:09:40<224:29:04,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7133/203307 [8:09:44<224:28:49,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7133/203307 [8:09:44<224:28:49,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7134/203307 [8:09:48<224:28:54,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7134/203307 [8:09:48<224:28:54,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7135/203307 [8:09:52<224:28:51,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7135/203307 [8:09:52<224:28:52,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7136/203307 [8:09:56<224:28:36,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7136/203307 [8:09:56<224:28:36,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7137/203307 [8:10:00<224:28:37,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7137/203307 [8:10:00<224:28:37,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7138/203307 [8:10:04<224:28:20,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7138/203307 [8:10:04<224:28:20,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7139/203307 [8:10:08<224:28:03,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7139/203307 [8:10:08<224:28:03,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7140/203307 [8:10:11<224:27:48,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7140/203307 [8:10:11<224:27:48,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7141/203307 [8:10:15<224:27:34,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   4%|▎         | 7141/203307 [8:10:15<224:27:34,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7142/203307 [8:10:19<224:27:36,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7142/203307 [8:10:19<224:27:37,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7143/203307 [8:10:24<224:27:42,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7143/203307 [8:10:24<224:27:42,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7144/203307 [8:10:28<224:27:40,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7144/203307 [8:10:28<224:27:41,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7145/203307 [8:10:32<224:27:41,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7145/203307 [8:10:32<224:27:42,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7146/203307 [8:10:36<224:27:28,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7146/203307 [8:10:36<224:27:28,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7147/203307 [8:10:40<224:27:13,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7147/203307 [8:10:40<224:27:14,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7148/203307 [8:10:44<224:26:58,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7148/203307 [8:10:44<224:26:58,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7149/203307 [8:10:47<224:26:44,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7149/203307 [8:10:47<224:26:44,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7150/203307 [8:10:52<224:26:49,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7150/203307 [8:10:52<224:26:49,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7151/203307 [8:10:56<224:26:54,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7151/203307 [8:10:56<224:26:54,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7152/203307 [8:11:00<224:26:40,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7152/203307 [8:11:00<224:26:41,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7153/203307 [8:11:04<224:26:45,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7153/203307 [8:11:04<224:26:45,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7154/203307 [8:11:08<224:26:32,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7154/203307 [8:11:08<224:26:32,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7155/203307 [8:11:12<224:26:18,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7155/203307 [8:11:12<224:26:18,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7156/203307 [8:11:16<224:26:03,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7156/203307 [8:11:16<224:26:03,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7157/203307 [8:11:19<224:25:47,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7157/203307 [8:11:19<224:25:48,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7158/203307 [8:11:23<224:25:32,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7158/203307 [8:11:23<224:25:32,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7159/203307 [8:11:28<224:25:38,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7159/203307 [8:11:28<224:25:38,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7160/203307 [8:11:32<224:25:41,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7160/203307 [8:11:32<224:25:41,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7161/203307 [8:11:36<224:25:26,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   4%|▎         | 7161/203307 [8:11:36<224:25:26,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7162/203307 [8:11:40<224:25:26,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7162/203307 [8:11:40<224:25:26,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7163/203307 [8:11:44<224:25:10,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7163/203307 [8:11:44<224:25:10,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7164/203307 [8:11:47<224:24:53,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7164/203307 [8:11:47<224:24:53,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7165/203307 [8:11:51<224:24:38,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7165/203307 [8:11:51<224:24:38,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7166/203307 [8:11:55<224:24:23,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7166/203307 [8:11:55<224:24:23,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7167/203307 [8:11:59<224:24:29,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7167/203307 [8:11:59<224:24:29,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7168/203307 [8:12:03<224:24:16,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7168/203307 [8:12:03<224:24:16,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7169/203307 [8:12:07<224:24:21,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7169/203307 [8:12:07<224:24:21,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7170/203307 [8:12:12<224:24:21,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7170/203307 [8:12:12<224:24:21,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7171/203307 [8:12:16<224:24:18,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7171/203307 [8:12:16<224:24:19,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7172/203307 [8:12:20<224:24:04,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7172/203307 [8:12:20<224:24:04,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7173/203307 [8:12:23<224:23:48,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7173/203307 [8:12:23<224:23:48,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7174/203307 [8:12:27<224:23:32,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7174/203307 [8:12:27<224:23:32,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7175/203307 [8:12:32<224:23:39,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7175/203307 [8:12:32<224:23:39,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7176/203307 [8:12:35<224:23:24,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7176/203307 [8:12:35<224:23:24,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7177/203307 [8:12:40<224:23:29,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7177/203307 [8:12:40<224:23:29,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7178/203307 [8:12:44<224:23:29,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7178/203307 [8:12:44<224:23:30,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7179/203307 [8:12:48<224:23:15,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7179/203307 [8:12:48<224:23:16,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7180/203307 [8:12:52<224:23:16,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7180/203307 [8:12:52<224:23:16,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7181/203307 [8:12:56<224:23:02,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▎         | 7181/203307 [8:12:56<224:23:03,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7182/203307 [8:13:00<224:22:49,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7182/203307 [8:13:00<224:22:49,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7183/203307 [8:13:03<224:22:36,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7183/203307 [8:13:03<224:22:36,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7184/203307 [8:13:08<224:22:40,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7184/203307 [8:13:08<224:22:40,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7185/203307 [8:13:11<224:22:23,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7185/203307 [8:13:11<224:22:23,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7186/203307 [8:13:16<224:22:30,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7186/203307 [8:13:16<224:22:31,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7187/203307 [8:13:20<224:22:32,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7187/203307 [8:13:20<224:22:32,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7188/203307 [8:13:24<224:22:19,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7188/203307 [8:13:24<224:22:19,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7189/203307 [8:13:28<224:22:18,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7189/203307 [8:13:28<224:22:18,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7190/203307 [8:13:32<224:22:03,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7190/203307 [8:13:32<224:22:03,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7191/203307 [8:13:36<224:21:46,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7191/203307 [8:13:36<224:21:46,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7192/203307 [8:13:40<224:21:52,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7192/203307 [8:13:40<224:21:52,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7193/203307 [8:13:44<224:21:39,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7193/203307 [8:13:44<224:21:39,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7194/203307 [8:13:48<224:21:24,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7194/203307 [8:13:48<224:21:24,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7195/203307 [8:13:52<224:21:30,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7195/203307 [8:13:52<224:21:30,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7196/203307 [8:13:56<224:21:15,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7196/203307 [8:13:56<224:21:16,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7197/203307 [8:14:00<224:20:59,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7197/203307 [8:14:00<224:20:59,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7198/203307 [8:14:04<224:21:00,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7198/203307 [8:14:04<224:21:00,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7199/203307 [8:14:08<224:20:46,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7199/203307 [8:14:08<224:20:46,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7200/203307 [8:14:12<224:20:50,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7200/203307 [8:14:12<224:20:50,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7201/203307 [8:14:16<224:20:36,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   4%|▎         | 7201/203307 [8:14:16<224:20:36,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7202/203307 [8:14:20<224:20:22,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7202/203307 [8:14:20<224:20:22,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7203/203307 [8:14:24<224:20:25,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7203/203307 [8:14:24<224:20:25,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7204/203307 [8:14:28<224:20:10,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7204/203307 [8:14:28<224:20:10,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7205/203307 [8:14:31<224:19:55,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7205/203307 [8:14:31<224:19:55,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7206/203307 [8:14:35<224:19:39,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7206/203307 [8:14:35<224:19:39,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7207/203307 [8:14:39<224:19:38,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7207/203307 [8:14:39<224:19:38,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7208/203307 [8:14:43<224:19:24,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7208/203307 [8:14:43<224:19:25,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7209/203307 [8:14:48<224:19:29,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7209/203307 [8:14:48<224:19:30,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7210/203307 [8:14:51<224:19:13,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7210/203307 [8:14:51<224:19:13,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7211/203307 [8:14:55<224:18:58,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7211/203307 [8:14:55<224:18:59,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7212/203307 [8:14:59<224:19:05,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7212/203307 [8:14:59<224:19:05,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7213/203307 [8:15:03<224:18:47,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7213/203307 [8:15:03<224:18:48,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7214/203307 [8:15:07<224:18:32,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7214/203307 [8:15:07<224:18:32,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7215/203307 [8:15:10<224:18:16,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7215/203307 [8:15:10<224:18:16,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7216/203307 [8:15:15<224:18:18,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7216/203307 [8:15:15<224:18:18,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7217/203307 [8:15:19<224:18:21,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7217/203307 [8:15:19<224:18:21,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7218/203307 [8:15:23<224:18:05,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7218/203307 [8:15:23<224:18:05,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7219/203307 [8:15:27<224:17:52,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7219/203307 [8:15:27<224:17:53,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7220/203307 [8:15:31<224:17:54,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7220/203307 [8:15:31<224:17:55,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7221/203307 [8:15:35<224:17:59,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   4%|▎         | 7221/203307 [8:15:36<224:18:00,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7222/203307 [8:15:39<224:17:44,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7222/203307 [8:15:39<224:17:44,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7223/203307 [8:15:43<224:17:28,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7223/203307 [8:15:43<224:17:28,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7224/203307 [8:15:47<224:17:12,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7224/203307 [8:15:47<224:17:12,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7225/203307 [8:15:51<224:17:19,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7225/203307 [8:15:51<224:17:19,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7226/203307 [8:15:55<224:17:07,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7226/203307 [8:15:55<224:17:07,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7227/203307 [8:15:59<224:16:52,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7227/203307 [8:15:59<224:16:52,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7228/203307 [8:16:03<224:16:54,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7228/203307 [8:16:03<224:16:54,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7229/203307 [8:16:07<224:16:59,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7229/203307 [8:16:07<224:16:59,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7230/203307 [8:16:11<224:16:44,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7230/203307 [8:16:11<224:16:44,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7231/203307 [8:16:15<224:16:29,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7231/203307 [8:16:15<224:16:29,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7232/203307 [8:16:19<224:16:17,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7232/203307 [8:16:19<224:16:17,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7233/203307 [8:16:22<224:16:02,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7233/203307 [8:16:22<224:16:02,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7234/203307 [8:16:27<224:16:06,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7234/203307 [8:16:27<224:16:06,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7235/203307 [8:16:31<224:15:53,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7235/203307 [8:16:31<224:15:53,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7236/203307 [8:16:34<224:15:38,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7236/203307 [8:16:34<224:15:38,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7237/203307 [8:16:39<224:15:39,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7237/203307 [8:16:39<224:15:39,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7238/203307 [8:16:43<224:15:41,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7238/203307 [8:16:43<224:15:41,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7239/203307 [8:16:47<224:15:25,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7239/203307 [8:16:47<224:15:25,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7240/203307 [8:16:50<224:15:10,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7240/203307 [8:16:50<224:15:10,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7241/203307 [8:16:54<224:14:56,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7241/203307 [8:16:54<224:14:56,  0.24it/s, v_num=t5e6, training/loss=0.088] Epoch 0:   4%|▎         | 7242/203307 [8:16:59<224:15:01,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7242/203307 [8:16:59<224:15:02,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7243/203307 [8:17:03<224:14:59,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7243/203307 [8:17:03<224:14:59,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7244/203307 [8:17:06<224:14:42,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7244/203307 [8:17:06<224:14:43,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7245/203307 [8:17:11<224:14:43,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7245/203307 [8:17:11<224:14:44,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7246/203307 [8:17:15<224:14:31,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7246/203307 [8:17:15<224:14:31,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7247/203307 [8:17:19<224:14:37,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7247/203307 [8:17:19<224:14:37,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7248/203307 [8:17:23<224:14:22,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7248/203307 [8:17:23<224:14:22,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7249/203307 [8:17:26<224:14:07,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7249/203307 [8:17:26<224:14:07,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7250/203307 [8:17:31<224:14:15,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7250/203307 [8:17:31<224:14:15,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7251/203307 [8:17:35<224:14:01,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7251/203307 [8:17:35<224:14:02,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7252/203307 [8:17:39<224:14:05,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7252/203307 [8:17:39<224:14:05,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7253/203307 [8:17:44<224:14:07,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7253/203307 [8:17:44<224:14:07,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7254/203307 [8:17:47<224:13:52,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7254/203307 [8:17:47<224:13:52,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7255/203307 [8:17:52<224:13:55,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7255/203307 [8:17:52<224:13:56,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7256/203307 [8:17:55<224:13:42,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7256/203307 [8:17:55<224:13:42,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7257/203307 [8:17:59<224:13:28,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7257/203307 [8:17:59<224:13:28,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7258/203307 [8:18:03<224:13:16,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7258/203307 [8:18:03<224:13:16,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7259/203307 [8:18:08<224:13:22,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7259/203307 [8:18:08<224:13:23,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7260/203307 [8:18:11<224:13:08,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7260/203307 [8:18:11<224:13:08,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7261/203307 [8:18:16<224:13:10,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   4%|▎         | 7261/203307 [8:18:16<224:13:10,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7262/203307 [8:18:20<224:13:11,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7262/203307 [8:18:20<224:13:11,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7263/203307 [8:18:24<224:12:56,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7263/203307 [8:18:24<224:12:56,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7264/203307 [8:18:28<224:12:58,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7264/203307 [8:18:28<224:12:58,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7265/203307 [8:18:32<224:12:43,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7265/203307 [8:18:32<224:12:43,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7266/203307 [8:18:35<224:12:26,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7266/203307 [8:18:35<224:12:26,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7267/203307 [8:18:40<224:12:33,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7267/203307 [8:18:40<224:12:33,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7268/203307 [8:18:44<224:12:19,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7268/203307 [8:18:44<224:12:19,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7269/203307 [8:18:47<224:12:03,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7269/203307 [8:18:47<224:12:03,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7270/203307 [8:18:52<224:12:03,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7270/203307 [8:18:52<224:12:04,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7271/203307 [8:18:55<224:11:47,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7271/203307 [8:18:55<224:11:47,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7272/203307 [8:18:59<224:11:32,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7272/203307 [8:18:59<224:11:32,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7273/203307 [8:19:03<224:11:34,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7273/203307 [8:19:03<224:11:34,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7274/203307 [8:19:07<224:11:16,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7274/203307 [8:19:07<224:11:16,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7275/203307 [8:19:11<224:11:20,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7275/203307 [8:19:11<224:11:20,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7276/203307 [8:19:15<224:11:04,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7276/203307 [8:19:15<224:11:04,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7277/203307 [8:19:19<224:10:51,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7277/203307 [8:19:19<224:10:51,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7278/203307 [8:19:23<224:10:53,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7278/203307 [8:19:23<224:10:53,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7279/203307 [8:19:27<224:10:51,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7279/203307 [8:19:27<224:10:51,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7280/203307 [8:19:31<224:10:36,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7280/203307 [8:19:31<224:10:36,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7281/203307 [8:19:35<224:10:40,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▎         | 7281/203307 [8:19:35<224:10:40,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7282/203307 [8:19:39<224:10:25,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7282/203307 [8:19:39<224:10:26,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7283/203307 [8:19:43<224:10:12,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7283/203307 [8:19:43<224:10:12,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7284/203307 [8:19:47<224:10:17,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7284/203307 [8:19:47<224:10:18,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7285/203307 [8:19:51<224:10:02,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7285/203307 [8:19:51<224:10:02,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7286/203307 [8:19:55<224:09:48,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7286/203307 [8:19:55<224:09:48,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7287/203307 [8:19:59<224:09:50,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7287/203307 [8:19:59<224:09:50,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7288/203307 [8:20:03<224:09:49,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7288/203307 [8:20:03<224:09:49,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7289/203307 [8:20:07<224:09:35,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7289/203307 [8:20:07<224:09:35,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7290/203307 [8:20:12<224:09:38,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7290/203307 [8:20:12<224:09:38,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7291/203307 [8:20:15<224:09:24,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7291/203307 [8:20:15<224:09:24,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7292/203307 [8:20:20<224:09:28,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7292/203307 [8:20:20<224:09:28,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7293/203307 [8:20:23<224:09:13,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7293/203307 [8:20:23<224:09:13,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7294/203307 [8:20:27<224:08:57,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7294/203307 [8:20:27<224:08:57,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7295/203307 [8:20:31<224:08:58,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7295/203307 [8:20:31<224:08:58,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7296/203307 [8:20:35<224:08:42,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7296/203307 [8:20:35<224:08:42,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7297/203307 [8:20:39<224:08:43,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7297/203307 [8:20:39<224:08:43,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7298/203307 [8:20:43<224:08:27,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7298/203307 [8:20:43<224:08:27,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7299/203307 [8:20:47<224:08:30,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7299/203307 [8:20:47<224:08:30,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7300/203307 [8:20:52<224:08:32,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7300/203307 [8:20:52<224:08:33,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7301/203307 [8:20:55<224:08:16,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   4%|▎         | 7301/203307 [8:20:55<224:08:16,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7302/203307 [8:20:59<224:07:59,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7302/203307 [8:20:59<224:07:59,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7303/203307 [8:21:03<224:08:00,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7303/203307 [8:21:03<224:08:00,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7304/203307 [8:21:07<224:07:44,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7304/203307 [8:21:07<224:07:44,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7305/203307 [8:21:11<224:07:30,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7305/203307 [8:21:11<224:07:31,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7306/203307 [8:21:15<224:07:32,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7306/203307 [8:21:15<224:07:32,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7307/203307 [8:21:20<224:07:34,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7307/203307 [8:21:20<224:07:34,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7308/203307 [8:21:23<224:07:20,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7308/203307 [8:21:23<224:07:20,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7309/203307 [8:21:28<224:07:27,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7309/203307 [8:21:28<224:07:27,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7310/203307 [8:21:32<224:07:12,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7310/203307 [8:21:32<224:07:12,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7311/203307 [8:21:35<224:06:57,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7311/203307 [8:21:35<224:06:57,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7312/203307 [8:21:40<224:06:59,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7312/203307 [8:21:40<224:07:00,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7313/203307 [8:21:43<224:06:44,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7313/203307 [8:21:43<224:06:44,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7314/203307 [8:21:47<224:06:27,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7314/203307 [8:21:47<224:06:28,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7315/203307 [8:21:51<224:06:28,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7315/203307 [8:21:51<224:06:28,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7316/203307 [8:21:56<224:06:33,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7316/203307 [8:21:56<224:06:33,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7317/203307 [8:22:00<224:06:35,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7317/203307 [8:22:00<224:06:35,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7318/203307 [8:22:04<224:06:20,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7318/203307 [8:22:04<224:06:20,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7319/203307 [8:22:07<224:06:06,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7319/203307 [8:22:07<224:06:06,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7320/203307 [8:22:12<224:06:04,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7320/203307 [8:22:12<224:06:04,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7321/203307 [8:22:15<224:05:49,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▎         | 7321/203307 [8:22:15<224:05:50,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7322/203307 [8:22:19<224:05:35,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7322/203307 [8:22:19<224:05:36,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7323/203307 [8:22:23<224:05:20,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7323/203307 [8:22:23<224:05:20,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7324/203307 [8:22:27<224:05:21,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7324/203307 [8:22:27<224:05:21,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7325/203307 [8:22:32<224:05:26,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7325/203307 [8:22:32<224:05:26,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7326/203307 [8:22:35<224:05:11,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7326/203307 [8:22:35<224:05:12,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7327/203307 [8:22:39<224:04:58,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7327/203307 [8:22:39<224:04:58,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7328/203307 [8:22:43<224:05:00,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7328/203307 [8:22:43<224:05:00,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7329/203307 [8:22:47<224:04:45,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7329/203307 [8:22:47<224:04:45,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7330/203307 [8:22:51<224:04:29,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7330/203307 [8:22:51<224:04:29,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7331/203307 [8:22:55<224:04:15,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7331/203307 [8:22:55<224:04:15,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7332/203307 [8:22:58<224:04:00,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7332/203307 [8:22:58<224:04:00,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7333/203307 [8:23:03<224:04:05,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7333/203307 [8:23:03<224:04:05,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7334/203307 [8:23:07<224:04:10,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7334/203307 [8:23:07<224:04:10,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7335/203307 [8:23:11<224:03:53,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7335/203307 [8:23:11<224:03:53,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7336/203307 [8:23:14<224:03:37,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7336/203307 [8:23:15<224:03:37,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7337/203307 [8:23:19<224:03:42,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7337/203307 [8:23:19<224:03:42,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7338/203307 [8:23:23<224:03:26,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7338/203307 [8:23:23<224:03:26,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7339/203307 [8:23:26<224:03:11,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7339/203307 [8:23:26<224:03:11,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7340/203307 [8:23:30<224:02:55,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7340/203307 [8:23:30<224:02:55,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7341/203307 [8:23:34<224:02:40,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   4%|▎         | 7341/203307 [8:23:34<224:02:40,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7342/203307 [8:23:38<224:02:46,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7342/203307 [8:23:38<224:02:46,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7343/203307 [8:23:42<224:02:30,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7343/203307 [8:23:42<224:02:30,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7344/203307 [8:23:46<224:02:13,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7344/203307 [8:23:46<224:02:13,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7345/203307 [8:23:50<224:02:15,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7345/203307 [8:23:50<224:02:15,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7346/203307 [8:23:53<224:01:58,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7346/203307 [8:23:53<224:01:58,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7347/203307 [8:23:57<224:01:42,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7347/203307 [8:23:57<224:01:42,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7348/203307 [8:24:01<224:01:27,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7348/203307 [8:24:01<224:01:28,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7349/203307 [8:24:05<224:01:13,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7349/203307 [8:24:05<224:01:13,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7350/203307 [8:24:09<224:01:18,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7350/203307 [8:24:09<224:01:18,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7351/203307 [8:24:13<224:01:21,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7351/203307 [8:24:13<224:01:21,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7352/203307 [8:24:17<224:01:06,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7352/203307 [8:24:17<224:01:06,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7353/203307 [8:24:22<224:01:09,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7353/203307 [8:24:22<224:01:09,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7354/203307 [8:24:25<224:00:55,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7354/203307 [8:24:25<224:00:55,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7355/203307 [8:24:29<224:00:40,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7355/203307 [8:24:29<224:00:40,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7356/203307 [8:24:33<224:00:26,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7356/203307 [8:24:33<224:00:27,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7357/203307 [8:24:36<224:00:11,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7357/203307 [8:24:36<224:00:11,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7358/203307 [8:24:40<223:59:56,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7358/203307 [8:24:40<223:59:56,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7359/203307 [8:24:45<224:00:02,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7359/203307 [8:24:45<224:00:02,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7360/203307 [8:24:49<223:59:58,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7360/203307 [8:24:49<223:59:58,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7361/203307 [8:24:52<223:59:42,  0.24it/s, v_num=t5e6, training/loss=0.0777]Epoch 0:   4%|▎         | 7361/203307 [8:24:52<223:59:42,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7362/203307 [8:24:57<223:59:44,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7362/203307 [8:24:57<223:59:44,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7363/203307 [8:25:00<223:59:29,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7363/203307 [8:25:00<223:59:29,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7364/203307 [8:25:04<223:59:14,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7364/203307 [8:25:04<223:59:14,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7365/203307 [8:25:08<223:59:00,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7365/203307 [8:25:08<223:59:00,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7366/203307 [8:25:12<223:58:47,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7366/203307 [8:25:12<223:58:48,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7367/203307 [8:25:16<223:58:51,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7367/203307 [8:25:16<223:58:52,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7368/203307 [8:25:21<223:58:56,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7368/203307 [8:25:21<223:58:56,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7369/203307 [8:25:25<223:58:54,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7369/203307 [8:25:25<223:58:54,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7370/203307 [8:25:29<223:58:53,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7370/203307 [8:25:29<223:58:53,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7371/203307 [8:25:33<223:58:37,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7371/203307 [8:25:33<223:58:38,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7372/203307 [8:25:36<223:58:24,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7372/203307 [8:25:36<223:58:24,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7373/203307 [8:25:40<223:58:12,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7373/203307 [8:25:40<223:58:12,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7374/203307 [8:25:44<223:57:58,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7374/203307 [8:25:44<223:57:59,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7375/203307 [8:25:48<223:58:03,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7375/203307 [8:25:48<223:58:03,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7376/203307 [8:25:52<223:57:49,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7376/203307 [8:25:52<223:57:49,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7377/203307 [8:25:57<223:57:54,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7377/203307 [8:25:57<223:57:54,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7378/203307 [8:26:01<223:57:55,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7378/203307 [8:26:01<223:57:55,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7379/203307 [8:26:05<223:57:41,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7379/203307 [8:26:05<223:57:41,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7380/203307 [8:26:08<223:57:26,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7380/203307 [8:26:08<223:57:26,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7381/203307 [8:26:12<223:57:14,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:   4%|▎         | 7381/203307 [8:26:12<223:57:14,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7382/203307 [8:26:16<223:57:02,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7382/203307 [8:26:16<223:57:03,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7383/203307 [8:26:20<223:56:50,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7383/203307 [8:26:20<223:56:50,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7384/203307 [8:26:24<223:56:56,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7384/203307 [8:26:24<223:56:56,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7385/203307 [8:26:29<223:56:58,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7385/203307 [8:26:29<223:56:58,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7386/203307 [8:26:33<223:56:44,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7386/203307 [8:26:33<223:56:44,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7387/203307 [8:26:37<223:56:47,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7387/203307 [8:26:37<223:56:47,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7388/203307 [8:26:41<223:56:33,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7388/203307 [8:26:41<223:56:34,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7389/203307 [8:26:44<223:56:18,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7389/203307 [8:26:44<223:56:18,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7390/203307 [8:26:48<223:56:03,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7390/203307 [8:26:48<223:56:03,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7391/203307 [8:26:52<223:55:47,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7391/203307 [8:26:52<223:55:47,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7392/203307 [8:26:56<223:55:51,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7392/203307 [8:26:56<223:55:51,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7393/203307 [8:27:00<223:55:39,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7393/203307 [8:27:00<223:55:39,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7394/203307 [8:27:04<223:55:43,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7394/203307 [8:27:04<223:55:43,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7395/203307 [8:27:09<223:55:41,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7395/203307 [8:27:09<223:55:41,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7396/203307 [8:27:13<223:55:37,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7396/203307 [8:27:13<223:55:38,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7397/203307 [8:27:16<223:55:22,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7397/203307 [8:27:16<223:55:22,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7398/203307 [8:27:20<223:55:08,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7398/203307 [8:27:20<223:55:08,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7399/203307 [8:27:24<223:54:55,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7399/203307 [8:27:24<223:54:55,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7400/203307 [8:27:28<223:55:02,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7400/203307 [8:27:28<223:55:02,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7401/203307 [8:27:32<223:54:49,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   4%|▎         | 7401/203307 [8:27:32<223:54:49,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7402/203307 [8:27:36<223:54:33,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7402/203307 [8:27:36<223:54:33,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7403/203307 [8:27:40<223:54:39,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7403/203307 [8:27:40<223:54:39,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7404/203307 [8:27:44<223:54:26,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7404/203307 [8:27:44<223:54:26,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7405/203307 [8:27:48<223:54:22,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7405/203307 [8:27:48<223:54:22,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7406/203307 [8:27:52<223:54:08,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7406/203307 [8:27:52<223:54:08,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7407/203307 [8:27:56<223:53:52,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7407/203307 [8:27:56<223:53:52,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7408/203307 [8:27:59<223:53:39,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7408/203307 [8:27:59<223:53:39,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7409/203307 [8:28:04<223:53:45,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7409/203307 [8:28:04<223:53:46,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7410/203307 [8:28:08<223:53:33,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7410/203307 [8:28:08<223:53:33,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7411/203307 [8:28:12<223:53:36,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7411/203307 [8:28:12<223:53:36,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7412/203307 [8:28:16<223:53:37,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7412/203307 [8:28:16<223:53:37,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7413/203307 [8:28:20<223:53:24,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7413/203307 [8:28:20<223:53:24,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7414/203307 [8:28:24<223:53:24,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7414/203307 [8:28:24<223:53:24,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7415/203307 [8:28:28<223:53:09,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7415/203307 [8:28:28<223:53:10,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7416/203307 [8:28:32<223:52:56,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7416/203307 [8:28:32<223:52:56,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7417/203307 [8:28:37<223:53:04,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7417/203307 [8:28:37<223:53:04,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7418/203307 [8:28:40<223:52:52,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7418/203307 [8:28:40<223:52:52,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7419/203307 [8:28:44<223:52:41,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7419/203307 [8:28:44<223:52:41,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7420/203307 [8:28:49<223:52:48,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7420/203307 [8:28:49<223:52:48,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7421/203307 [8:28:53<223:52:35,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   4%|▎         | 7421/203307 [8:28:53<223:52:35,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7422/203307 [8:28:56<223:52:22,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7422/203307 [8:28:56<223:52:22,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7423/203307 [8:29:01<223:52:24,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7423/203307 [8:29:01<223:52:24,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7424/203307 [8:29:04<223:52:10,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7424/203307 [8:29:04<223:52:10,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7425/203307 [8:29:09<223:52:15,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7425/203307 [8:29:09<223:52:15,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7426/203307 [8:29:13<223:52:03,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7426/203307 [8:29:13<223:52:04,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7427/203307 [8:29:16<223:51:49,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7427/203307 [8:29:16<223:51:49,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7428/203307 [8:29:21<223:51:50,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7428/203307 [8:29:21<223:51:50,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7429/203307 [8:29:25<223:51:55,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7429/203307 [8:29:25<223:51:55,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7430/203307 [8:29:29<223:51:42,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7430/203307 [8:29:29<223:51:42,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7431/203307 [8:29:33<223:51:29,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7431/203307 [8:29:33<223:51:29,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7432/203307 [8:29:37<223:51:27,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7432/203307 [8:29:37<223:51:27,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7433/203307 [8:29:41<223:51:15,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7433/203307 [8:29:41<223:51:15,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7434/203307 [8:29:45<223:51:22,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7434/203307 [8:29:45<223:51:22,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7435/203307 [8:29:49<223:51:08,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7435/203307 [8:29:49<223:51:08,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7436/203307 [8:29:53<223:50:54,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7436/203307 [8:29:53<223:50:54,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7437/203307 [8:29:57<223:51:01,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7437/203307 [8:29:57<223:51:01,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7438/203307 [8:30:01<223:50:48,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7438/203307 [8:30:01<223:50:48,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7439/203307 [8:30:05<223:50:34,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7439/203307 [8:30:05<223:50:34,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7440/203307 [8:30:09<223:50:21,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7440/203307 [8:30:09<223:50:22,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7441/203307 [8:30:13<223:50:20,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   4%|▎         | 7441/203307 [8:30:13<223:50:20,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7442/203307 [8:30:17<223:50:23,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7442/203307 [8:30:17<223:50:23,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7443/203307 [8:30:21<223:50:07,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7443/203307 [8:30:21<223:50:08,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7444/203307 [8:30:25<223:49:52,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7444/203307 [8:30:25<223:49:52,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7445/203307 [8:30:29<223:49:53,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7445/203307 [8:30:29<223:49:53,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7446/203307 [8:30:33<223:49:56,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7446/203307 [8:30:33<223:49:56,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7447/203307 [8:30:37<223:49:39,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7447/203307 [8:30:37<223:49:39,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7448/203307 [8:30:41<223:49:22,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7448/203307 [8:30:41<223:49:22,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7449/203307 [8:30:44<223:49:05,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7449/203307 [8:30:44<223:49:05,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7450/203307 [8:30:49<223:49:08,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7450/203307 [8:30:49<223:49:09,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7451/203307 [8:30:52<223:48:53,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7451/203307 [8:30:52<223:48:53,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7452/203307 [8:30:56<223:48:36,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7452/203307 [8:30:56<223:48:37,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7453/203307 [8:31:00<223:48:35,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7453/203307 [8:31:00<223:48:35,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7454/203307 [8:31:04<223:48:19,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7454/203307 [8:31:04<223:48:19,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7455/203307 [8:31:08<223:48:21,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7455/203307 [8:31:08<223:48:21,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7456/203307 [8:31:12<223:48:06,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7456/203307 [8:31:12<223:48:06,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7457/203307 [8:31:16<223:47:52,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7457/203307 [8:31:16<223:47:52,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7458/203307 [8:31:19<223:47:38,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7458/203307 [8:31:19<223:47:38,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7459/203307 [8:31:24<223:47:45,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7459/203307 [8:31:24<223:47:45,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7460/203307 [8:31:28<223:47:30,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7460/203307 [8:31:28<223:47:30,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7461/203307 [8:31:31<223:47:15,  0.24it/s, v_num=t5e6, training/loss=0.0967]Epoch 0:   4%|▎         | 7461/203307 [8:31:31<223:47:15,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7462/203307 [8:31:36<223:47:21,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7462/203307 [8:31:36<223:47:21,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7463/203307 [8:31:40<223:47:24,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7463/203307 [8:31:40<223:47:24,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7464/203307 [8:31:44<223:47:10,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7464/203307 [8:31:44<223:47:10,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7465/203307 [8:31:48<223:46:55,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7465/203307 [8:31:48<223:46:55,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7466/203307 [8:31:51<223:46:40,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7466/203307 [8:31:51<223:46:40,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7467/203307 [8:31:56<223:46:43,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7467/203307 [8:31:56<223:46:44,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7468/203307 [8:32:00<223:46:40,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7468/203307 [8:32:00<223:46:40,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7469/203307 [8:32:03<223:46:24,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7469/203307 [8:32:03<223:46:24,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7470/203307 [8:32:08<223:46:23,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7470/203307 [8:32:08<223:46:23,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7471/203307 [8:32:12<223:46:12,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7471/203307 [8:32:12<223:46:12,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7472/203307 [8:32:16<223:46:15,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7472/203307 [8:32:16<223:46:15,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7473/203307 [8:32:20<223:46:02,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7473/203307 [8:32:20<223:46:02,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7474/203307 [8:32:23<223:45:47,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7474/203307 [8:32:23<223:45:47,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7475/203307 [8:32:28<223:45:51,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7475/203307 [8:32:28<223:45:51,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7476/203307 [8:32:32<223:45:37,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7476/203307 [8:32:32<223:45:38,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7477/203307 [8:32:36<223:45:35,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7477/203307 [8:32:36<223:45:35,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7478/203307 [8:32:40<223:45:35,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7478/203307 [8:32:40<223:45:35,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7479/203307 [8:32:44<223:45:20,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7479/203307 [8:32:44<223:45:20,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7480/203307 [8:32:47<223:45:05,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7480/203307 [8:32:47<223:45:05,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7481/203307 [8:32:52<223:45:09,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▎         | 7481/203307 [8:32:52<223:45:09,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7482/203307 [8:32:55<223:44:53,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7482/203307 [8:32:55<223:44:53,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7483/203307 [8:32:59<223:44:39,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7483/203307 [8:32:59<223:44:39,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7484/203307 [8:33:04<223:44:44,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7484/203307 [8:33:04<223:44:44,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7485/203307 [8:33:07<223:44:28,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7485/203307 [8:33:07<223:44:28,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7486/203307 [8:33:12<223:44:27,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7486/203307 [8:33:12<223:44:28,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7487/203307 [8:33:16<223:44:29,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7487/203307 [8:33:16<223:44:29,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7488/203307 [8:33:19<223:44:11,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7488/203307 [8:33:19<223:44:11,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7489/203307 [8:33:24<223:44:11,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7489/203307 [8:33:24<223:44:11,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7490/203307 [8:33:27<223:43:55,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7490/203307 [8:33:27<223:43:55,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7491/203307 [8:33:31<223:43:38,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7491/203307 [8:33:31<223:43:38,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7492/203307 [8:33:35<223:43:42,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7492/203307 [8:33:35<223:43:42,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7493/203307 [8:33:39<223:43:26,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7493/203307 [8:33:39<223:43:26,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7494/203307 [8:33:43<223:43:09,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7494/203307 [8:33:43<223:43:09,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7495/203307 [8:33:47<223:43:11,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7495/203307 [8:33:47<223:43:11,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7496/203307 [8:33:51<223:42:56,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7496/203307 [8:33:51<223:42:56,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7497/203307 [8:33:54<223:42:41,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7497/203307 [8:33:54<223:42:41,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7498/203307 [8:33:59<223:42:46,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7498/203307 [8:33:59<223:42:46,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7499/203307 [8:34:03<223:42:31,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7499/203307 [8:34:03<223:42:31,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7500/203307 [8:34:07<223:42:34,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7500/203307 [8:34:07<223:42:35,  0.24it/s, v_num=t5e6, training/loss=0.0989]
Validation: |          | 0/? [00:00<?, ?it/s][A
Validation:   0%|          | 0/1 [00:00<?, ?it/s][A


Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s][A[A

Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:23,  1.19it/s][A[A

Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:22,  1.19it/s][A[A

Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:21,  1.19it/s][A[A

Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:20,  1.19it/s][A[A

Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:20,  1.18it/s][A[A

Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:19,  1.18it/s][A[A

Sampling (mamba memory):  54%|█████▎    | 107/200 [00:05<01:17,  1.19it/s][A[A

Sampling (mamba memory):  54%|█████▍    | 108/200 [00:06<01:16,  1.20it/s][A[A

Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:16,  1.19it/s][A[A

Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:15,  1.19it/s][A[A

Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:26,  1.14it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:25,  1.15it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:24,  1.15it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:22,  1.16it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:21,  1.16it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:20,  1.16it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:19,  1.16it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:06<01:19,  1.16it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:18,  1.16it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:17,  1.16it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:16,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:26,  1.14it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:24,  1.16it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:23,  1.16it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:22,  1.16it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:21,  1.16it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:20,  1.16it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:20,  1.16it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:06<01:19,  1.16it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:19,  1.15it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:18,  1.14it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:18,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:27,  1.13it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:26,  1.14it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:25,  1.13it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:24,  1.13it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:24,  1.13it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:23,  1.13it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:22,  1.13it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:21,  1.13it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:20,  1.13it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:19,  1.13it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:18,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:28,  1.12it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:27,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:26,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:25,  1.12it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:24,  1.12it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:23,  1.12it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:23,  1.12it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:22,  1.12it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:21,  1.11it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:21,  1.11it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:20,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:29,  1.10it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:28,  1.11it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:26,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:26,  1.12it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:25,  1.11it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:24,  1.11it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:23,  1.11it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:23,  1.11it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:22,  1.11it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:09<01:21,  1.10it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:20,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:30,  1.10it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:28,  1.10it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:27,  1.10it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:27,  1.10it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:26,  1.10it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:24,  1.11it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:23,  1.11it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:22,  1.11it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:22,  1.11it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:09<01:21,  1.10it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:21,  1.0Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:30,  1.10it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:28,  1.10it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:27,  1.10it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:26,  1.10it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:26,  1.10it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:25,  1.10it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:24,  1.10it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:23,  1.10it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:22,  1.10it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:09<01:22,  1.10it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:10<01:21,  1.0Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:15,  1.18it/s][A[A

Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:15,  1.17it/s][A[A

Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:14,  1.16it/s][A[A

Sampling (mamba memory):  57%|█████▋    | 114/200 [00:11<01:14,  1.16it/s][A[A

Sampling (mamba memory):  57%|█████▊    | 115/200 [00:12<01:13,  1.16it/s][A[A

Sampling (mamba memory):  58%|█████▊    | 116/200 [00:13<01:12,  1.16it/s][A[A

Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:11,  1.15it/s][A[A

Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:11,  1.15it/s][A[A

Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:10,  1.15it/s][A[A

Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:09,  1.14it/s][A[A

Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:09,  1.14it/s][A[A

Sampling (mamba memory):  61%|██████    | 122/200 [00:18<01:08,  1.14it/s][A[A

6it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:16,  1.15it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:15,  1.15it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:14,  1.15it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:12<01:13,  1.15it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:13<01:12,  1.15it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:12,  1.15it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:11,  1.15it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:10,  1.15it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:09,  1.15it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:09,  1.14it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:08,  1.14it/s]Sampling (mamba memory):  62%|██████▏   | 123/4it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:17,  1.13it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:16,  1.13it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:15,  1.13it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:14,  1.14it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:13<01:13,  1.14it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:12,  1.14it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:11,  1.14it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:10,  1.14it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:10,  1.14it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:09,  1.14it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:08,  1.13it/s]Sampling (mamba memory):  62%|██████▏   | 123/3it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:18,  1.13it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:17,  1.12it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:16,  1.12it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:15,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:14,  1.13it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:13,  1.13it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:12,  1.13it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:11,  1.13it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:10,  1.13it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:09,  1.13it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:08,  1.13it/s]Sampling (mamba memory):  62%|██████▏   | 123/Sampling (mamba memory):  62%|██████▏   | 123/200 [00:19<01:07,  1.13it/s][A[A

1it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:19,  1.11it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:18,  1.11it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:17,  1.11it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:17,  1.10it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:16,  1.10it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:15,  1.10it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:14,  1.10it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:14,  1.09it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:13,  1.09it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:12,  1.09it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:11,  1.09it/s]Sampling (mamba memory):  62%|██████▏   | 123/0it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:20,  1.10it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:19,  1.09it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:19,  1.09it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:18,  1.08it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:17,  1.08it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:16,  1.08it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:16,  1.08it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:14,  1.08it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:13,  1.08it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:19<01:12,  1.08it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:20<01:12,  1.08it/s]Sampling (mamba memory):  62%|██████▏   | 123/9it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:20,  1.09it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:19,  1.09it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:18,  1.09it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:17,  1.09it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:17,  1.09it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:16,  1.09it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:15,  1.09it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:14,  1.09it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:13,  1.08it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:19<01:13,  1.08it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:20<01:12,  1.08it/s]Sampling (mamba memory):  62%|██████▏   | 123/9it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:20,  1.09it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:19,  1.09it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:19,  1.08it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:18,  1.08it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:18,  1.08it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:17,  1.07it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:16,  1.07it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:15,  1.07it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:15,  1.07it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:19<01:14,  1.06it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:20<01:13,  1.06it/s]Sampling (mamba memory):  62%|██████▏   | 123/Sampling (mamba memory):  62%|██████▏   | 124/200 [00:20<01:07,  1.13it/s][A[A

Sampling (mamba memory):  62%|██████▎   | 125/200 [00:21<01:06,  1.13it/s][A[A

Sampling (mamba memory):  63%|██████▎   | 126/200 [00:22<01:05,  1.14it/s][A[A

Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:04,  1.14it/s][A[A

Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:03,  1.14it/s][A[A

Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:02,  1.14it/s][A[A

Sampling (mamba memory):  65%|██████▌   | 130/200 [00:25<01:01,  1.14it/s][A[A

Sampling (mamba memory):  66%|██████▌   | 131/200 [00:26<01:00,  1.14it/s][A[A

Sampling (mamba memory):  66%|██████▌   | 132/200 [00:27<00:59,  1.14it/s][A[A

Sampling (mamba memory):  66%|██████▋   | 133/200 [00:28<00:59,  1.13it/s][A[A

Sampling (mamba memory):  67%|██████▋   | 134/200 [00:29<00:58,  1.13it/s][A[A

200 [00:20<01:08,  1.13it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:07,  1.13it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:21<01:06,  1.13it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:22<01:05,  1.13it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:04,  1.13it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:03,  1.13it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:03,  1.12it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:02,  1.12it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:01,  1.12it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:00,  1.12it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<00:59,  1.12it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:29<00:59,  1.12it/s]Sampling (mamba 200 [00:20<01:08,  1.13it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:20<01:07,  1.12it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:21<01:07,  1.12it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:22<01:06,  1.12it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:05,  1.11it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:04,  1.11it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:04,  1.10it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:03,  1.10it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:02,  1.10it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:01,  1.10it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:01,  1.10it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:00,  1.09it/s]Sampling (mamba 200 [00:20<01:07,  1.14it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:06,  1.14it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:05,  1.14it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:22<01:05,  1.14it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:04,  1.13it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:03,  1.13it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:03,  1.12it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:02,  1.12it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:01,  1.11it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:01,  1.11it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:00,  1.10it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<00:59,  1.10it/s]Sampling (mamba Sampling (mamba memory):  68%|██████▊   | 135/200 [00:30<00:57,  1.13it/s][A[A

200 [00:20<01:10,  1.09it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:09,  1.09it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:08,  1.09it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:08,  1.09it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:07,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:06,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:05,  1.08it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:04,  1.08it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:03,  1.08it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:03,  1.08it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:02,  1.07it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<01:01,  1.07it/s]Sampling (mamba Sampling (mamba memory):  68%|██████▊   | 136/200 [00:31<00:57,  1.12it/s][A[A

200 [00:21<01:11,  1.08it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:10,  1.08it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:09,  1.08it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:08,  1.08it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:07,  1.08it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:06,  1.08it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:05,  1.08it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:04,  1.08it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:03,  1.08it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:02,  1.08it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:02,  1.08it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<01:01,  1.08it/s]Sampling (mamba 200 [00:21<01:11,  1.08it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:22<01:10,  1.07it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:09,  1.07it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:09,  1.07it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:08,  1.07it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:07,  1.07it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:06,  1.06it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:05,  1.06it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:04,  1.06it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:04,  1.06it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:03,  1.06it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<01:02,  1.06it/s]Sampling (mamba 200 [00:21<01:12,  1.06it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:22<01:11,  1.06it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:23<01:10,  1.06it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:24<01:10,  1.06it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:25<01:09,  1.05it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:08,  1.05it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:07,  1.05it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:06,  1.05it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:05,  1.05it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:05,  1.04it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:04,  1.04it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<01:03,  1.04it/s]Sampling (mamba Sampling (mamba memory):  68%|██████▊   | 137/200 [00:32<00:56,  1.12it/s][A[A

Sampling (mamba memory):  69%|██████▉   | 138/200 [00:33<00:55,  1.11it/s][A[A

Sampling (mamba memory):  70%|██████▉   | 139/200 [00:33<00:54,  1.11it/s][A[A

Sampling (mamba memory):  70%|███████   | 140/200 [00:34<00:54,  1.11it/s][A[A

Sampling (mamba memory):  70%|███████   | 141/200 [00:35<00:53,  1.11it/s][A[A

Sampling (mamba memory):  71%|███████   | 142/200 [00:36<00:52,  1.10it/s][A[A

Sampling (mamba memory):  72%|███████▏  | 143/200 [00:37<00:51,  1.10it/s][A[A

Sampling (mamba memory):  72%|███████▏  | 144/200 [00:38<00:50,  1.10it/s][A[A

Sampling (mamba memory):  72%|███████▎  | 145/200 [00:39<00:49,  1.10it/s][A[A

memory):  68%|██████▊   | 135/200 [00:30<00:58,  1.11it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:31<00:57,  1.11it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:32<00:56,  1.11it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:33<00:55,  1.11it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:34<00:54,  1.11it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:35<00:53,  1.11it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:36<00:53,  1.11it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:37<00:52,  1.11it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:38<00:52,  1.09it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:51,  1.09it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:39<00:51,  1.08it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:30<00:59,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:31<00:58,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:32<00:57,  1.09it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:33<00:56,  1.09it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:34<00:56,  1.09it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:35<00:55,  1.09it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:36<00:54,  1.09it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:37<00:53,  1.08it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:38<00:52,  1.08it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:52,  1.07it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:51,  1.07it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  73%|███████▎  | 146/200 [00:40<00:49,  1.10it/s][A[A

memory):  68%|██████▊   | 135/200 [00:31<00:59,  1.10it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:58,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:32<00:57,  1.09it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:33<00:57,  1.09it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:34<00:56,  1.08it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:35<00:55,  1.08it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:36<00:54,  1.08it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:37<00:53,  1.08it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:38<00:53,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:52,  1.07it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:51,  1.07it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▎  | 147/200 [00:41<00:48,  1.10it/s][A[A

memory):  68%|██████▊   | 135/200 [00:31<01:00,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:59,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:59,  1.07it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:58,  1.07it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:57,  1.07it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:56,  1.06it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:55,  1.06it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:54,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:53,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:52,  1.06it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:51,  1.06it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:32<01:00,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:33<00:59,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:34<00:58,  1.08it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:57,  1.08it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:56,  1.07it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:56,  1.07it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:55,  1.06it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:54,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:54,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:53,  1.05it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:52,  1.05it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:32<01:01,  1.06it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:33<01:00,  1.06it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:34<00:59,  1.05it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:35<00:58,  1.05it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:36<00:58,  1.05it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:37<00:57,  1.05it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:38<00:56,  1.04it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:39<00:55,  1.04it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:40<00:55,  1.04it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:41<00:54,  1.04it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:42<00:53,  1.03it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▍  | 148/200 [00:42<00:47,  1.10it/s][A[A

memory):  68%|██████▊   | 135/200 [00:32<01:02,  1.03it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:33<01:02,  1.03it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:34<01:01,  1.03it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:35<01:00,  1.03it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:36<00:59,  1.02it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:37<00:58,  1.02it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:38<00:57,  1.02it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:39<00:56,  1.02it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:40<00:56,  1.02it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:41<00:55,  1.02it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:42<00:54,  1.01it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▍  | 149/200 [00:43<00:46,  1.10it/s][A[A

Sampling (mamba memory):  75%|███████▌  | 150/200 [00:43<00:45,  1.10it/s][A[A

Sampling (mamba memory):  76%|███████▌  | 151/200 [00:44<00:44,  1.10it/s][A[A

Sampling (mamba memory):  76%|███████▌  | 152/200 [00:45<00:43,  1.10it/s][A[A

Sampling (mamba memory):  76%|███████▋  | 153/200 [00:46<00:42,  1.10it/s][A[A

Sampling (mamba memory):  77%|███████▋  | 154/200 [00:47<00:41,  1.10it/s][A[A

Sampling (mamba memory):  78%|███████▊  | 155/200 [00:48<00:41,  1.10it/s][A[A

Sampling (mamba memory):  78%|███████▊  | 156/200 [00:49<00:40,  1.09it/s][A[A

 | 146/200 [00:40<00:49,  1.08it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:41<00:49,  1.08it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:42<00:48,  1.08it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:43<00:47,  1.07it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:44<00:46,  1.07it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:45<00:45,  1.07it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:46<00:44,  1.07it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:47<00:44,  1.07it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:48<00:43,  1.07it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:49<00:42,  1.07it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:50<00:41,  1.07it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:51<00:40Sampling (mamba memory):  78%|███████▊  | 157/200 [00:50<00:39,  1.09it/s][A[A

 | 146/200 [00:41<00:50,  1.07it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:49,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:48,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:43<00:48,  1.06it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:44<00:47,  1.06it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:45<00:46,  1.06it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:46<00:45,  1.05it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:47<00:44,  1.05it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:48<00:43,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:49<00:42,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:50<00:41,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:51<00:40 | 146/200 [00:41<00:50,  1.07it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:49,  1.07it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:48,  1.07it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:47,  1.07it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:46,  1.07it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:45,  1.07it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:46<00:44,  1.07it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:47<00:44,  1.06it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:48<00:43,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:49<00:42,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:50<00:41,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:51<00:40Sampling (mamba memory):  79%|███████▉  | 158/200 [00:51<00:38,  1.08it/s][A[A

 | 146/200 [00:42<00:51,  1.06it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:50,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:49,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:48,  1.05it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:48,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:47,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:48<00:46,  1.04it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:49<00:45,  1.04it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:50<00:44,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:51<00:43,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:52<00:42,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:53<00:42 | 146/200 [00:42<00:51,  1.05it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:50,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:49,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:48,  1.05it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:47,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:46,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:48<00:45,  1.05it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:49<00:44,  1.05it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:50<00:43,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:51<00:42,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:52<00:42,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:53<00:41Sampling (mamba memory):  80%|███████▉  | 159/200 [00:52<00:37,  1.08it/s][A[A

 | 146/200 [00:43<00:52,  1.03it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:51,  1.03it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:50,  1.03it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:49,  1.03it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:48,  1.03it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:47,  1.02it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:48<00:46,  1.03it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:49<00:45,  1.03it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:50<00:44,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:51<00:43,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:52<00:42,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:53<00:41Sampling (mamba memory):  80%|████████  | 160/200 [00:53<00:37,  1.08it/s][A[A

 | 146/200 [00:43<00:53,  1.01it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:44<00:52,  1.01it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:45<00:51,  1.01it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:46<00:50,  1.01it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:47<00:49,  1.01it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:48<00:48,  1.01it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:49<00:47,  1.01it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:50<00:46,  1.01it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:51<00:45,  1.01it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:52<00:44,  1.00it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:53<00:43,  1.00it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:54<00:43Sampling (mamba memory):  80%|████████  | 161/200 [00:54<00:36,  1.07it/s][A[A

Sampling (mamba memory):  81%|████████  | 162/200 [00:55<00:35,  1.07it/s][A[A

Sampling (mamba memory):  82%|████████▏ | 163/200 [00:56<00:34,  1.07it/s][A[A

Sampling (mamba memory):  82%|████████▏ | 164/200 [00:56<00:33,  1.06it/s][A[A

Sampling (mamba memory):  82%|████████▎ | 165/200 [00:57<00:32,  1.06it/s][A[A

Sampling (mamba memory):  83%|████████▎ | 166/200 [00:58<00:31,  1.06it/s][A[A

Sampling (mamba memory):  84%|████████▎ | 167/200 [00:59<00:31,  1.06it/s][A[A

Sampling (mamba memory):  84%|████████▍ | 168/200 [01:00<00:30,  1.06it/s][A[A

,  1.07it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:52<00:39,  1.06it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:53<00:38,  1.06it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:54<00:37,  1.06it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:54<00:37,  1.05it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:55<00:36,  1.05it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:56<00:35,  1.05it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:57<00:34,  1.05it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [00:58<00:33,  1.05it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [00:59<00:32,  1.05it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:00<00:31,  1.05it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:01<00:30,  1.04it/s,  1.05it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:52<00:40,  1.05it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:53<00:39,  1.05it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:54<00:38,  1.04it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:55<00:37,  1.04it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:56<00:36,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:57<00:35,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:58<00:34,  1.04it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [00:59<00:33,  1.04it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:00<00:32,  1.04it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:01<00:31,  1.03it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:02<00:31,  1.03it/s,  1.06it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:52<00:39,  1.05it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:53<00:39,  1.05it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:54<00:38,  1.04it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:55<00:37,  1.04it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:56<00:36,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:57<00:35,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:58<00:34,  1.04it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [00:59<00:33,  1.04it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:00<00:32,  1.03it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:01<00:32,  1.03it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:02<00:31,  1.03it/sSampling (mamba memory):  84%|████████▍ | 169/200 [01:01<00:29,  1.06it/s][A[A

Sampling (mamba memory):  85%|████████▌ | 170/200 [01:02<00:28,  1.05it/s][A[A

,  1.04it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:54<00:41,  1.02it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:55<00:39,  1.03it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:56<00:38,  1.03it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:56<00:37,  1.03it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:57<00:36,  1.03it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:35,  1.03it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:34,  1.03it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:33,  1.03it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:33,  1.03it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:02<00:32,  1.03it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:03<00:31,  1.03it/s,  1.02it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:54<00:41,  1.02it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:55<00:40,  1.01it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:56<00:39,  1.01it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:57<00:38,  1.01it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:58<00:37,  1.01it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:36,  1.01it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:35,  1.00it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:34,  1.00it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:02<00:34,  1.00s/it]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:03<00:33,  1.00s/it]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:04<00:32,  1.00s/itSampling (mamba memory):  86%|████████▌ | 171/200 [01:03<00:27,  1.05it/s][A[A

,  1.03it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:54<00:40,  1.02it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:55<00:40,  1.02it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:56<00:39,  1.02it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:57<00:38,  1.02it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:58<00:37,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:59<00:36,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:00<00:35,  1.02it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:01<00:34,  1.01it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:02<00:33,  1.01it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:03<00:32,  1.01it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:04<00:31,  1.01it/sSampling (mamba memory):  86%|████████▌ | 172/200 [01:04<00:26,  1.05it/s][A[A

,  1.00s/it]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:55<00:42,  1.01s/it]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:56<00:41,  1.01s/it]Sampling (mamba memory):  80%|████████  | 160/200 [00:57<00:40,  1.01s/it]Sampling (mamba memory):  80%|████████  | 161/200 [00:58<00:39,  1.01s/it]Sampling (mamba memory):  81%|████████  | 162/200 [00:59<00:38,  1.01s/it]Sampling (mamba memory):  82%|████████▏ | 163/200 [01:00<00:37,  1.02s/it]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:01<00:36,  1.02s/it]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:02<00:35,  1.03s/it]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:03<00:34,  1.03s/it]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:04<00:33,  1.03s/it]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:05<00:32,  1.03s/itSampling (mamba memory):  86%|████████▋ | 173/200 [01:05<00:25,  1.05it/s][A[A

Sampling (mamba memory):  87%|████████▋ | 174/200 [01:06<00:24,  1.05it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 175/200 [01:07<00:23,  1.05it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 176/200 [01:08<00:22,  1.05it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 177/200 [01:09<00:21,  1.05it/s][A[A

Sampling (mamba memory):  89%|████████▉ | 178/200 [01:10<00:20,  1.05it/s][A[A

Sampling (mamba memory):  90%|████████▉ | 179/200 [01:11<00:20,  1.05it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:02<00:29,  1.04it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:03<00:28,  1.04it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:04<00:27,  1.04it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:05<00:27,  1.04it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:06<00:26,  1.03it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:07<00:25,  1.03it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:08<00:24,  1.03it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:09<00:23,  1.03it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:10<00:22,  1.03it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:11<00:21,  1.03it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:12<00:20,  1.02it/s]]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:03<00:30,  1.03it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:04<00:29,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:05<00:28,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:06<00:27,  1.02it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:07<00:26,  1.02it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:08<00:25,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:09<00:24,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:10<00:23,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:11<00:22,  1.01it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:12<00:21,  1.01it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:13<00:20,  1.01it/s]Sampling (mamba memory):  90%|█████████ | 180/200 [01:12<00:19,  1.05it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:03<00:30,  1.03it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:04<00:29,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:05<00:28,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:06<00:27,  1.03it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:07<00:26,  1.02it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:08<00:25,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:09<00:24,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:10<00:23,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:11<00:22,  1.01it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:12<00:21,  1.01it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:13<00:20,  1.01it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:13<00:18,  1.05it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:04<00:30,  1.02it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:05<00:29,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:06<00:28,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:07<00:27,  1.02it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:08<00:26,  1.01it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:09<00:26,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:10<00:25,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:11<00:24,  1.00s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:12<00:23,  1.00s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:13<00:21,  1.00it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:14<00:20,  1.00it/s]]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:05<00:31,  1.00s/it]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:06<00:30,  1.00s/it]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:07<00:29,  1.00s/it]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:08<00:27,  1.00it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:09<00:26,  1.00it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:10<00:25,  1.00it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:11<00:24,  1.00it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:12<00:23,  1.00it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:13<00:22,  1.00it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:14<00:22,  1.00s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:15<00:21,  1.00s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:14<00:17,  1.04it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:05<00:30,  1.01it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:06<00:29,  1.00it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:07<00:28,  1.00it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:08<00:28,  1.00s/it]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:09<00:27,  1.00s/it]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:10<00:26,  1.00s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:11<00:25,  1.00s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:12<00:24,  1.00s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:13<00:23,  1.01s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:14<00:22,  1.01s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:15<00:21,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:15<00:16,  1.04it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:06<00:31,  1.03s/it]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:07<00:30,  1.03s/it]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:08<00:29,  1.03s/it]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:09<00:28,  1.03s/it]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:10<00:27,  1.03s/it]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:11<00:26,  1.02s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:12<00:25,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:13<00:24,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:14<00:23,  1.01s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:15<00:22,  1.01s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:16<00:21,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:16<00:15,  1.04it/s][A[A

Sampling (mamba memory):  92%|█████████▎| 185/200 [01:17<00:14,  1.04it/s][A[A

Sampling (mamba memory):  93%|█████████▎| 186/200 [01:17<00:13,  1.04it/s][A[A

Sampling (mamba memory):  94%|█████████▎| 187/200 [01:18<00:12,  1.03it/s][A[A

Sampling (mamba memory):  94%|█████████▍| 188/200 [01:19<00:11,  1.03it/s][A[A

Sampling (mamba memory):  94%|█████████▍| 189/200 [01:20<00:10,  1.03it/s][A[A

Sampling (mamba memory):  95%|█████████▌| 190/200 [01:21<00:09,  1.03it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:13<00:19,  1.02it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:14<00:18,  1.02it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:15<00:17,  1.02it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:16<00:16,  1.02it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:17<00:15,  1.02it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:18<00:14,  1.02it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:19<00:13,  1.02it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:20<00:12,  1.02it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:21<00:11,  1.01it/s]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:22<00:10,  1.01it/s]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:23<00Sampling (mamba memory):  96%|█████████▌| 191/200 [01:22<00:08,  1.03it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:14<00:19,  1.01it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:15<00:18,  1.01it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:16<00:17,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:17<00:16,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:18<00:15,  1.01it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:19<00:14,  1.01it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:20<00:13,  1.01it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:21<00:12,  1.00it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:22<00:11,  1.00it/s]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:23<00:11,  1.00s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:24<00Sampling (mamba memory):  90%|█████████ | 180/200 [01:14<00:19,  1.01it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:15<00:18,  1.01it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:16<00:17,  1.00it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:17<00:16,  1.00it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:18<00:15,  1.00it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:19<00:15,  1.00s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:20<00:14,  1.00s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:21<00:13,  1.00s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:22<00:12,  1.00s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:23<00:11,  1.00s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:24<00Sampling (mamba memory):  96%|█████████▌| 192/200 [01:23<00:07,  1.03it/s][A[A

Sampling (mamba memory):  96%|█████████▋| 193/200 [01:24<00:06,  1.03it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:15<00:19,  1.00it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:16<00:18,  1.00it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:17<00:17,  1.00it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:18<00:16,  1.00it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:19<00:15,  1.00it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:20<00:15,  1.00s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:21<00:14,  1.01s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:22<00:13,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:23<00:12,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:24<00:11,  1.01s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:25<00Sampling (mamba memory):  90%|█████████ | 180/200 [01:16<00:20,  1.01s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:17<00:19,  1.01s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:18<00:18,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:19<00:17,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:20<00:16,  1.01s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:21<00:15,  1.01s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:22<00:14,  1.01s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:23<00:13,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:24<00:12,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:25<00:11,  1.02s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:26<00Sampling (mamba memory):  97%|█████████▋| 194/200 [01:25<00:05,  1.03it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:16<00:20,  1.01s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:17<00:19,  1.01s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:18<00:18,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:19<00:17,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:20<00:16,  1.01s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:21<00:15,  1.02s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:22<00:14,  1.02s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:23<00:13,  1.02s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:24<00:12,  1.02s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:25<00:11,  1.03s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:26<00Sampling (mamba memory):  98%|█████████▊| 195/200 [01:26<00:04,  1.03it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:17<00:20,  1.01s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:18<00:19,  1.01s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:19<00:18,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:21<00:17,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:22<00:16,  1.01s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:23<00:15,  1.01s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:24<00:14,  1.02s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:25<00:13,  1.02s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:26<00:12,  1.02s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:27<00:11,  1.03s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:28<00Sampling (mamba memory):  98%|█████████▊| 196/200 [01:27<00:03,  1.02it/s][A[A

Sampling (mamba memory):  98%|█████████▊| 197/200 [01:28<00:02,  1.02it/s][A[A

Sampling (mamba memory):  99%|█████████▉| 198/200 [01:29<00:01,  1.02it/s][A[A

Sampling (mamba memory): 100%|█████████▉| 199/200 [01:30<00:00,  1.02it/s][A[A

Sampling (mamba memory): 100%|██████████| 200/200 [01:31<00:00,  1.02it/s][A[ASampling (mamba memory): 100%|██████████| 200/200 [01:36<00:00,  1.04it/s]
Validation DataLoader 0:   0%|          | 0/1 [00:00<?, ?it/s][A
:09,  1.01it/s]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:24<00:08,  1.01it/s]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:25<00:07,  1.00it/s]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:26<00:06,  1.00it/s]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:27<00:05,  1.00it/s]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:28<00:04,  1.00it/s]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:29<00:03,  1.00it/s]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:30<00:03,  1.00s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:31<00:02,  1.00s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:32<00:01,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:33<00:00,  1.00s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:38<00:00,  1.02it/s]
:10,  1.00s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:25<00:09,  1.01s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:26<00:08,  1.01s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:27<00:07,  1.01s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:28<00:06,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:29<00:05,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:30<00:04,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:31<00:03,  1.01s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:32<00:02,  1.02s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:33<00:01,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:34<00:00,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:38<00:00,  1.01it/s]
:10,  1.00s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:25<00:09,  1.01s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:26<00:08,  1.01s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:27<00:07,  1.01s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:28<00:06,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:29<00:05,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:30<00:04,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:31<00:03,  1.02s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:32<00:02,  1.02s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:33<00:01,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:34<00:00,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:39<00:00,  1.01it/s]
:10,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:26<00:09,  1.01s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:27<00:08,  1.02s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:28<00:07,  1.02s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:29<00:06,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:30<00:05,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:31<00:04,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:33<00:03,  1.02s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:34<00:02,  1.02s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:35<00:01,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:36<00:00,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:40<00:00,  1.01s/it]
:10,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:27<00:09,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:28<00:08,  1.02s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:29<00:07,  1.02s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:30<00:06,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:31<00:05,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:32<00:04,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:33<00:03,  1.02s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:34<00:02,  1.02s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:35<00:01,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:36<00:00,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:41<00:00,  1.01s/it]
:10,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:27<00:09,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:28<00:08,  1.03s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:29<00:07,  1.03s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:31<00:06,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:32<00:05,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:33<00:04,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:34<00:03,  1.04s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:35<00:02,  1.04s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:36<00:01,  1.04s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:37<00:00,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:41<00:00,  1.02s/it]
:10,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:29<00:09,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:30<00:08,  1.04s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:31<00:07,  1.05s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:32<00:06,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:33<00:05,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:34<00:04,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:35<00:03,  1.04s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:36<00:02,  1.04s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:37<00:01,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:38<00:00,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:43<00:00,  1.03s/it]
Validation DataLoader 0: 100%|██████████| 1/1 [01:36<00:00,  0.01it/s][A
                                                                      [AEpoch 0:   4%|▎         | 7500/203307 [8:36:01<224:32:23,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7501/203307 [8:36:06<224:32:34,  0.24it/s, v_num=t5e6, training/loss=0.0989]Epoch 0:   4%|▎         | 7501/203307 [8:36:06<224:32:35,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7502/203307 [8:36:11<224:32:38,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7502/203307 [8:36:11<224:32:38,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7503/203307 [8:36:15<224:32:34,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7503/203307 [8:36:15<224:32:34,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7504/203307 [8:36:19<224:32:23,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7504/203307 [8:36:19<224:32:23,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7505/203307 [8:36:22<224:32:09,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7505/203307 [8:36:22<224:32:09,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7506/203307 [8:36:27<224:32:14,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7506/203307 [8:36:27<224:32:14,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7507/203307 [8:36:30<224:31:55,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7507/203307 [8:36:30<224:31:55,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7508/203307 [8:36:34<224:31:32,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7508/203307 [8:36:34<224:31:32,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7509/203307 [8:36:38<224:31:41,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7509/203307 [8:36:38<224:31:42,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7510/203307 [8:36:42<224:31:30,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7510/203307 [8:36:42<224:31:30,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7511/203307 [8:36:48<224:31:54,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7511/203307 [8:36:48<224:31:54,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7512/203307 [8:36:51<224:31:32,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7512/203307 [8:36:51<224:31:32,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7513/203307 [8:36:55<224:31:15,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7513/203307 [8:36:55<224:31:15,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7514/203307 [8:36:58<224:30:58,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7514/203307 [8:36:58<224:30:58,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7515/203307 [8:37:03<224:31:04,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7515/203307 [8:37:03<224:31:04,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7516/203307 [8:37:07<224:30:50,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7516/203307 [8:37:07<224:30:50,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7517/203307 [8:37:11<224:30:53,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7517/203307 [8:37:11<224:30:53,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7518/203307 [8:37:15<224:30:38,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7518/203307 [8:37:15<224:30:38,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7519/203307 [8:37:19<224:30:38,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7519/203307 [8:37:19<224:30:38,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7520/203307 [8:37:23<224:30:36,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7520/203307 [8:37:23<224:30:36,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7521/203307 [8:37:27<224:30:22,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▎         | 7521/203307 [8:37:27<224:30:22,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7522/203307 [8:37:31<224:30:07,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7522/203307 [8:37:31<224:30:07,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7523/203307 [8:37:35<224:30:10,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7523/203307 [8:37:35<224:30:10,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7524/203307 [8:37:39<224:29:56,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7524/203307 [8:37:39<224:29:56,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7525/203307 [8:37:42<224:29:40,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7525/203307 [8:37:42<224:29:41,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7526/203307 [8:37:47<224:29:45,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7526/203307 [8:37:47<224:29:45,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7527/203307 [8:37:51<224:29:44,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7527/203307 [8:37:51<224:29:44,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7528/203307 [8:37:55<224:29:30,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7528/203307 [8:37:55<224:29:30,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7529/203307 [8:37:59<224:29:30,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7529/203307 [8:37:59<224:29:31,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7530/203307 [8:38:03<224:29:16,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7530/203307 [8:38:03<224:29:16,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7531/203307 [8:38:07<224:29:02,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7531/203307 [8:38:07<224:29:02,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7532/203307 [8:38:11<224:29:07,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7532/203307 [8:38:11<224:29:07,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7533/203307 [8:38:15<224:28:52,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7533/203307 [8:38:15<224:28:52,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7534/203307 [8:38:19<224:28:55,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7534/203307 [8:38:19<224:28:55,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7535/203307 [8:38:23<224:28:43,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7535/203307 [8:38:23<224:28:43,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7536/203307 [8:38:27<224:28:43,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7536/203307 [8:38:27<224:28:44,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7537/203307 [8:38:31<224:28:29,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7537/203307 [8:38:31<224:28:29,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7538/203307 [8:38:35<224:28:13,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7538/203307 [8:38:35<224:28:13,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7539/203307 [8:38:39<224:28:10,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7539/203307 [8:38:39<224:28:10,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7540/203307 [8:38:43<224:27:56,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7540/203307 [8:38:43<224:27:56,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7541/203307 [8:38:47<224:27:58,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   4%|▎         | 7541/203307 [8:38:47<224:27:59,  0.24it/s, v_num=t5e6, training/loss=0.100] Epoch 0:   4%|▎         | 7542/203307 [8:38:52<224:28:05,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7542/203307 [8:38:52<224:28:05,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7543/203307 [8:38:55<224:27:50,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7543/203307 [8:38:55<224:27:50,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7544/203307 [8:39:00<224:27:48,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7544/203307 [8:39:00<224:27:48,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7545/203307 [8:39:03<224:27:32,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7545/203307 [8:39:03<224:27:32,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7546/203307 [8:39:07<224:27:19,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7546/203307 [8:39:07<224:27:19,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7547/203307 [8:39:11<224:27:16,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7547/203307 [8:39:11<224:27:16,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7548/203307 [8:39:15<224:27:02,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7548/203307 [8:39:15<224:27:02,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7549/203307 [8:39:19<224:27:03,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7549/203307 [8:39:19<224:27:03,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7550/203307 [8:39:23<224:26:48,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7550/203307 [8:39:23<224:26:48,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7551/203307 [8:39:27<224:26:54,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7551/203307 [8:39:27<224:26:54,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7552/203307 [8:39:32<224:26:55,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7552/203307 [8:39:32<224:26:55,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7553/203307 [8:39:36<224:26:41,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7553/203307 [8:39:36<224:26:42,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7554/203307 [8:39:39<224:26:28,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7554/203307 [8:39:39<224:26:28,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7555/203307 [8:39:43<224:26:16,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7555/203307 [8:39:43<224:26:17,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7556/203307 [8:39:47<224:26:12,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7556/203307 [8:39:47<224:26:12,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7557/203307 [8:39:51<224:25:58,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7557/203307 [8:39:51<224:25:58,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7558/203307 [8:39:55<224:26:01,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7558/203307 [8:39:55<224:26:01,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7559/203307 [8:40:00<224:26:05,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7559/203307 [8:40:00<224:26:05,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7560/203307 [8:40:04<224:25:50,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7560/203307 [8:40:04<224:25:51,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7561/203307 [8:40:08<224:25:53,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   4%|▎         | 7561/203307 [8:40:08<224:25:53,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7562/203307 [8:40:12<224:25:39,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7562/203307 [8:40:12<224:25:39,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7563/203307 [8:40:15<224:25:25,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7563/203307 [8:40:15<224:25:25,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7564/203307 [8:40:19<224:25:12,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7564/203307 [8:40:19<224:25:12,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7565/203307 [8:40:23<224:24:58,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7565/203307 [8:40:23<224:24:58,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7566/203307 [8:40:27<224:24:55,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7566/203307 [8:40:27<224:24:56,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7567/203307 [8:40:32<224:25:03,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7567/203307 [8:40:32<224:25:03,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7568/203307 [8:40:35<224:24:48,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7568/203307 [8:40:35<224:24:48,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7569/203307 [8:40:40<224:24:48,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7569/203307 [8:40:40<224:24:48,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7570/203307 [8:40:44<224:24:35,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7570/203307 [8:40:44<224:24:35,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7571/203307 [8:40:47<224:24:22,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7571/203307 [8:40:47<224:24:22,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7572/203307 [8:40:51<224:24:07,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7572/203307 [8:40:51<224:24:07,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7573/203307 [8:40:55<224:23:54,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7573/203307 [8:40:55<224:23:54,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7574/203307 [8:40:59<224:23:40,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7574/203307 [8:40:59<224:23:40,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7575/203307 [8:41:03<224:23:44,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7575/203307 [8:41:03<224:23:44,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7576/203307 [8:41:07<224:23:48,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7576/203307 [8:41:07<224:23:48,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7577/203307 [8:41:12<224:23:46,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7577/203307 [8:41:12<224:23:47,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7578/203307 [8:41:15<224:23:32,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7578/203307 [8:41:15<224:23:33,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7579/203307 [8:41:19<224:23:19,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7579/203307 [8:41:19<224:23:20,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7580/203307 [8:41:23<224:23:08,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7580/203307 [8:41:23<224:23:08,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7581/203307 [8:41:27<224:22:55,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   4%|▎         | 7581/203307 [8:41:27<224:22:55,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7582/203307 [8:41:31<224:22:42,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7582/203307 [8:41:31<224:22:42,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7583/203307 [8:41:34<224:22:27,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7583/203307 [8:41:34<224:22:27,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7584/203307 [8:41:39<224:22:31,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7584/203307 [8:41:39<224:22:31,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7585/203307 [8:41:43<224:22:20,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7585/203307 [8:41:43<224:22:20,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7586/203307 [8:41:47<224:22:21,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7586/203307 [8:41:47<224:22:22,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7587/203307 [8:41:51<224:22:07,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7587/203307 [8:41:51<224:22:07,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7588/203307 [8:41:54<224:21:54,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7588/203307 [8:41:54<224:21:54,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7589/203307 [8:41:58<224:21:39,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7589/203307 [8:41:58<224:21:39,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7590/203307 [8:42:02<224:21:27,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7590/203307 [8:42:02<224:21:27,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7591/203307 [8:42:06<224:21:13,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7591/203307 [8:42:06<224:21:13,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7592/203307 [8:42:10<224:21:23,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7592/203307 [8:42:10<224:21:23,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7593/203307 [8:42:15<224:21:25,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7593/203307 [8:42:15<224:21:25,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7594/203307 [8:42:19<224:21:27,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7594/203307 [8:42:19<224:21:27,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7595/203307 [8:42:23<224:21:13,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7595/203307 [8:42:23<224:21:13,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7596/203307 [8:42:27<224:20:59,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7596/203307 [8:42:27<224:20:59,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7597/203307 [8:42:30<224:20:44,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7597/203307 [8:42:30<224:20:44,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7598/203307 [8:42:34<224:20:30,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7598/203307 [8:42:34<224:20:31,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7599/203307 [8:42:38<224:20:16,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7599/203307 [8:42:38<224:20:16,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7600/203307 [8:42:42<224:20:00,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7600/203307 [8:42:42<224:20:00,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7601/203307 [8:42:46<224:20:04,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▎         | 7601/203307 [8:42:46<224:20:04,  0.24it/s, v_num=t5e6, training/loss=0.101] Epoch 0:   4%|▎         | 7602/203307 [8:42:50<224:20:03,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7602/203307 [8:42:50<224:20:04,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7603/203307 [8:42:54<224:19:49,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7603/203307 [8:42:54<224:19:49,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7604/203307 [8:42:58<224:19:42,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7604/203307 [8:42:58<224:19:43,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7605/203307 [8:43:02<224:19:27,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7605/203307 [8:43:02<224:19:28,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7606/203307 [8:43:05<224:19:13,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7606/203307 [8:43:05<224:19:13,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7607/203307 [8:43:09<224:18:59,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7607/203307 [8:43:09<224:18:59,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7608/203307 [8:43:13<224:18:43,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7608/203307 [8:43:13<224:18:44,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7609/203307 [8:43:17<224:18:49,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7609/203307 [8:43:17<224:18:49,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7610/203307 [8:43:22<224:18:57,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7610/203307 [8:43:22<224:18:57,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7611/203307 [8:43:26<224:18:58,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7611/203307 [8:43:26<224:18:58,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7612/203307 [8:43:30<224:18:42,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7612/203307 [8:43:30<224:18:43,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7613/203307 [8:43:34<224:18:29,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7613/203307 [8:43:34<224:18:29,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7614/203307 [8:43:37<224:18:14,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7614/203307 [8:43:37<224:18:14,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7615/203307 [8:43:41<224:18:02,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7615/203307 [8:43:41<224:18:02,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7616/203307 [8:43:45<224:17:49,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7616/203307 [8:43:45<224:17:49,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7617/203307 [8:43:50<224:17:55,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7617/203307 [8:43:50<224:17:55,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7618/203307 [8:43:53<224:17:40,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7618/203307 [8:43:53<224:17:40,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7619/203307 [8:43:58<224:17:44,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7619/203307 [8:43:58<224:17:44,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7620/203307 [8:44:02<224:17:44,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7620/203307 [8:44:02<224:17:44,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7621/203307 [8:44:06<224:17:30,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▎         | 7621/203307 [8:44:06<224:17:30,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▎         | 7622/203307 [8:44:09<224:17:16,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▎         | 7622/203307 [8:44:09<224:17:16,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▎         | 7623/203307 [8:44:13<224:17:04,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▎         | 7623/203307 [8:44:13<224:17:04,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▎         | 7624/203307 [8:44:17<224:16:50,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▎         | 7624/203307 [8:44:17<224:16:50,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▍         | 7625/203307 [8:44:21<224:16:39,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▍         | 7625/203307 [8:44:21<224:16:39,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▍         | 7626/203307 [8:44:25<224:16:44,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▍         | 7626/203307 [8:44:25<224:16:44,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▍         | 7627/203307 [8:44:30<224:16:46,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▍         | 7627/203307 [8:44:30<224:16:46,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▍         | 7628/203307 [8:44:34<224:16:34,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▍         | 7628/203307 [8:44:34<224:16:34,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▍         | 7629/203307 [8:44:38<224:16:36,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▍         | 7629/203307 [8:44:38<224:16:36,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▍         | 7630/203307 [8:44:42<224:16:21,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▍         | 7630/203307 [8:44:42<224:16:21,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▍         | 7631/203307 [8:44:45<224:16:07,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▍         | 7631/203307 [8:44:45<224:16:07,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▍         | 7632/203307 [8:44:49<224:15:54,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▍         | 7632/203307 [8:44:49<224:15:54,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▍         | 7633/203307 [8:44:53<224:15:39,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▍         | 7633/203307 [8:44:53<224:15:40,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▍         | 7634/203307 [8:44:57<224:15:43,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▍         | 7634/203307 [8:44:57<224:15:43,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▍         | 7635/203307 [8:45:01<224:15:29,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▍         | 7635/203307 [8:45:01<224:15:30,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▍         | 7636/203307 [8:45:05<224:15:32,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▍         | 7636/203307 [8:45:05<224:15:32,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▍         | 7637/203307 [8:45:09<224:15:17,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▍         | 7637/203307 [8:45:09<224:15:17,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▍         | 7638/203307 [8:45:13<224:15:16,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▍         | 7638/203307 [8:45:13<224:15:16,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▍         | 7639/203307 [8:45:17<224:15:04,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▍         | 7639/203307 [8:45:17<224:15:05,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▍         | 7640/203307 [8:45:21<224:14:50,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▍         | 7640/203307 [8:45:21<224:14:51,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▍         | 7641/203307 [8:45:25<224:14:36,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:   4%|▍         | 7641/203307 [8:45:25<224:14:36,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7642/203307 [8:45:29<224:14:41,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7642/203307 [8:45:29<224:14:41,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7643/203307 [8:45:33<224:14:27,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7643/203307 [8:45:33<224:14:27,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7644/203307 [8:45:37<224:14:28,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7644/203307 [8:45:37<224:14:28,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7645/203307 [8:45:42<224:14:28,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7645/203307 [8:45:42<224:14:29,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7646/203307 [8:45:45<224:14:11,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7646/203307 [8:45:45<224:14:12,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7647/203307 [8:45:49<224:14:09,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7647/203307 [8:45:49<224:14:09,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7648/203307 [8:45:53<224:13:54,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7648/203307 [8:45:53<224:13:54,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7649/203307 [8:45:57<224:13:39,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7649/203307 [8:45:57<224:13:39,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7650/203307 [8:46:00<224:13:25,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7650/203307 [8:46:00<224:13:26,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7651/203307 [8:46:05<224:13:29,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7651/203307 [8:46:05<224:13:29,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7652/203307 [8:46:09<224:13:27,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7652/203307 [8:46:09<224:13:27,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7653/203307 [8:46:14<224:13:30,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7653/203307 [8:46:14<224:13:30,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7654/203307 [8:46:17<224:13:15,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7654/203307 [8:46:17<224:13:15,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7655/203307 [8:46:21<224:13:00,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7655/203307 [8:46:21<224:13:00,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7656/203307 [8:46:25<224:13:01,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7656/203307 [8:46:25<224:13:02,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7657/203307 [8:46:29<224:12:48,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7657/203307 [8:46:29<224:12:48,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7658/203307 [8:46:33<224:12:32,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7658/203307 [8:46:33<224:12:32,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7659/203307 [8:46:37<224:12:36,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7659/203307 [8:46:37<224:12:37,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7660/203307 [8:46:41<224:12:22,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7660/203307 [8:46:41<224:12:23,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7661/203307 [8:46:45<224:12:24,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   4%|▍         | 7661/203307 [8:46:45<224:12:24,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7662/203307 [8:46:50<224:12:27,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7662/203307 [8:46:50<224:12:27,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7663/203307 [8:46:53<224:12:12,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7663/203307 [8:46:53<224:12:12,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7664/203307 [8:46:57<224:11:58,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7664/203307 [8:46:57<224:11:58,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7665/203307 [8:47:01<224:11:54,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7665/203307 [8:47:01<224:11:54,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7666/203307 [8:47:05<224:11:40,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7666/203307 [8:47:05<224:11:40,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7667/203307 [8:47:09<224:11:44,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7667/203307 [8:47:09<224:11:44,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7668/203307 [8:47:13<224:11:28,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7668/203307 [8:47:13<224:11:28,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7669/203307 [8:47:17<224:11:26,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7669/203307 [8:47:17<224:11:27,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7670/203307 [8:47:21<224:11:13,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7670/203307 [8:47:21<224:11:13,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7671/203307 [8:47:26<224:11:18,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7671/203307 [8:47:26<224:11:18,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7672/203307 [8:47:29<224:11:04,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7672/203307 [8:47:29<224:11:05,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7673/203307 [8:47:33<224:10:50,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7673/203307 [8:47:33<224:10:50,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7674/203307 [8:47:37<224:10:46,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7674/203307 [8:47:37<224:10:46,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7675/203307 [8:47:41<224:10:31,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7675/203307 [8:47:41<224:10:31,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7676/203307 [8:47:45<224:10:35,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7676/203307 [8:47:45<224:10:35,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7677/203307 [8:47:50<224:10:35,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7677/203307 [8:47:50<224:10:35,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7678/203307 [8:47:53<224:10:21,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7678/203307 [8:47:53<224:10:21,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7679/203307 [8:47:58<224:10:23,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7679/203307 [8:47:58<224:10:23,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7680/203307 [8:48:01<224:10:09,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7680/203307 [8:48:01<224:10:09,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7681/203307 [8:48:05<224:09:54,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   4%|▍         | 7681/203307 [8:48:05<224:09:54,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7682/203307 [8:48:09<224:09:40,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7682/203307 [8:48:09<224:09:40,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7683/203307 [8:48:13<224:09:38,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7683/203307 [8:48:13<224:09:38,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7684/203307 [8:48:17<224:09:42,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7684/203307 [8:48:17<224:09:42,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7685/203307 [8:48:21<224:09:29,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7685/203307 [8:48:21<224:09:29,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7686/203307 [8:48:26<224:09:31,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7686/203307 [8:48:26<224:09:31,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7687/203307 [8:48:29<224:09:18,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7687/203307 [8:48:29<224:09:18,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7688/203307 [8:48:34<224:09:21,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7688/203307 [8:48:34<224:09:21,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7689/203307 [8:48:38<224:09:08,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7689/203307 [8:48:38<224:09:08,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7690/203307 [8:48:41<224:08:56,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7690/203307 [8:48:41<224:08:56,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7691/203307 [8:48:45<224:08:41,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7691/203307 [8:48:45<224:08:41,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7692/203307 [8:48:50<224:08:47,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7692/203307 [8:48:50<224:08:47,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7693/203307 [8:48:53<224:08:33,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7693/203307 [8:48:53<224:08:33,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7694/203307 [8:48:58<224:08:32,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7694/203307 [8:48:58<224:08:33,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7695/203307 [8:49:01<224:08:18,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7695/203307 [8:49:01<224:08:18,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7696/203307 [8:49:05<224:08:03,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7696/203307 [8:49:05<224:08:03,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7697/203307 [8:49:09<224:08:07,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7697/203307 [8:49:09<224:08:07,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7698/203307 [8:49:13<224:07:53,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7698/203307 [8:49:13<224:07:53,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7699/203307 [8:49:17<224:07:40,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7699/203307 [8:49:17<224:07:40,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7700/203307 [8:49:21<224:07:26,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7700/203307 [8:49:21<224:07:26,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7701/203307 [8:49:25<224:07:31,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   4%|▍         | 7701/203307 [8:49:25<224:07:31,  0.24it/s, v_num=t5e6, training/loss=0.101] Epoch 0:   4%|▍         | 7702/203307 [8:49:30<224:07:32,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7702/203307 [8:49:30<224:07:32,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7703/203307 [8:49:33<224:07:18,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7703/203307 [8:49:33<224:07:18,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7704/203307 [8:49:37<224:07:01,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7704/203307 [8:49:37<224:07:02,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7705/203307 [8:49:41<224:07:04,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7705/203307 [8:49:41<224:07:04,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7706/203307 [8:49:45<224:06:49,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7706/203307 [8:49:45<224:06:49,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7707/203307 [8:49:49<224:06:36,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7707/203307 [8:49:49<224:06:36,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7708/203307 [8:49:52<224:06:21,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7708/203307 [8:49:52<224:06:21,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7709/203307 [8:49:57<224:06:26,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7709/203307 [8:49:57<224:06:26,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7710/203307 [8:50:01<224:06:24,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7710/203307 [8:50:01<224:06:24,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7711/203307 [8:50:05<224:06:24,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7711/203307 [8:50:05<224:06:24,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7712/203307 [8:50:09<224:06:09,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7712/203307 [8:50:09<224:06:09,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7713/203307 [8:50:13<224:05:55,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7713/203307 [8:50:13<224:05:55,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7714/203307 [8:50:17<224:06:01,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7714/203307 [8:50:17<224:06:02,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7715/203307 [8:50:21<224:05:48,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7715/203307 [8:50:21<224:05:48,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7716/203307 [8:50:25<224:05:34,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7716/203307 [8:50:25<224:05:35,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7717/203307 [8:50:29<224:05:39,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7717/203307 [8:50:29<224:05:39,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7718/203307 [8:50:33<224:05:27,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7718/203307 [8:50:33<224:05:27,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7719/203307 [8:50:38<224:05:29,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7719/203307 [8:50:38<224:05:30,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7720/203307 [8:50:41<224:05:17,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7720/203307 [8:50:41<224:05:17,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7721/203307 [8:50:45<224:05:03,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   4%|▍         | 7721/203307 [8:50:45<224:05:03,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7722/203307 [8:50:49<224:04:51,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7722/203307 [8:50:49<224:04:51,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7723/203307 [8:50:53<224:04:56,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7723/203307 [8:50:53<224:04:57,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7724/203307 [8:50:57<224:04:43,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7724/203307 [8:50:57<224:04:43,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7725/203307 [8:51:01<224:04:30,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7725/203307 [8:51:01<224:04:30,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7726/203307 [8:51:06<224:04:37,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7726/203307 [8:51:06<224:04:37,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7727/203307 [8:51:10<224:04:38,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7727/203307 [8:51:10<224:04:38,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7728/203307 [8:51:14<224:04:36,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7728/203307 [8:51:14<224:04:37,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7729/203307 [8:51:18<224:04:23,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7729/203307 [8:51:18<224:04:24,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7730/203307 [8:51:22<224:04:10,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7730/203307 [8:51:22<224:04:10,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7731/203307 [8:51:26<224:04:14,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7731/203307 [8:51:26<224:04:14,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7732/203307 [8:51:30<224:04:01,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7732/203307 [8:51:30<224:04:01,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7733/203307 [8:51:33<224:03:45,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7733/203307 [8:51:34<224:03:46,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7734/203307 [8:51:38<224:03:48,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7734/203307 [8:51:38<224:03:48,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7735/203307 [8:51:42<224:03:34,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7735/203307 [8:51:42<224:03:34,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7736/203307 [8:51:46<224:03:35,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7736/203307 [8:51:46<224:03:35,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7737/203307 [8:51:50<224:03:34,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7737/203307 [8:51:50<224:03:34,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7738/203307 [8:51:54<224:03:19,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7738/203307 [8:51:54<224:03:19,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7739/203307 [8:51:58<224:03:05,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7739/203307 [8:51:58<224:03:05,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7740/203307 [8:52:02<224:03:09,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7740/203307 [8:52:02<224:03:09,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7741/203307 [8:52:06<224:02:54,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 7741/203307 [8:52:06<224:02:54,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7742/203307 [8:52:10<224:02:57,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7742/203307 [8:52:10<224:02:57,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7743/203307 [8:52:14<224:02:43,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7743/203307 [8:52:14<224:02:43,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7744/203307 [8:52:18<224:02:45,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7744/203307 [8:52:18<224:02:46,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7745/203307 [8:52:22<224:02:34,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7745/203307 [8:52:22<224:02:34,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7746/203307 [8:52:26<224:02:33,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7746/203307 [8:52:26<224:02:33,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7747/203307 [8:52:30<224:02:21,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7747/203307 [8:52:30<224:02:21,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7748/203307 [8:52:34<224:02:07,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7748/203307 [8:52:34<224:02:07,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7749/203307 [8:52:38<224:02:13,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7749/203307 [8:52:38<224:02:13,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7750/203307 [8:52:42<224:01:59,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7750/203307 [8:52:42<224:01:59,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7751/203307 [8:52:47<224:02:05,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7751/203307 [8:52:47<224:02:05,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7752/203307 [8:52:51<224:02:04,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7752/203307 [8:52:51<224:02:04,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7753/203307 [8:52:55<224:01:51,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7753/203307 [8:52:55<224:01:51,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7754/203307 [8:52:58<224:01:37,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7754/203307 [8:52:58<224:01:38,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7755/203307 [8:53:03<224:01:35,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7755/203307 [8:53:03<224:01:35,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7756/203307 [8:53:06<224:01:20,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7756/203307 [8:53:06<224:01:20,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7757/203307 [8:53:11<224:01:25,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7757/203307 [8:53:11<224:01:25,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7758/203307 [8:53:15<224:01:12,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7758/203307 [8:53:15<224:01:12,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7759/203307 [8:53:19<224:01:14,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7759/203307 [8:53:19<224:01:14,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7760/203307 [8:53:23<224:01:02,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7760/203307 [8:53:23<224:01:02,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7761/203307 [8:53:27<224:01:05,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   4%|▍         | 7761/203307 [8:53:27<224:01:06,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7762/203307 [8:53:31<224:00:52,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7762/203307 [8:53:31<224:00:52,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7763/203307 [8:53:35<224:00:39,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7763/203307 [8:53:35<224:00:40,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7764/203307 [8:53:39<224:00:39,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7764/203307 [8:53:39<224:00:39,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7765/203307 [8:53:43<224:00:25,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7765/203307 [8:53:43<224:00:25,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7766/203307 [8:53:47<224:00:27,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7766/203307 [8:53:47<224:00:28,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7767/203307 [8:53:52<224:00:33,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7767/203307 [8:53:52<224:00:33,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7768/203307 [8:53:55<224:00:18,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7768/203307 [8:53:55<224:00:19,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7769/203307 [8:54:00<224:00:18,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7769/203307 [8:54:00<224:00:19,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7770/203307 [8:54:03<224:00:05,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7770/203307 [8:54:03<224:00:05,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7771/203307 [8:54:07<223:59:51,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7771/203307 [8:54:07<223:59:51,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7772/203307 [8:54:11<223:59:39,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7772/203307 [8:54:11<223:59:39,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7773/203307 [8:54:15<223:59:37,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7773/203307 [8:54:15<223:59:38,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7774/203307 [8:54:19<223:59:22,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7774/203307 [8:54:19<223:59:22,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7775/203307 [8:54:23<223:59:25,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7775/203307 [8:54:23<223:59:25,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7776/203307 [8:54:28<223:59:29,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7776/203307 [8:54:28<223:59:29,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7777/203307 [8:54:32<223:59:29,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7777/203307 [8:54:32<223:59:29,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7778/203307 [8:54:36<223:59:14,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7778/203307 [8:54:36<223:59:14,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7779/203307 [8:54:39<223:58:59,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7779/203307 [8:54:39<223:58:59,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7780/203307 [8:54:43<223:58:43,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7780/203307 [8:54:43<223:58:43,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7781/203307 [8:54:47<223:58:32,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:   4%|▍         | 7781/203307 [8:54:47<223:58:32,  0.24it/s, v_num=t5e6, training/loss=0.093] Epoch 0:   4%|▍         | 7782/203307 [8:54:51<223:58:33,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7782/203307 [8:54:51<223:58:33,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7783/203307 [8:54:56<223:58:35,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7783/203307 [8:54:56<223:58:36,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7784/203307 [8:55:00<223:58:41,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7784/203307 [8:55:00<223:58:41,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7785/203307 [8:55:04<223:58:29,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7785/203307 [8:55:04<223:58:29,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7786/203307 [8:55:08<223:58:30,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7786/203307 [8:55:08<223:58:30,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7787/203307 [8:55:12<223:58:18,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7787/203307 [8:55:12<223:58:18,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7788/203307 [8:55:16<223:58:05,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7788/203307 [8:55:16<223:58:05,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7789/203307 [8:55:20<223:57:52,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7789/203307 [8:55:20<223:57:53,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7790/203307 [8:55:23<223:57:38,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7790/203307 [8:55:23<223:57:38,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7791/203307 [8:55:28<223:57:38,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7791/203307 [8:55:28<223:57:39,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7792/203307 [8:55:32<223:57:46,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7792/203307 [8:55:32<223:57:46,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7793/203307 [8:55:36<223:57:34,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7793/203307 [8:55:36<223:57:34,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7794/203307 [8:55:40<223:57:36,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7794/203307 [8:55:40<223:57:36,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7795/203307 [8:55:44<223:57:22,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7795/203307 [8:55:44<223:57:22,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7796/203307 [8:55:48<223:57:05,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7796/203307 [8:55:48<223:57:05,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7797/203307 [8:55:51<223:56:51,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7797/203307 [8:55:51<223:56:51,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7798/203307 [8:55:55<223:56:39,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7798/203307 [8:55:55<223:56:39,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7799/203307 [8:55:59<223:56:25,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7799/203307 [8:55:59<223:56:25,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7800/203307 [8:56:03<223:56:25,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7800/203307 [8:56:03<223:56:26,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7801/203307 [8:56:08<223:56:28,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   4%|▍         | 7801/203307 [8:56:08<223:56:29,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7802/203307 [8:56:12<223:56:28,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7802/203307 [8:56:12<223:56:28,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7803/203307 [8:56:16<223:56:14,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7803/203307 [8:56:16<223:56:14,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7804/203307 [8:56:19<223:55:59,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7804/203307 [8:56:19<223:55:59,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7805/203307 [8:56:23<223:55:45,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7805/203307 [8:56:23<223:55:45,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7806/203307 [8:56:27<223:55:39,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7806/203307 [8:56:27<223:55:39,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7807/203307 [8:56:31<223:55:33,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7807/203307 [8:56:31<223:55:33,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7808/203307 [8:56:35<223:55:22,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7808/203307 [8:56:35<223:55:22,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7809/203307 [8:56:40<223:55:37,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7809/203307 [8:56:40<223:55:38,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7810/203307 [8:56:44<223:55:23,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7810/203307 [8:56:44<223:55:23,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7811/203307 [8:56:48<223:55:25,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7811/203307 [8:56:48<223:55:25,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7812/203307 [8:56:52<223:55:11,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7812/203307 [8:56:52<223:55:12,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7813/203307 [8:56:56<223:55:04,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7813/203307 [8:56:56<223:55:04,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7814/203307 [8:57:00<223:54:50,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7814/203307 [8:57:00<223:54:51,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7815/203307 [8:57:04<223:54:44,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7815/203307 [8:57:04<223:54:45,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7816/203307 [8:57:07<223:54:28,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7816/203307 [8:57:07<223:54:28,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7817/203307 [8:57:12<223:54:32,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7817/203307 [8:57:12<223:54:33,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7818/203307 [8:57:16<223:54:39,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7818/203307 [8:57:16<223:54:39,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7819/203307 [8:57:21<223:54:40,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7819/203307 [8:57:21<223:54:40,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7820/203307 [8:57:24<223:54:25,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7820/203307 [8:57:24<223:54:25,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7821/203307 [8:57:28<223:54:13,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 7821/203307 [8:57:28<223:54:13,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7822/203307 [8:57:32<223:53:59,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7822/203307 [8:57:32<223:53:59,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7823/203307 [8:57:36<223:53:47,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7823/203307 [8:57:36<223:53:47,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7824/203307 [8:57:39<223:53:33,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7824/203307 [8:57:39<223:53:33,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7825/203307 [8:57:43<223:53:22,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7825/203307 [8:57:43<223:53:23,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7826/203307 [8:57:48<223:53:27,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7826/203307 [8:57:48<223:53:27,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7827/203307 [8:57:52<223:53:29,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7827/203307 [8:57:52<223:53:29,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7828/203307 [8:57:56<223:53:14,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7828/203307 [8:57:56<223:53:14,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7829/203307 [8:58:00<223:53:01,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7829/203307 [8:58:00<223:53:02,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7830/203307 [8:58:03<223:52:47,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7830/203307 [8:58:03<223:52:47,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7831/203307 [8:58:07<223:52:33,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7831/203307 [8:58:07<223:52:33,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7832/203307 [8:58:11<223:52:21,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7832/203307 [8:58:11<223:52:21,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7833/203307 [8:58:14<223:52:07,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7833/203307 [8:58:14<223:52:07,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7834/203307 [8:58:19<223:52:13,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7834/203307 [8:58:19<223:52:13,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7835/203307 [8:58:24<223:52:18,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7835/203307 [8:58:24<223:52:19,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7836/203307 [8:58:28<223:52:18,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7836/203307 [8:58:28<223:52:18,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7837/203307 [8:58:32<223:52:04,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7837/203307 [8:58:32<223:52:05,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7838/203307 [8:58:35<223:51:52,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7838/203307 [8:58:35<223:51:52,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7839/203307 [8:58:39<223:51:38,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7839/203307 [8:58:39<223:51:38,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7840/203307 [8:58:43<223:51:25,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7840/203307 [8:58:43<223:51:25,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7841/203307 [8:58:47<223:51:12,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7841/203307 [8:58:47<223:51:12,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7842/203307 [8:58:51<223:51:16,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7842/203307 [8:58:51<223:51:17,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7843/203307 [8:58:55<223:51:04,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7843/203307 [8:58:55<223:51:04,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7844/203307 [8:58:59<223:51:09,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7844/203307 [8:58:59<223:51:09,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7845/203307 [8:59:04<223:51:07,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7845/203307 [8:59:04<223:51:07,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7846/203307 [8:59:07<223:50:54,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7846/203307 [8:59:07<223:50:54,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7847/203307 [8:59:11<223:50:38,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7847/203307 [8:59:11<223:50:38,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7848/203307 [8:59:15<223:50:25,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7848/203307 [8:59:15<223:50:25,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7849/203307 [8:59:18<223:50:12,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7849/203307 [8:59:18<223:50:12,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7850/203307 [8:59:22<223:50:00,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7850/203307 [8:59:22<223:50:00,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7851/203307 [8:59:27<223:50:04,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7851/203307 [8:59:27<223:50:04,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7852/203307 [8:59:31<223:50:04,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7852/203307 [8:59:31<223:50:04,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7853/203307 [8:59:36<223:50:10,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7853/203307 [8:59:36<223:50:10,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7854/203307 [8:59:40<223:50:07,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7854/203307 [8:59:40<223:50:07,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7855/203307 [8:59:43<223:49:51,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7855/203307 [8:59:43<223:49:51,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7856/203307 [8:59:47<223:49:35,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7856/203307 [8:59:47<223:49:35,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7857/203307 [8:59:51<223:49:22,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7857/203307 [8:59:51<223:49:23,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7858/203307 [8:59:55<223:49:08,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7858/203307 [8:59:55<223:49:08,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7859/203307 [8:59:59<223:49:13,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7859/203307 [8:59:59<223:49:13,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7860/203307 [9:00:03<223:48:59,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7860/203307 [9:00:03<223:48:59,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7861/203307 [9:00:07<223:49:03,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:   4%|▍         | 7861/203307 [9:00:07<223:49:03,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7862/203307 [9:00:11<223:48:50,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7862/203307 [9:00:11<223:48:50,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7863/203307 [9:00:15<223:48:49,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7863/203307 [9:00:15<223:48:50,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7864/203307 [9:00:19<223:48:37,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7864/203307 [9:00:19<223:48:37,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7865/203307 [9:00:23<223:48:24,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7865/203307 [9:00:23<223:48:24,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7866/203307 [9:00:26<223:48:10,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7866/203307 [9:00:27<223:48:11,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7867/203307 [9:00:31<223:48:17,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7867/203307 [9:00:31<223:48:18,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7868/203307 [9:00:35<223:48:04,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7868/203307 [9:00:35<223:48:05,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7869/203307 [9:00:39<223:48:07,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7869/203307 [9:00:39<223:48:07,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7870/203307 [9:00:44<223:48:11,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7870/203307 [9:00:44<223:48:12,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7871/203307 [9:00:47<223:47:57,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7871/203307 [9:00:47<223:47:58,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7872/203307 [9:00:52<223:47:56,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7872/203307 [9:00:52<223:47:56,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7873/203307 [9:00:55<223:47:43,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7873/203307 [9:00:55<223:47:43,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7874/203307 [9:00:59<223:47:30,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7874/203307 [9:00:59<223:47:30,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7875/203307 [9:01:03<223:47:18,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7875/203307 [9:01:03<223:47:18,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7876/203307 [9:01:07<223:47:24,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7876/203307 [9:01:08<223:47:24,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7877/203307 [9:01:12<223:47:22,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7877/203307 [9:01:12<223:47:22,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7878/203307 [9:01:15<223:47:09,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7878/203307 [9:01:15<223:47:09,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7879/203307 [9:01:20<223:47:11,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7879/203307 [9:01:20<223:47:11,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7880/203307 [9:01:24<223:46:57,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7880/203307 [9:01:24<223:46:57,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7881/203307 [9:01:28<223:46:57,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7881/203307 [9:01:28<223:46:57,  0.24it/s, v_num=t5e6, training/loss=0.092] Epoch 0:   4%|▍         | 7882/203307 [9:01:32<223:46:43,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7882/203307 [9:01:32<223:46:43,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7883/203307 [9:01:35<223:46:29,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7883/203307 [9:01:35<223:46:29,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7884/203307 [9:01:40<223:46:32,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7884/203307 [9:01:40<223:46:32,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7885/203307 [9:01:44<223:46:21,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7885/203307 [9:01:44<223:46:21,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7886/203307 [9:01:48<223:46:22,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7886/203307 [9:01:48<223:46:23,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7887/203307 [9:01:52<223:46:25,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7887/203307 [9:01:52<223:46:25,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7888/203307 [9:01:56<223:46:10,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7888/203307 [9:01:56<223:46:10,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7889/203307 [9:02:00<223:45:54,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7889/203307 [9:02:00<223:45:55,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7890/203307 [9:02:04<223:45:54,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7890/203307 [9:02:04<223:45:54,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7891/203307 [9:02:08<223:45:38,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7891/203307 [9:02:08<223:45:38,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7892/203307 [9:02:12<223:45:43,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7892/203307 [9:02:12<223:45:43,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7893/203307 [9:02:16<223:45:28,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7893/203307 [9:02:16<223:45:29,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7894/203307 [9:02:20<223:45:31,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7894/203307 [9:02:20<223:45:31,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7895/203307 [9:02:24<223:45:19,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7895/203307 [9:02:24<223:45:20,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7896/203307 [9:02:28<223:45:24,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7896/203307 [9:02:28<223:45:24,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7897/203307 [9:02:32<223:45:09,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7897/203307 [9:02:32<223:45:10,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7898/203307 [9:02:36<223:44:57,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7898/203307 [9:02:36<223:44:57,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7899/203307 [9:02:40<223:44:56,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7899/203307 [9:02:40<223:44:56,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7900/203307 [9:02:44<223:44:42,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7900/203307 [9:02:44<223:44:43,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7901/203307 [9:02:48<223:44:45,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 7901/203307 [9:02:48<223:44:45,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7902/203307 [9:02:53<223:44:45,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7902/203307 [9:02:53<223:44:46,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7903/203307 [9:02:56<223:44:31,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7903/203307 [9:02:56<223:44:32,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7904/203307 [9:03:00<223:44:17,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7904/203307 [9:03:00<223:44:17,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7905/203307 [9:03:05<223:44:23,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7905/203307 [9:03:05<223:44:23,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7906/203307 [9:03:08<223:44:07,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7906/203307 [9:03:08<223:44:08,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7907/203307 [9:03:12<223:43:55,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7907/203307 [9:03:12<223:43:55,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7908/203307 [9:03:16<223:43:54,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7908/203307 [9:03:16<223:43:54,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7909/203307 [9:03:21<223:43:58,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7909/203307 [9:03:21<223:43:58,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7910/203307 [9:03:24<223:43:45,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7910/203307 [9:03:24<223:43:45,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7911/203307 [9:03:29<223:43:47,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7911/203307 [9:03:29<223:43:47,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7912/203307 [9:03:33<223:43:33,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7912/203307 [9:03:33<223:43:33,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7913/203307 [9:03:37<223:43:36,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7913/203307 [9:03:37<223:43:36,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7914/203307 [9:03:41<223:43:23,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7914/203307 [9:03:41<223:43:23,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7915/203307 [9:03:44<223:43:08,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7915/203307 [9:03:44<223:43:09,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7916/203307 [9:03:48<223:42:54,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7916/203307 [9:03:48<223:42:55,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7917/203307 [9:03:53<223:43:01,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7917/203307 [9:03:53<223:43:01,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7918/203307 [9:03:57<223:42:49,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7918/203307 [9:03:57<223:42:49,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7919/203307 [9:04:01<223:42:50,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7919/203307 [9:04:01<223:42:50,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7920/203307 [9:04:05<223:42:39,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7920/203307 [9:04:05<223:42:39,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7921/203307 [9:04:08<223:42:26,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   4%|▍         | 7921/203307 [9:04:08<223:42:26,  0.24it/s, v_num=t5e6, training/loss=0.102] Epoch 0:   4%|▍         | 7922/203307 [9:04:13<223:42:35,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7922/203307 [9:04:13<223:42:35,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7923/203307 [9:04:17<223:42:23,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7923/203307 [9:04:17<223:42:23,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7924/203307 [9:04:21<223:42:08,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7924/203307 [9:04:21<223:42:09,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7925/203307 [9:04:24<223:41:56,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7925/203307 [9:04:24<223:41:56,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7926/203307 [9:04:29<223:42:02,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7926/203307 [9:04:29<223:42:02,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7927/203307 [9:04:33<223:42:02,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7927/203307 [9:04:33<223:42:02,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7928/203307 [9:04:37<223:41:47,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7928/203307 [9:04:37<223:41:47,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7929/203307 [9:04:41<223:41:35,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7929/203307 [9:04:41<223:41:35,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7930/203307 [9:04:44<223:41:22,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7930/203307 [9:04:44<223:41:22,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7931/203307 [9:04:49<223:41:27,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7931/203307 [9:04:49<223:41:27,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7932/203307 [9:04:53<223:41:12,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7932/203307 [9:04:53<223:41:12,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7933/203307 [9:04:56<223:40:58,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7933/203307 [9:04:56<223:40:58,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7934/203307 [9:05:01<223:41:02,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7934/203307 [9:05:01<223:41:02,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7935/203307 [9:05:05<223:41:00,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7935/203307 [9:05:05<223:41:00,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7936/203307 [9:05:09<223:41:02,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7936/203307 [9:05:09<223:41:02,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7937/203307 [9:05:13<223:40:48,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7937/203307 [9:05:13<223:40:48,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7938/203307 [9:05:17<223:40:35,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7938/203307 [9:05:17<223:40:36,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7939/203307 [9:05:21<223:40:39,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7939/203307 [9:05:21<223:40:39,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7940/203307 [9:05:25<223:40:24,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7940/203307 [9:05:25<223:40:24,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7941/203307 [9:05:29<223:40:10,  0.24it/s, v_num=t5e6, training/loss=0.102]Epoch 0:   4%|▍         | 7941/203307 [9:05:29<223:40:10,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7942/203307 [9:05:33<223:40:13,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7942/203307 [9:05:33<223:40:13,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7943/203307 [9:05:37<223:40:01,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7943/203307 [9:05:37<223:40:01,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7944/203307 [9:05:41<223:40:03,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7944/203307 [9:05:41<223:40:03,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7945/203307 [9:05:45<223:39:49,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7945/203307 [9:05:45<223:39:49,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7946/203307 [9:05:49<223:39:33,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7946/203307 [9:05:49<223:39:33,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7947/203307 [9:05:52<223:39:18,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7947/203307 [9:05:52<223:39:18,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7948/203307 [9:05:57<223:39:20,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7948/203307 [9:05:57<223:39:20,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7949/203307 [9:06:00<223:39:04,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7949/203307 [9:06:00<223:39:04,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7950/203307 [9:06:04<223:38:50,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7950/203307 [9:06:04<223:38:50,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7951/203307 [9:06:09<223:38:54,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7951/203307 [9:06:09<223:38:54,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7952/203307 [9:06:13<223:38:53,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7952/203307 [9:06:13<223:38:54,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7953/203307 [9:06:17<223:38:52,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7953/203307 [9:06:17<223:38:52,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7954/203307 [9:06:21<223:38:38,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7954/203307 [9:06:21<223:38:38,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7955/203307 [9:06:24<223:38:24,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7955/203307 [9:06:24<223:38:24,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7956/203307 [9:06:28<223:38:11,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7956/203307 [9:06:28<223:38:11,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7957/203307 [9:06:33<223:38:18,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7957/203307 [9:06:33<223:38:18,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7958/203307 [9:06:36<223:38:03,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7958/203307 [9:06:36<223:38:04,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7959/203307 [9:06:41<223:38:06,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7959/203307 [9:06:41<223:38:06,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7960/203307 [9:06:45<223:37:52,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7960/203307 [9:06:45<223:37:53,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7961/203307 [9:06:49<223:37:56,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 7961/203307 [9:06:49<223:37:56,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7962/203307 [9:06:53<223:37:53,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7962/203307 [9:06:53<223:37:53,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7963/203307 [9:06:57<223:37:40,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7963/203307 [9:06:57<223:37:40,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7964/203307 [9:07:01<223:37:25,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7964/203307 [9:07:01<223:37:25,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7965/203307 [9:07:05<223:37:29,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7965/203307 [9:07:05<223:37:29,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7966/203307 [9:07:09<223:37:15,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7966/203307 [9:07:09<223:37:16,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7967/203307 [9:07:13<223:37:19,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7967/203307 [9:07:13<223:37:20,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7968/203307 [9:07:17<223:37:06,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7968/203307 [9:07:17<223:37:06,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7969/203307 [9:07:21<223:37:06,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7969/203307 [9:07:21<223:37:06,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7970/203307 [9:07:25<223:36:58,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7970/203307 [9:07:25<223:36:58,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7971/203307 [9:07:29<223:36:55,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7971/203307 [9:07:29<223:36:55,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7972/203307 [9:07:33<223:36:41,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7972/203307 [9:07:33<223:36:41,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7973/203307 [9:07:37<223:36:28,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7973/203307 [9:07:37<223:36:28,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7974/203307 [9:07:41<223:36:31,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7974/203307 [9:07:41<223:36:32,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7975/203307 [9:07:45<223:36:19,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7975/203307 [9:07:45<223:36:20,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7976/203307 [9:07:50<223:36:23,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7976/203307 [9:07:50<223:36:23,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7977/203307 [9:07:54<223:36:24,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7977/203307 [9:07:54<223:36:24,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7978/203307 [9:07:58<223:36:10,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7978/203307 [9:07:58<223:36:10,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7979/203307 [9:08:01<223:35:58,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7979/203307 [9:08:01<223:35:58,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7980/203307 [9:08:06<223:35:58,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7980/203307 [9:08:06<223:35:58,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7981/203307 [9:08:09<223:35:45,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:   4%|▍         | 7981/203307 [9:08:09<223:35:45,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7982/203307 [9:08:13<223:35:31,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7982/203307 [9:08:13<223:35:31,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7983/203307 [9:08:18<223:35:35,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7983/203307 [9:08:18<223:35:35,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7984/203307 [9:08:22<223:35:36,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7984/203307 [9:08:22<223:35:37,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7985/203307 [9:08:26<223:35:24,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7985/203307 [9:08:26<223:35:24,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7986/203307 [9:08:30<223:35:26,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7986/203307 [9:08:30<223:35:27,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7987/203307 [9:08:34<223:35:14,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7987/203307 [9:08:34<223:35:14,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7988/203307 [9:08:38<223:35:00,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7988/203307 [9:08:38<223:35:00,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7989/203307 [9:08:42<223:34:59,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7989/203307 [9:08:42<223:34:59,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7990/203307 [9:08:46<223:34:44,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7990/203307 [9:08:46<223:34:44,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7991/203307 [9:08:50<223:34:46,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7991/203307 [9:08:50<223:34:46,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7992/203307 [9:08:54<223:34:52,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7992/203307 [9:08:54<223:34:52,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7993/203307 [9:08:58<223:34:38,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7993/203307 [9:08:58<223:34:39,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7994/203307 [9:09:03<223:34:40,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7994/203307 [9:09:03<223:34:40,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7995/203307 [9:09:06<223:34:29,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7995/203307 [9:09:06<223:34:30,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7996/203307 [9:09:10<223:34:15,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7996/203307 [9:09:10<223:34:15,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7997/203307 [9:09:14<223:34:02,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7997/203307 [9:09:14<223:34:02,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7998/203307 [9:09:18<223:34:01,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7998/203307 [9:09:18<223:34:01,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7999/203307 [9:09:22<223:33:47,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 7999/203307 [9:09:22<223:33:47,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 8000/203307 [9:09:26<223:33:50,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 8000/203307 [9:09:26<223:33:51,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 8001/203307 [9:09:31<223:33:55,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   4%|▍         | 8001/203307 [9:09:31<223:33:55,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8002/203307 [9:09:35<223:33:54,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8002/203307 [9:09:35<223:33:54,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8003/203307 [9:09:39<223:33:40,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8003/203307 [9:09:39<223:33:40,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8004/203307 [9:09:42<223:33:26,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8004/203307 [9:09:42<223:33:26,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8005/203307 [9:09:46<223:33:11,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8005/203307 [9:09:46<223:33:11,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8006/203307 [9:09:50<223:32:58,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8006/203307 [9:09:50<223:32:58,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8007/203307 [9:09:54<223:32:58,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8007/203307 [9:09:54<223:32:58,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8008/203307 [9:09:58<223:32:42,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8008/203307 [9:09:58<223:32:43,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8009/203307 [9:10:02<223:32:47,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8009/203307 [9:10:02<223:32:47,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8010/203307 [9:10:06<223:32:35,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8010/203307 [9:10:06<223:32:36,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8011/203307 [9:10:10<223:32:36,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8011/203307 [9:10:10<223:32:37,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8012/203307 [9:10:14<223:32:23,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8012/203307 [9:10:14<223:32:23,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8013/203307 [9:10:18<223:32:11,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8013/203307 [9:10:18<223:32:11,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8014/203307 [9:10:22<223:31:57,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8014/203307 [9:10:22<223:31:58,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8015/203307 [9:10:25<223:31:43,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8015/203307 [9:10:25<223:31:43,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8016/203307 [9:10:30<223:31:44,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8016/203307 [9:10:30<223:31:44,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8017/203307 [9:10:34<223:31:47,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8017/203307 [9:10:34<223:31:47,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8018/203307 [9:10:38<223:31:32,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8018/203307 [9:10:38<223:31:32,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8019/203307 [9:10:42<223:31:32,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8019/203307 [9:10:42<223:31:32,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8020/203307 [9:10:46<223:31:18,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8020/203307 [9:10:46<223:31:18,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8021/203307 [9:10:50<223:31:03,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8021/203307 [9:10:50<223:31:03,  0.24it/s, v_num=t5e6, training/loss=0.087] Epoch 0:   4%|▍         | 8022/203307 [9:10:53<223:30:50,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8022/203307 [9:10:53<223:30:50,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8023/203307 [9:10:57<223:30:36,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8023/203307 [9:10:57<223:30:36,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8024/203307 [9:11:01<223:30:22,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8024/203307 [9:11:01<223:30:22,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8025/203307 [9:11:05<223:30:23,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8025/203307 [9:11:05<223:30:23,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8026/203307 [9:11:09<223:30:26,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8026/203307 [9:11:09<223:30:26,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8027/203307 [9:11:14<223:30:25,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8027/203307 [9:11:14<223:30:26,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8028/203307 [9:11:17<223:30:12,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8028/203307 [9:11:17<223:30:12,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8029/203307 [9:11:21<223:30:00,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8029/203307 [9:11:21<223:30:00,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8030/203307 [9:11:25<223:29:46,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8030/203307 [9:11:25<223:29:47,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8031/203307 [9:11:29<223:29:34,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8031/203307 [9:11:29<223:29:34,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8032/203307 [9:11:32<223:29:20,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8032/203307 [9:11:32<223:29:21,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8033/203307 [9:11:36<223:29:07,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8033/203307 [9:11:36<223:29:07,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8034/203307 [9:11:41<223:29:11,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8034/203307 [9:11:41<223:29:11,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8035/203307 [9:11:45<223:29:16,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8035/203307 [9:11:45<223:29:16,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8036/203307 [9:11:50<223:29:17,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8036/203307 [9:11:50<223:29:17,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8037/203307 [9:11:53<223:29:04,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8037/203307 [9:11:53<223:29:05,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8038/203307 [9:11:57<223:28:51,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8038/203307 [9:11:57<223:28:51,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8039/203307 [9:12:01<223:28:37,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8039/203307 [9:12:01<223:28:37,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8040/203307 [9:12:04<223:28:24,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8040/203307 [9:12:04<223:28:24,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8041/203307 [9:12:08<223:28:11,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   4%|▍         | 8041/203307 [9:12:08<223:28:11,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8042/203307 [9:12:13<223:28:15,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8042/203307 [9:12:13<223:28:15,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8043/203307 [9:12:17<223:28:21,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8043/203307 [9:12:17<223:28:21,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8044/203307 [9:12:22<223:28:25,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8044/203307 [9:12:22<223:28:25,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8045/203307 [9:12:25<223:28:13,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8045/203307 [9:12:25<223:28:13,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8046/203307 [9:12:29<223:28:00,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8046/203307 [9:12:29<223:28:01,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8047/203307 [9:12:33<223:27:50,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8047/203307 [9:12:33<223:27:50,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8048/203307 [9:12:37<223:27:36,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8048/203307 [9:12:37<223:27:36,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8049/203307 [9:12:41<223:27:22,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8049/203307 [9:12:41<223:27:22,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8050/203307 [9:12:44<223:27:06,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8050/203307 [9:12:44<223:27:06,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8051/203307 [9:12:49<223:27:13,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8051/203307 [9:12:49<223:27:13,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8052/203307 [9:12:53<223:27:16,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8052/203307 [9:12:53<223:27:16,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8053/203307 [9:12:57<223:27:02,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8053/203307 [9:12:57<223:27:02,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8054/203307 [9:13:01<223:26:47,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8054/203307 [9:13:01<223:26:48,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8055/203307 [9:13:04<223:26:34,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8055/203307 [9:13:04<223:26:34,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8056/203307 [9:13:08<223:26:22,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8056/203307 [9:13:08<223:26:22,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8057/203307 [9:13:12<223:26:08,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8057/203307 [9:13:12<223:26:08,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8058/203307 [9:13:16<223:25:54,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8058/203307 [9:13:16<223:25:54,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8059/203307 [9:13:20<223:25:59,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8059/203307 [9:13:20<223:25:59,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8060/203307 [9:13:24<223:25:45,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8060/203307 [9:13:24<223:25:46,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8061/203307 [9:13:28<223:25:50,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   4%|▍         | 8061/203307 [9:13:28<223:25:50,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8062/203307 [9:13:32<223:25:36,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8062/203307 [9:13:32<223:25:37,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8063/203307 [9:13:36<223:25:23,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8063/203307 [9:13:36<223:25:23,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8064/203307 [9:13:39<223:25:10,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8064/203307 [9:13:39<223:25:10,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8065/203307 [9:13:43<223:24:59,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8065/203307 [9:13:43<223:24:59,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8066/203307 [9:13:47<223:24:43,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8066/203307 [9:13:47<223:24:44,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8067/203307 [9:13:51<223:24:48,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8067/203307 [9:13:51<223:24:48,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8068/203307 [9:13:55<223:24:34,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8068/203307 [9:13:55<223:24:34,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8069/203307 [9:14:00<223:24:37,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8069/203307 [9:14:00<223:24:37,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8070/203307 [9:14:04<223:24:34,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8070/203307 [9:14:04<223:24:34,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8071/203307 [9:14:07<223:24:20,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8071/203307 [9:14:07<223:24:20,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8072/203307 [9:14:11<223:24:04,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8072/203307 [9:14:11<223:24:04,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8073/203307 [9:14:15<223:23:50,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8073/203307 [9:14:15<223:23:51,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8074/203307 [9:14:19<223:23:40,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8074/203307 [9:14:19<223:23:40,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8075/203307 [9:14:22<223:23:29,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8075/203307 [9:14:22<223:23:29,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8076/203307 [9:14:27<223:23:34,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8076/203307 [9:14:27<223:23:34,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8077/203307 [9:14:31<223:23:35,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8077/203307 [9:14:31<223:23:35,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8078/203307 [9:14:36<223:23:39,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8078/203307 [9:14:36<223:23:39,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8079/203307 [9:14:40<223:23:38,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8079/203307 [9:14:40<223:23:38,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8080/203307 [9:14:44<223:23:25,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8080/203307 [9:14:44<223:23:26,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8081/203307 [9:14:48<223:23:15,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8081/203307 [9:14:48<223:23:16,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8082/203307 [9:14:51<223:23:03,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8082/203307 [9:14:51<223:23:03,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8083/203307 [9:14:55<223:22:49,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8083/203307 [9:14:55<223:22:49,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8084/203307 [9:15:00<223:22:52,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8084/203307 [9:15:00<223:22:52,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8085/203307 [9:15:03<223:22:40,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8085/203307 [9:15:03<223:22:40,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8086/203307 [9:15:08<223:22:41,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8086/203307 [9:15:08<223:22:41,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8087/203307 [9:15:12<223:22:44,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8087/203307 [9:15:12<223:22:44,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8088/203307 [9:15:16<223:22:41,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8088/203307 [9:15:16<223:22:41,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8089/203307 [9:15:20<223:22:29,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8089/203307 [9:15:20<223:22:30,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8090/203307 [9:15:24<223:22:16,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8090/203307 [9:15:24<223:22:16,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8091/203307 [9:15:28<223:22:03,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8091/203307 [9:15:28<223:22:04,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8092/203307 [9:15:32<223:22:08,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8092/203307 [9:15:32<223:22:08,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8093/203307 [9:15:36<223:21:55,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8093/203307 [9:15:36<223:21:55,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8094/203307 [9:15:40<223:21:55,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8094/203307 [9:15:40<223:21:55,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8095/203307 [9:15:44<223:21:58,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8095/203307 [9:15:44<223:21:58,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8096/203307 [9:15:48<223:21:44,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8096/203307 [9:15:48<223:21:45,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8097/203307 [9:15:52<223:21:42,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8097/203307 [9:15:52<223:21:42,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8098/203307 [9:15:56<223:21:30,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8098/203307 [9:15:56<223:21:30,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8099/203307 [9:16:00<223:21:16,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8099/203307 [9:16:00<223:21:17,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8100/203307 [9:16:04<223:21:03,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8100/203307 [9:16:04<223:21:03,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8101/203307 [9:16:08<223:21:08,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   4%|▍         | 8101/203307 [9:16:08<223:21:08,  0.24it/s, v_num=t5e6, training/loss=0.111] Epoch 0:   4%|▍         | 8102/203307 [9:16:12<223:21:08,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8102/203307 [9:16:12<223:21:08,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8103/203307 [9:16:16<223:20:57,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8103/203307 [9:16:16<223:20:57,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8104/203307 [9:16:21<223:21:02,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8104/203307 [9:16:21<223:21:02,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8105/203307 [9:16:25<223:20:49,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8105/203307 [9:16:25<223:20:49,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8106/203307 [9:16:29<223:20:44,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8106/203307 [9:16:29<223:20:44,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8107/203307 [9:16:32<223:20:31,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8107/203307 [9:16:32<223:20:32,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8108/203307 [9:16:36<223:20:17,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8108/203307 [9:16:36<223:20:17,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8109/203307 [9:16:40<223:20:19,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8109/203307 [9:16:40<223:20:19,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8110/203307 [9:16:44<223:20:06,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8110/203307 [9:16:44<223:20:07,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8111/203307 [9:16:49<223:20:08,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8111/203307 [9:16:49<223:20:08,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8112/203307 [9:16:52<223:19:55,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8112/203307 [9:16:52<223:19:55,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8113/203307 [9:16:57<223:19:59,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8113/203307 [9:16:57<223:19:59,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8114/203307 [9:17:00<223:19:44,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8114/203307 [9:17:00<223:19:44,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8115/203307 [9:17:05<223:19:43,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8115/203307 [9:17:05<223:19:43,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8116/203307 [9:17:08<223:19:30,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8116/203307 [9:17:08<223:19:30,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8117/203307 [9:17:13<223:19:34,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8117/203307 [9:17:13<223:19:35,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8118/203307 [9:17:17<223:19:23,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8118/203307 [9:17:17<223:19:23,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8119/203307 [9:17:21<223:19:26,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8119/203307 [9:17:21<223:19:26,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8120/203307 [9:17:25<223:19:12,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8120/203307 [9:17:25<223:19:12,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8121/203307 [9:17:29<223:19:15,  0.24it/s, v_num=t5e6, training/loss=0.111]Epoch 0:   4%|▍         | 8121/203307 [9:17:29<223:19:15,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8122/203307 [9:17:33<223:19:01,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8122/203307 [9:17:33<223:19:02,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8123/203307 [9:17:37<223:18:47,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8123/203307 [9:17:37<223:18:47,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8124/203307 [9:17:41<223:18:45,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8124/203307 [9:17:41<223:18:45,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8125/203307 [9:17:45<223:18:31,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8125/203307 [9:17:45<223:18:31,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8126/203307 [9:17:49<223:18:35,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8126/203307 [9:17:49<223:18:35,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8127/203307 [9:17:53<223:18:35,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8127/203307 [9:17:53<223:18:35,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8128/203307 [9:17:57<223:18:20,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8128/203307 [9:17:57<223:18:20,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8129/203307 [9:18:01<223:18:05,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8129/203307 [9:18:01<223:18:06,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8130/203307 [9:18:05<223:18:09,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8130/203307 [9:18:05<223:18:09,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8131/203307 [9:18:09<223:17:55,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8131/203307 [9:18:09<223:17:55,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8132/203307 [9:18:13<223:17:42,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8132/203307 [9:18:13<223:17:42,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8133/203307 [9:18:17<223:17:40,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8133/203307 [9:18:17<223:17:40,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8134/203307 [9:18:21<223:17:44,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8134/203307 [9:18:21<223:17:44,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8135/203307 [9:18:25<223:17:31,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8135/203307 [9:18:25<223:17:32,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8136/203307 [9:18:29<223:17:34,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8136/203307 [9:18:29<223:17:34,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8137/203307 [9:18:33<223:17:19,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8137/203307 [9:18:33<223:17:19,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8138/203307 [9:18:37<223:17:04,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8138/203307 [9:18:37<223:17:04,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8139/203307 [9:18:41<223:17:08,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8139/203307 [9:18:41<223:17:08,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8140/203307 [9:18:45<223:16:54,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8140/203307 [9:18:45<223:16:54,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8141/203307 [9:18:49<223:16:38,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   4%|▍         | 8141/203307 [9:18:49<223:16:38,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8142/203307 [9:18:53<223:16:45,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8142/203307 [9:18:53<223:16:45,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8143/203307 [9:18:57<223:16:31,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8143/203307 [9:18:57<223:16:31,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8144/203307 [9:19:01<223:16:31,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8144/203307 [9:19:01<223:16:31,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8145/203307 [9:19:05<223:16:17,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8145/203307 [9:19:05<223:16:17,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8146/203307 [9:19:08<223:16:02,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8146/203307 [9:19:08<223:16:02,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8147/203307 [9:19:13<223:16:05,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8147/203307 [9:19:13<223:16:06,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8148/203307 [9:19:17<223:15:52,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8148/203307 [9:19:17<223:15:52,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8149/203307 [9:19:20<223:15:37,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8149/203307 [9:19:20<223:15:37,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8150/203307 [9:19:24<223:15:25,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8150/203307 [9:19:24<223:15:25,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8151/203307 [9:19:29<223:15:30,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8151/203307 [9:19:29<223:15:30,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8152/203307 [9:19:33<223:15:30,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8152/203307 [9:19:33<223:15:31,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8153/203307 [9:19:37<223:15:17,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8153/203307 [9:19:37<223:15:17,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8154/203307 [9:19:40<223:15:03,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8154/203307 [9:19:40<223:15:04,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8155/203307 [9:19:44<223:14:51,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8155/203307 [9:19:44<223:14:51,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8156/203307 [9:19:49<223:14:56,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8156/203307 [9:19:49<223:14:56,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8157/203307 [9:19:52<223:14:44,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8157/203307 [9:19:52<223:14:44,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8158/203307 [9:19:56<223:14:29,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8158/203307 [9:19:56<223:14:29,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8159/203307 [9:20:00<223:14:32,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8159/203307 [9:20:00<223:14:32,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8160/203307 [9:20:05<223:14:27,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8160/203307 [9:20:05<223:14:27,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8161/203307 [9:20:09<223:14:29,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8161/203307 [9:20:09<223:14:29,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8162/203307 [9:20:13<223:14:16,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8162/203307 [9:20:13<223:14:16,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8163/203307 [9:20:16<223:14:03,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8163/203307 [9:20:16<223:14:04,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8164/203307 [9:20:20<223:13:51,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8164/203307 [9:20:20<223:13:52,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8165/203307 [9:20:25<223:13:57,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8165/203307 [9:20:25<223:13:57,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8166/203307 [9:20:28<223:13:42,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8166/203307 [9:20:28<223:13:43,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8167/203307 [9:20:33<223:13:46,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8167/203307 [9:20:33<223:13:46,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8168/203307 [9:20:37<223:13:33,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8168/203307 [9:20:37<223:13:33,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8169/203307 [9:20:41<223:13:33,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8169/203307 [9:20:41<223:13:34,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8170/203307 [9:20:45<223:13:20,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8170/203307 [9:20:45<223:13:20,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8171/203307 [9:20:48<223:13:07,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8171/203307 [9:20:48<223:13:07,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8172/203307 [9:20:52<223:12:52,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8172/203307 [9:20:52<223:12:52,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8173/203307 [9:20:57<223:12:57,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8173/203307 [9:20:57<223:12:57,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8174/203307 [9:21:00<223:12:44,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8174/203307 [9:21:00<223:12:44,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8175/203307 [9:21:04<223:12:30,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8175/203307 [9:21:04<223:12:30,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8176/203307 [9:21:08<223:12:33,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8176/203307 [9:21:08<223:12:34,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8177/203307 [9:21:13<223:12:33,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8177/203307 [9:21:13<223:12:34,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8178/203307 [9:21:17<223:12:30,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8178/203307 [9:21:17<223:12:30,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8179/203307 [9:21:21<223:12:17,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8179/203307 [9:21:21<223:12:18,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8180/203307 [9:21:24<223:12:04,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8180/203307 [9:21:24<223:12:04,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8181/203307 [9:21:28<223:11:52,  0.24it/s, v_num=t5e6, training/loss=0.0961]Epoch 0:   4%|▍         | 8181/203307 [9:21:28<223:11:52,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8182/203307 [9:21:33<223:11:56,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8182/203307 [9:21:33<223:11:56,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8183/203307 [9:21:36<223:11:44,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8183/203307 [9:21:36<223:11:44,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8184/203307 [9:21:41<223:11:48,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8184/203307 [9:21:41<223:11:48,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8185/203307 [9:21:45<223:11:34,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8185/203307 [9:21:45<223:11:35,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8186/203307 [9:21:49<223:11:35,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8186/203307 [9:21:49<223:11:35,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8187/203307 [9:21:53<223:11:34,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8187/203307 [9:21:53<223:11:34,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8188/203307 [9:21:57<223:11:19,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8188/203307 [9:21:57<223:11:19,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8189/203307 [9:22:01<223:11:05,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8189/203307 [9:22:01<223:11:06,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8190/203307 [9:22:04<223:10:53,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8190/203307 [9:22:04<223:10:53,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8191/203307 [9:22:09<223:10:58,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8191/203307 [9:22:09<223:10:58,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8192/203307 [9:22:13<223:11:00,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8192/203307 [9:22:13<223:11:00,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8193/203307 [9:22:17<223:10:47,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8193/203307 [9:22:17<223:10:47,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8194/203307 [9:22:21<223:10:46,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8194/203307 [9:22:21<223:10:46,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8195/203307 [9:22:25<223:10:32,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8195/203307 [9:22:25<223:10:33,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8196/203307 [9:22:29<223:10:29,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8196/203307 [9:22:29<223:10:30,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8197/203307 [9:22:33<223:10:16,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8197/203307 [9:22:33<223:10:16,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8198/203307 [9:22:36<223:10:01,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8198/203307 [9:22:36<223:10:01,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8199/203307 [9:22:41<223:10:04,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8199/203307 [9:22:41<223:10:04,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8200/203307 [9:22:45<223:09:54,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8200/203307 [9:22:45<223:09:54,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8201/203307 [9:22:49<223:09:56,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8201/203307 [9:22:49<223:09:56,  0.24it/s, v_num=t5e6, training/loss=0.092] Epoch 0:   4%|▍         | 8202/203307 [9:22:53<223:09:54,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8202/203307 [9:22:53<223:09:54,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8203/203307 [9:22:57<223:09:39,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8203/203307 [9:22:57<223:09:40,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8204/203307 [9:23:01<223:09:25,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8204/203307 [9:23:01<223:09:25,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8205/203307 [9:23:05<223:09:23,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8205/203307 [9:23:05<223:09:23,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8206/203307 [9:23:09<223:09:08,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8206/203307 [9:23:09<223:09:08,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8207/203307 [9:23:12<223:08:55,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8207/203307 [9:23:12<223:08:55,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8208/203307 [9:23:17<223:08:59,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8208/203307 [9:23:17<223:08:59,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8209/203307 [9:23:21<223:09:03,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8209/203307 [9:23:21<223:09:04,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8210/203307 [9:23:25<223:08:51,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8210/203307 [9:23:25<223:08:51,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8211/203307 [9:23:29<223:08:54,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8211/203307 [9:23:29<223:08:54,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8212/203307 [9:23:33<223:08:41,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8212/203307 [9:23:33<223:08:41,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8213/203307 [9:23:37<223:08:30,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8213/203307 [9:23:37<223:08:30,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8214/203307 [9:23:41<223:08:27,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8214/203307 [9:23:41<223:08:27,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8215/203307 [9:23:45<223:08:13,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8215/203307 [9:23:45<223:08:13,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8216/203307 [9:23:48<223:07:57,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8216/203307 [9:23:48<223:07:57,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8217/203307 [9:23:53<223:08:05,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8217/203307 [9:23:53<223:08:05,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8218/203307 [9:23:57<223:07:52,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8218/203307 [9:23:57<223:07:52,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8219/203307 [9:24:01<223:07:54,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8219/203307 [9:24:01<223:07:54,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8220/203307 [9:24:05<223:07:40,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8220/203307 [9:24:05<223:07:40,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8221/203307 [9:24:09<223:07:28,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   4%|▍         | 8221/203307 [9:24:09<223:07:28,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8222/203307 [9:24:12<223:07:14,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8222/203307 [9:24:12<223:07:14,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8223/203307 [9:24:17<223:07:12,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8223/203307 [9:24:17<223:07:12,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8224/203307 [9:24:20<223:06:59,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8224/203307 [9:24:20<223:06:59,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8225/203307 [9:24:25<223:07:05,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8225/203307 [9:24:25<223:07:05,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8226/203307 [9:24:29<223:07:09,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8226/203307 [9:24:29<223:07:10,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8227/203307 [9:24:34<223:07:09,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8227/203307 [9:24:34<223:07:09,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8228/203307 [9:24:37<223:06:56,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8228/203307 [9:24:37<223:06:56,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8229/203307 [9:24:41<223:06:44,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8229/203307 [9:24:41<223:06:44,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8230/203307 [9:24:45<223:06:31,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8230/203307 [9:24:45<223:06:31,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8231/203307 [9:24:49<223:06:20,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8231/203307 [9:24:49<223:06:20,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8232/203307 [9:24:53<223:06:18,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8232/203307 [9:24:53<223:06:18,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8233/203307 [9:24:57<223:06:03,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8233/203307 [9:24:57<223:06:03,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8234/203307 [9:25:01<223:06:08,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8234/203307 [9:25:01<223:06:08,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8235/203307 [9:25:05<223:05:56,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8235/203307 [9:25:05<223:05:56,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8236/203307 [9:25:09<223:05:59,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8236/203307 [9:25:09<223:05:59,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8237/203307 [9:25:13<223:05:47,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8237/203307 [9:25:13<223:05:47,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8238/203307 [9:25:17<223:05:35,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8238/203307 [9:25:17<223:05:35,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8239/203307 [9:25:21<223:05:22,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8239/203307 [9:25:21<223:05:22,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8240/203307 [9:25:24<223:05:09,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8240/203307 [9:25:24<223:05:09,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8241/203307 [9:25:29<223:05:10,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   4%|▍         | 8241/203307 [9:25:29<223:05:10,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8242/203307 [9:25:33<223:05:13,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8242/203307 [9:25:33<223:05:13,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8243/203307 [9:25:38<223:05:15,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8243/203307 [9:25:38<223:05:16,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8244/203307 [9:25:42<223:05:14,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8244/203307 [9:25:42<223:05:14,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8245/203307 [9:25:45<223:04:59,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8245/203307 [9:25:45<223:05:00,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8246/203307 [9:25:49<223:04:45,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8246/203307 [9:25:49<223:04:45,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8247/203307 [9:25:53<223:04:32,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8247/203307 [9:25:53<223:04:32,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8248/203307 [9:25:57<223:04:18,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8248/203307 [9:25:57<223:04:19,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8249/203307 [9:26:00<223:04:05,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8249/203307 [9:26:00<223:04:05,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8250/203307 [9:26:05<223:04:04,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8250/203307 [9:26:05<223:04:04,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8251/203307 [9:26:09<223:04:09,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8251/203307 [9:26:09<223:04:09,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8252/203307 [9:26:13<223:04:07,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8252/203307 [9:26:13<223:04:07,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8253/203307 [9:26:17<223:03:55,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8253/203307 [9:26:17<223:03:55,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8254/203307 [9:26:21<223:03:44,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8254/203307 [9:26:21<223:03:44,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8255/203307 [9:26:25<223:03:33,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8255/203307 [9:26:25<223:03:34,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8256/203307 [9:26:28<223:03:22,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8256/203307 [9:26:28<223:03:22,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8257/203307 [9:26:32<223:03:09,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8257/203307 [9:26:32<223:03:10,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8258/203307 [9:26:36<223:02:56,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8258/203307 [9:26:36<223:02:57,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8259/203307 [9:26:40<223:03:01,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8259/203307 [9:26:40<223:03:01,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8260/203307 [9:26:45<223:03:05,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8260/203307 [9:26:45<223:03:05,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8261/203307 [9:26:49<223:03:07,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8261/203307 [9:26:49<223:03:07,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8262/203307 [9:26:53<223:02:57,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8262/203307 [9:26:53<223:02:57,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8263/203307 [9:26:57<223:02:45,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8263/203307 [9:26:57<223:02:45,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8264/203307 [9:27:01<223:02:32,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8264/203307 [9:27:01<223:02:32,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8265/203307 [9:27:04<223:02:19,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8265/203307 [9:27:04<223:02:20,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8266/203307 [9:27:08<223:02:05,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8266/203307 [9:27:08<223:02:06,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8267/203307 [9:27:13<223:02:11,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8267/203307 [9:27:13<223:02:11,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8268/203307 [9:27:17<223:02:08,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8268/203307 [9:27:17<223:02:08,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8269/203307 [9:27:21<223:02:13,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8269/203307 [9:27:21<223:02:13,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8270/203307 [9:27:25<223:02:01,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8270/203307 [9:27:25<223:02:01,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8271/203307 [9:27:29<223:01:49,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8271/203307 [9:27:29<223:01:49,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8272/203307 [9:27:33<223:01:38,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8272/203307 [9:27:33<223:01:38,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8273/203307 [9:27:37<223:01:27,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8273/203307 [9:27:37<223:01:27,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8274/203307 [9:27:40<223:01:14,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8274/203307 [9:27:40<223:01:14,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8275/203307 [9:27:44<223:01:00,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8275/203307 [9:27:44<223:01:00,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8276/203307 [9:27:48<223:01:04,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8276/203307 [9:27:48<223:01:04,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8277/203307 [9:27:53<223:01:04,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8277/203307 [9:27:53<223:01:04,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8278/203307 [9:27:56<223:00:49,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8278/203307 [9:27:56<223:00:49,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8279/203307 [9:28:00<223:00:34,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8279/203307 [9:28:00<223:00:34,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8280/203307 [9:28:04<223:00:19,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8280/203307 [9:28:04<223:00:19,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8281/203307 [9:28:07<223:00:04,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   4%|▍         | 8281/203307 [9:28:07<223:00:04,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8282/203307 [9:28:11<222:59:49,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8282/203307 [9:28:11<222:59:49,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8283/203307 [9:28:15<222:59:34,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8283/203307 [9:28:15<222:59:34,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8284/203307 [9:28:19<222:59:40,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8284/203307 [9:28:19<222:59:40,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8285/203307 [9:28:23<222:59:25,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8285/203307 [9:28:23<222:59:25,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8286/203307 [9:28:27<222:59:28,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8286/203307 [9:28:27<222:59:29,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8287/203307 [9:28:31<222:59:14,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8287/203307 [9:28:31<222:59:14,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8288/203307 [9:28:35<222:58:59,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8288/203307 [9:28:35<222:58:59,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8289/203307 [9:28:38<222:58:45,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8289/203307 [9:28:38<222:58:46,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8290/203307 [9:28:42<222:58:31,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8290/203307 [9:28:42<222:58:32,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8291/203307 [9:28:46<222:58:17,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8291/203307 [9:28:46<222:58:17,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8292/203307 [9:28:50<222:58:22,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8292/203307 [9:28:50<222:58:22,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8293/203307 [9:28:54<222:58:08,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8293/203307 [9:28:54<222:58:08,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8294/203307 [9:28:58<222:58:07,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8294/203307 [9:28:58<222:58:07,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8295/203307 [9:29:03<222:58:09,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8295/203307 [9:29:03<222:58:09,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8296/203307 [9:29:06<222:57:54,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8296/203307 [9:29:06<222:57:54,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8297/203307 [9:29:10<222:57:40,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8297/203307 [9:29:10<222:57:40,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8298/203307 [9:29:14<222:57:27,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8298/203307 [9:29:14<222:57:28,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8299/203307 [9:29:17<222:57:15,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8299/203307 [9:29:17<222:57:15,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8300/203307 [9:29:21<222:57:02,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8300/203307 [9:29:21<222:57:02,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8301/203307 [9:29:26<222:57:06,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   4%|▍         | 8301/203307 [9:29:26<222:57:07,  0.24it/s, v_num=t5e6, training/loss=0.091] Epoch 0:   4%|▍         | 8302/203307 [9:29:30<222:57:05,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8302/203307 [9:29:30<222:57:06,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8303/203307 [9:29:34<222:57:07,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8303/203307 [9:29:34<222:57:08,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8304/203307 [9:29:38<222:57:02,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8304/203307 [9:29:38<222:57:03,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8305/203307 [9:29:42<222:56:49,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8305/203307 [9:29:42<222:56:49,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8306/203307 [9:29:46<222:56:34,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8306/203307 [9:29:46<222:56:34,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8307/203307 [9:29:49<222:56:21,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8307/203307 [9:29:49<222:56:21,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8308/203307 [9:29:53<222:56:08,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8308/203307 [9:29:53<222:56:08,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8309/203307 [9:29:58<222:56:12,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8309/203307 [9:29:58<222:56:12,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8310/203307 [9:30:01<222:55:57,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8310/203307 [9:30:01<222:55:57,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8311/203307 [9:30:06<222:55:57,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8311/203307 [9:30:06<222:55:57,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8312/203307 [9:30:10<222:55:59,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8312/203307 [9:30:10<222:55:59,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8313/203307 [9:30:14<222:55:55,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8313/203307 [9:30:14<222:55:56,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8314/203307 [9:30:18<222:55:43,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8314/203307 [9:30:18<222:55:43,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8315/203307 [9:30:22<222:55:33,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8315/203307 [9:30:22<222:55:33,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8316/203307 [9:30:25<222:55:19,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8316/203307 [9:30:25<222:55:20,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8317/203307 [9:30:30<222:55:22,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8317/203307 [9:30:30<222:55:22,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8318/203307 [9:30:34<222:55:07,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8318/203307 [9:30:34<222:55:07,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8319/203307 [9:30:38<222:55:06,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8319/203307 [9:30:38<222:55:06,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8320/203307 [9:30:41<222:54:52,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8320/203307 [9:30:41<222:54:52,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8321/203307 [9:30:46<222:54:54,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   4%|▍         | 8321/203307 [9:30:46<222:54:54,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8322/203307 [9:30:50<222:54:50,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8322/203307 [9:30:50<222:54:50,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8323/203307 [9:30:54<222:54:35,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8323/203307 [9:30:54<222:54:35,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8324/203307 [9:30:57<222:54:20,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8324/203307 [9:30:57<222:54:20,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8325/203307 [9:31:01<222:54:07,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8325/203307 [9:31:01<222:54:07,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8326/203307 [9:31:05<222:54:11,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8326/203307 [9:31:05<222:54:12,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8327/203307 [9:31:10<222:54:10,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8327/203307 [9:31:10<222:54:10,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8328/203307 [9:31:13<222:53:56,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8328/203307 [9:31:13<222:53:56,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8329/203307 [9:31:18<222:53:59,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8329/203307 [9:31:18<222:53:59,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8330/203307 [9:31:22<222:53:47,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8330/203307 [9:31:22<222:53:47,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8331/203307 [9:31:26<222:53:46,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8331/203307 [9:31:26<222:53:46,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8332/203307 [9:31:30<222:53:35,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8332/203307 [9:31:30<222:53:35,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8333/203307 [9:31:33<222:53:23,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8333/203307 [9:31:33<222:53:23,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8334/203307 [9:31:38<222:53:27,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8334/203307 [9:31:38<222:53:27,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8335/203307 [9:31:42<222:53:16,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8335/203307 [9:31:42<222:53:16,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8336/203307 [9:31:46<222:53:17,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8336/203307 [9:31:46<222:53:18,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8337/203307 [9:31:50<222:53:06,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8337/203307 [9:31:50<222:53:06,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8338/203307 [9:31:54<222:53:10,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8338/203307 [9:31:54<222:53:10,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8339/203307 [9:31:58<222:52:58,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8339/203307 [9:31:58<222:52:59,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8340/203307 [9:32:02<222:52:59,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8340/203307 [9:32:02<222:52:59,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8341/203307 [9:32:06<222:52:48,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   4%|▍         | 8341/203307 [9:32:06<222:52:48,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8342/203307 [9:32:11<222:52:53,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8342/203307 [9:32:11<222:52:54,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8343/203307 [9:32:15<222:52:40,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8343/203307 [9:32:15<222:52:40,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8344/203307 [9:32:19<222:52:42,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8344/203307 [9:32:19<222:52:42,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8345/203307 [9:32:23<222:52:30,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8345/203307 [9:32:23<222:52:30,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8346/203307 [9:32:26<222:52:17,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8346/203307 [9:32:26<222:52:17,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8347/203307 [9:32:31<222:52:20,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8347/203307 [9:32:31<222:52:20,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8348/203307 [9:32:35<222:52:06,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8348/203307 [9:32:35<222:52:07,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8349/203307 [9:32:39<222:52:03,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8349/203307 [9:32:39<222:52:04,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8350/203307 [9:32:43<222:51:52,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8350/203307 [9:32:43<222:51:52,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8351/203307 [9:32:47<222:51:56,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8351/203307 [9:32:47<222:51:56,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8352/203307 [9:32:51<222:51:55,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8352/203307 [9:32:51<222:51:55,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8353/203307 [9:32:55<222:51:42,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8353/203307 [9:32:55<222:51:42,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8354/203307 [9:32:59<222:51:27,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8354/203307 [9:32:59<222:51:27,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8355/203307 [9:33:03<222:51:29,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8355/203307 [9:33:03<222:51:29,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8356/203307 [9:33:07<222:51:15,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8356/203307 [9:33:07<222:51:15,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8357/203307 [9:33:10<222:51:01,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8357/203307 [9:33:10<222:51:01,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8358/203307 [9:33:14<222:50:57,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8358/203307 [9:33:14<222:50:57,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8359/203307 [9:33:19<222:51:01,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8359/203307 [9:33:19<222:51:02,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8360/203307 [9:33:23<222:50:49,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8360/203307 [9:33:23<222:50:50,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8361/203307 [9:33:27<222:50:50,  0.24it/s, v_num=t5e6, training/loss=0.0984]Epoch 0:   4%|▍         | 8361/203307 [9:33:27<222:50:50,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8362/203307 [9:33:31<222:50:37,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8362/203307 [9:33:31<222:50:37,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8363/203307 [9:33:35<222:50:25,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8363/203307 [9:33:35<222:50:25,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8364/203307 [9:33:39<222:50:27,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8364/203307 [9:33:39<222:50:27,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8365/203307 [9:33:43<222:50:13,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8365/203307 [9:33:43<222:50:13,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8366/203307 [9:33:46<222:49:59,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8366/203307 [9:33:46<222:49:59,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8367/203307 [9:33:51<222:50:03,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8367/203307 [9:33:51<222:50:03,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8368/203307 [9:33:54<222:49:49,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8368/203307 [9:33:55<222:49:50,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8369/203307 [9:33:59<222:49:50,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8369/203307 [9:33:59<222:49:50,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8370/203307 [9:34:03<222:49:38,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8370/203307 [9:34:03<222:49:38,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8371/203307 [9:34:06<222:49:26,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8371/203307 [9:34:06<222:49:26,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8372/203307 [9:34:10<222:49:13,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8372/203307 [9:34:10<222:49:13,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8373/203307 [9:34:14<222:49:14,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8373/203307 [9:34:14<222:49:15,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8374/203307 [9:34:18<222:49:01,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8374/203307 [9:34:18<222:49:02,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8375/203307 [9:34:22<222:48:49,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8375/203307 [9:34:22<222:48:50,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8376/203307 [9:34:26<222:48:54,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8376/203307 [9:34:26<222:48:54,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8377/203307 [9:34:31<222:48:53,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8377/203307 [9:34:31<222:48:53,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8378/203307 [9:34:34<222:48:40,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8378/203307 [9:34:34<222:48:40,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8379/203307 [9:34:38<222:48:27,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8379/203307 [9:34:38<222:48:27,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8380/203307 [9:34:42<222:48:13,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8380/203307 [9:34:42<222:48:14,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8381/203307 [9:34:46<222:48:18,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   4%|▍         | 8381/203307 [9:34:46<222:48:18,  0.24it/s, v_num=t5e6, training/loss=0.103] Epoch 0:   4%|▍         | 8382/203307 [9:34:50<222:48:05,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8382/203307 [9:34:50<222:48:05,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8383/203307 [9:34:54<222:47:52,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8383/203307 [9:34:54<222:47:52,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8384/203307 [9:34:58<222:47:56,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8384/203307 [9:34:58<222:47:56,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8385/203307 [9:35:02<222:47:53,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8385/203307 [9:35:02<222:47:53,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8386/203307 [9:35:07<222:47:54,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8386/203307 [9:35:07<222:47:54,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8387/203307 [9:35:11<222:47:41,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8387/203307 [9:35:11<222:47:41,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8388/203307 [9:35:14<222:47:28,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8388/203307 [9:35:14<222:47:28,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8389/203307 [9:35:18<222:47:16,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8389/203307 [9:35:18<222:47:17,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8390/203307 [9:35:23<222:47:22,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8390/203307 [9:35:23<222:47:22,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8391/203307 [9:35:26<222:47:10,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8391/203307 [9:35:26<222:47:10,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8392/203307 [9:35:31<222:47:15,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8392/203307 [9:35:31<222:47:15,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8393/203307 [9:35:35<222:47:02,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8393/203307 [9:35:35<222:47:02,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8394/203307 [9:35:39<222:47:02,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8394/203307 [9:35:39<222:47:02,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8395/203307 [9:35:43<222:46:49,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8395/203307 [9:35:43<222:46:49,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8396/203307 [9:35:46<222:46:36,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8396/203307 [9:35:46<222:46:36,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8397/203307 [9:35:50<222:46:23,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8397/203307 [9:35:50<222:46:23,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8398/203307 [9:35:54<222:46:10,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8398/203307 [9:35:54<222:46:10,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8399/203307 [9:35:58<222:46:15,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8399/203307 [9:35:58<222:46:15,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8400/203307 [9:36:02<222:46:03,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8400/203307 [9:36:02<222:46:03,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8401/203307 [9:36:07<222:46:06,  0.24it/s, v_num=t5e6, training/loss=0.103]Epoch 0:   4%|▍         | 8401/203307 [9:36:07<222:46:06,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8402/203307 [9:36:11<222:46:06,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8402/203307 [9:36:11<222:46:07,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8403/203307 [9:36:15<222:46:05,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8403/203307 [9:36:15<222:46:05,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8404/203307 [9:36:19<222:45:51,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8404/203307 [9:36:19<222:45:52,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8405/203307 [9:36:23<222:45:40,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8405/203307 [9:36:23<222:45:40,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8406/203307 [9:36:26<222:45:28,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8406/203307 [9:36:26<222:45:28,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8407/203307 [9:36:31<222:45:35,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8407/203307 [9:36:31<222:45:35,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8408/203307 [9:36:35<222:45:22,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8408/203307 [9:36:35<222:45:22,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8409/203307 [9:36:39<222:45:25,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8409/203307 [9:36:39<222:45:25,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8410/203307 [9:36:43<222:45:14,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8410/203307 [9:36:43<222:45:14,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8411/203307 [9:36:47<222:45:15,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8411/203307 [9:36:47<222:45:15,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8412/203307 [9:36:51<222:45:11,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8412/203307 [9:36:51<222:45:12,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8413/203307 [9:36:55<222:44:57,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8413/203307 [9:36:55<222:44:57,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8414/203307 [9:36:59<222:44:42,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8414/203307 [9:36:59<222:44:42,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8415/203307 [9:37:02<222:44:30,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8415/203307 [9:37:02<222:44:30,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8416/203307 [9:37:07<222:44:33,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8416/203307 [9:37:07<222:44:33,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8417/203307 [9:37:11<222:44:36,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8417/203307 [9:37:11<222:44:36,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8418/203307 [9:37:15<222:44:23,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8418/203307 [9:37:15<222:44:23,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8419/203307 [9:37:19<222:44:24,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8419/203307 [9:37:19<222:44:24,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8420/203307 [9:37:23<222:44:11,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8420/203307 [9:37:23<222:44:11,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8421/203307 [9:37:27<222:44:10,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   4%|▍         | 8421/203307 [9:37:27<222:44:10,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8422/203307 [9:37:31<222:43:57,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8422/203307 [9:37:31<222:43:57,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8423/203307 [9:37:35<222:43:44,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8423/203307 [9:37:35<222:43:44,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8424/203307 [9:37:39<222:43:31,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8424/203307 [9:37:39<222:43:31,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8425/203307 [9:37:43<222:43:36,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8425/203307 [9:37:43<222:43:36,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8426/203307 [9:37:47<222:43:39,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8426/203307 [9:37:47<222:43:39,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8427/203307 [9:37:52<222:43:39,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8427/203307 [9:37:52<222:43:40,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8428/203307 [9:37:56<222:43:27,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8428/203307 [9:37:56<222:43:28,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8429/203307 [9:37:59<222:43:14,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8429/203307 [9:37:59<222:43:14,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8430/203307 [9:38:03<222:43:11,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8430/203307 [9:38:03<222:43:12,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8431/203307 [9:38:07<222:42:59,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8431/203307 [9:38:07<222:42:59,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8432/203307 [9:38:11<222:42:45,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8432/203307 [9:38:11<222:42:45,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8433/203307 [9:38:15<222:42:47,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8433/203307 [9:38:15<222:42:47,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8434/203307 [9:38:20<222:42:50,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8434/203307 [9:38:20<222:42:50,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8435/203307 [9:38:23<222:42:39,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8435/203307 [9:38:24<222:42:39,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8436/203307 [9:38:28<222:42:39,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8436/203307 [9:38:28<222:42:40,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8437/203307 [9:38:32<222:42:27,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8437/203307 [9:38:32<222:42:27,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8438/203307 [9:38:35<222:42:14,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8438/203307 [9:38:35<222:42:14,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8439/203307 [9:38:39<222:42:11,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8439/203307 [9:38:39<222:42:11,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8440/203307 [9:38:43<222:41:57,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8440/203307 [9:38:43<222:41:57,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8441/203307 [9:38:47<222:41:46,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:   4%|▍         | 8441/203307 [9:38:47<222:41:46,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8442/203307 [9:38:52<222:41:54,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8442/203307 [9:38:52<222:41:54,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8443/203307 [9:38:55<222:41:41,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8443/203307 [9:38:55<222:41:41,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8444/203307 [9:39:00<222:41:41,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8444/203307 [9:39:00<222:41:41,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8445/203307 [9:39:03<222:41:28,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8445/203307 [9:39:03<222:41:29,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8446/203307 [9:39:07<222:41:14,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8446/203307 [9:39:07<222:41:14,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8447/203307 [9:39:11<222:41:02,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8447/203307 [9:39:11<222:41:02,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8448/203307 [9:39:15<222:41:05,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8448/203307 [9:39:15<222:41:05,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8449/203307 [9:39:19<222:40:51,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8449/203307 [9:39:19<222:40:52,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8450/203307 [9:39:23<222:40:40,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8450/203307 [9:39:23<222:40:40,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8451/203307 [9:39:27<222:40:45,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8451/203307 [9:39:27<222:40:45,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8452/203307 [9:39:32<222:40:45,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8452/203307 [9:39:32<222:40:45,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8453/203307 [9:39:35<222:40:31,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8453/203307 [9:39:35<222:40:32,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8454/203307 [9:39:39<222:40:19,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8454/203307 [9:39:39<222:40:19,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8455/203307 [9:39:43<222:40:06,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8455/203307 [9:39:43<222:40:06,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8456/203307 [9:39:47<222:39:54,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8456/203307 [9:39:47<222:39:54,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8457/203307 [9:39:51<222:39:56,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8457/203307 [9:39:51<222:39:56,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8458/203307 [9:39:55<222:39:42,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8458/203307 [9:39:55<222:39:43,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8459/203307 [9:39:59<222:39:45,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8459/203307 [9:39:59<222:39:46,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8460/203307 [9:40:03<222:39:35,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8460/203307 [9:40:03<222:39:36,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8461/203307 [9:40:07<222:39:37,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   4%|▍         | 8461/203307 [9:40:07<222:39:38,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8462/203307 [9:40:11<222:39:25,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8462/203307 [9:40:11<222:39:25,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8463/203307 [9:40:15<222:39:13,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8463/203307 [9:40:15<222:39:13,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8464/203307 [9:40:19<222:39:02,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8464/203307 [9:40:19<222:39:02,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8465/203307 [9:40:23<222:38:56,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8465/203307 [9:40:23<222:38:56,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8466/203307 [9:40:27<222:38:54,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8466/203307 [9:40:27<222:38:54,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8467/203307 [9:40:31<222:38:59,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8467/203307 [9:40:31<222:38:59,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8468/203307 [9:40:36<222:39:02,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8468/203307 [9:40:36<222:39:02,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8469/203307 [9:40:40<222:39:03,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8469/203307 [9:40:40<222:39:03,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8470/203307 [9:40:44<222:38:51,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8470/203307 [9:40:44<222:38:51,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8471/203307 [9:40:48<222:38:40,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8471/203307 [9:40:48<222:38:40,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8472/203307 [9:40:51<222:38:27,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8472/203307 [9:40:51<222:38:27,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8473/203307 [9:40:55<222:38:15,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8473/203307 [9:40:55<222:38:15,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8474/203307 [9:40:59<222:38:03,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8474/203307 [9:40:59<222:38:03,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8475/203307 [9:41:03<222:38:04,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8475/203307 [9:41:03<222:38:04,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8476/203307 [9:41:08<222:38:07,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8476/203307 [9:41:08<222:38:08,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8477/203307 [9:41:12<222:38:11,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8477/203307 [9:41:12<222:38:11,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8478/203307 [9:41:16<222:37:58,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8478/203307 [9:41:16<222:37:58,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8479/203307 [9:41:20<222:37:46,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8479/203307 [9:41:20<222:37:46,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8480/203307 [9:41:23<222:37:35,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8480/203307 [9:41:23<222:37:35,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8481/203307 [9:41:27<222:37:22,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:   4%|▍         | 8481/203307 [9:41:27<222:37:22,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8482/203307 [9:41:31<222:37:09,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8482/203307 [9:41:31<222:37:09,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8483/203307 [9:41:35<222:36:56,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8483/203307 [9:41:35<222:36:56,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8484/203307 [9:41:39<222:36:58,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8484/203307 [9:41:39<222:36:58,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8485/203307 [9:41:44<222:37:04,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8485/203307 [9:41:44<222:37:04,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8486/203307 [9:41:48<222:37:03,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8486/203307 [9:41:48<222:37:03,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8487/203307 [9:41:51<222:36:48,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8487/203307 [9:41:51<222:36:48,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8488/203307 [9:41:55<222:36:33,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8488/203307 [9:41:55<222:36:33,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8489/203307 [9:41:59<222:36:19,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8489/203307 [9:41:59<222:36:19,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8490/203307 [9:42:03<222:36:07,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8490/203307 [9:42:03<222:36:07,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8491/203307 [9:42:06<222:35:54,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8491/203307 [9:42:06<222:35:54,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8492/203307 [9:42:11<222:35:55,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8492/203307 [9:42:11<222:35:55,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8493/203307 [9:42:15<222:35:53,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8493/203307 [9:42:15<222:35:54,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8494/203307 [9:42:19<222:35:57,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8494/203307 [9:42:19<222:35:57,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8495/203307 [9:42:23<222:35:43,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8495/203307 [9:42:23<222:35:44,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8496/203307 [9:42:27<222:35:30,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8496/203307 [9:42:27<222:35:31,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8497/203307 [9:42:31<222:35:19,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8497/203307 [9:42:31<222:35:19,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8498/203307 [9:42:34<222:35:07,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8498/203307 [9:42:34<222:35:07,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8499/203307 [9:42:38<222:34:54,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8499/203307 [9:42:38<222:34:55,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8500/203307 [9:42:42<222:34:44,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8500/203307 [9:42:42<222:34:44,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8501/203307 [9:42:46<222:34:50,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8501/203307 [9:42:46<222:34:50,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8502/203307 [9:42:51<222:34:50,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8502/203307 [9:42:51<222:34:51,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8503/203307 [9:42:55<222:34:53,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8503/203307 [9:42:55<222:34:53,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8504/203307 [9:42:59<222:34:41,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8504/203307 [9:42:59<222:34:41,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8505/203307 [9:43:03<222:34:27,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8505/203307 [9:43:03<222:34:27,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8506/203307 [9:43:06<222:34:14,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8506/203307 [9:43:06<222:34:14,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8507/203307 [9:43:10<222:34:01,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8507/203307 [9:43:10<222:34:02,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8508/203307 [9:43:14<222:33:47,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8508/203307 [9:43:14<222:33:48,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8509/203307 [9:43:18<222:33:53,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8509/203307 [9:43:18<222:33:53,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8510/203307 [9:43:22<222:33:41,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8510/203307 [9:43:22<222:33:41,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8511/203307 [9:43:27<222:33:46,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8511/203307 [9:43:27<222:33:46,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8512/203307 [9:43:30<222:33:34,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8512/203307 [9:43:30<222:33:34,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8513/203307 [9:43:34<222:33:20,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8513/203307 [9:43:34<222:33:20,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8514/203307 [9:43:38<222:33:08,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8514/203307 [9:43:38<222:33:08,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8515/203307 [9:43:42<222:32:55,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8515/203307 [9:43:42<222:32:55,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8516/203307 [9:43:45<222:32:44,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8516/203307 [9:43:45<222:32:44,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8517/203307 [9:43:50<222:32:48,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8517/203307 [9:43:50<222:32:48,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8518/203307 [9:43:54<222:32:35,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8518/203307 [9:43:54<222:32:35,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8519/203307 [9:43:58<222:32:34,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8519/203307 [9:43:58<222:32:35,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8520/203307 [9:44:02<222:32:36,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8520/203307 [9:44:02<222:32:36,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8521/203307 [9:44:06<222:32:23,  0.24it/s, v_num=t5e6, training/loss=0.0975]Epoch 0:   4%|▍         | 8521/203307 [9:44:06<222:32:23,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8522/203307 [9:44:10<222:32:09,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8522/203307 [9:44:10<222:32:09,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8523/203307 [9:44:13<222:31:55,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8523/203307 [9:44:13<222:31:55,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8524/203307 [9:44:17<222:31:42,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8524/203307 [9:44:17<222:31:42,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8525/203307 [9:44:21<222:31:31,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8525/203307 [9:44:21<222:31:32,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8526/203307 [9:44:25<222:31:36,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8526/203307 [9:44:25<222:31:36,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8527/203307 [9:44:30<222:31:35,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8527/203307 [9:44:30<222:31:35,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8528/203307 [9:44:33<222:31:22,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8528/203307 [9:44:33<222:31:23,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8529/203307 [9:44:38<222:31:26,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8529/203307 [9:44:38<222:31:26,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8530/203307 [9:44:41<222:31:14,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8530/203307 [9:44:41<222:31:14,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8531/203307 [9:44:45<222:31:02,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8531/203307 [9:44:45<222:31:03,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8532/203307 [9:44:49<222:30:51,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8532/203307 [9:44:49<222:30:51,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8533/203307 [9:44:53<222:30:40,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8533/203307 [9:44:53<222:30:40,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8534/203307 [9:44:57<222:30:45,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8534/203307 [9:44:57<222:30:45,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8535/203307 [9:45:01<222:30:33,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8535/203307 [9:45:01<222:30:33,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8536/203307 [9:45:06<222:30:35,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8536/203307 [9:45:06<222:30:36,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8537/203307 [9:45:10<222:30:37,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8537/203307 [9:45:10<222:30:37,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8538/203307 [9:45:14<222:30:36,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8538/203307 [9:45:14<222:30:36,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8539/203307 [9:45:18<222:30:25,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8539/203307 [9:45:18<222:30:25,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8540/203307 [9:45:22<222:30:11,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8540/203307 [9:45:22<222:30:11,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8541/203307 [9:45:25<222:30:00,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   4%|▍         | 8541/203307 [9:45:25<222:30:00,  0.24it/s, v_num=t5e6, training/loss=0.090] Epoch 0:   4%|▍         | 8542/203307 [9:45:30<222:30:06,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8542/203307 [9:45:30<222:30:06,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8543/203307 [9:45:34<222:29:53,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8543/203307 [9:45:34<222:29:53,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8544/203307 [9:45:38<222:29:54,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8544/203307 [9:45:38<222:29:54,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8545/203307 [9:45:42<222:29:43,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8545/203307 [9:45:42<222:29:43,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8546/203307 [9:45:46<222:29:46,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8546/203307 [9:45:46<222:29:46,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8547/203307 [9:45:50<222:29:42,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8547/203307 [9:45:50<222:29:42,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8548/203307 [9:45:54<222:29:29,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8548/203307 [9:45:54<222:29:30,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8549/203307 [9:45:58<222:29:18,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8549/203307 [9:45:58<222:29:18,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8550/203307 [9:46:02<222:29:06,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8550/203307 [9:46:02<222:29:07,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8551/203307 [9:46:06<222:29:11,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8551/203307 [9:46:06<222:29:12,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8552/203307 [9:46:11<222:29:12,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8552/203307 [9:46:11<222:29:12,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8553/203307 [9:46:14<222:29:00,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8553/203307 [9:46:14<222:29:00,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8554/203307 [9:46:18<222:28:47,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8554/203307 [9:46:18<222:28:48,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8555/203307 [9:46:23<222:28:51,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8555/203307 [9:46:23<222:28:51,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8556/203307 [9:46:27<222:28:48,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8556/203307 [9:46:27<222:28:48,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8557/203307 [9:46:30<222:28:35,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8557/203307 [9:46:30<222:28:35,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8558/203307 [9:46:34<222:28:21,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8558/203307 [9:46:34<222:28:21,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8559/203307 [9:46:38<222:28:23,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8559/203307 [9:46:39<222:28:23,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8560/203307 [9:46:42<222:28:11,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8560/203307 [9:46:42<222:28:11,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8561/203307 [9:46:47<222:28:13,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   4%|▍         | 8561/203307 [9:46:47<222:28:14,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8562/203307 [9:46:50<222:27:59,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8562/203307 [9:46:50<222:27:59,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8563/203307 [9:46:55<222:28:01,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8563/203307 [9:46:55<222:28:01,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8564/203307 [9:46:58<222:27:48,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8564/203307 [9:46:58<222:27:48,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8565/203307 [9:47:03<222:27:44,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8565/203307 [9:47:03<222:27:44,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8566/203307 [9:47:06<222:27:31,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8566/203307 [9:47:06<222:27:31,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8567/203307 [9:47:11<222:27:34,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8567/203307 [9:47:11<222:27:35,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8568/203307 [9:47:14<222:27:20,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8568/203307 [9:47:14<222:27:21,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8569/203307 [9:47:19<222:27:22,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8569/203307 [9:47:19<222:27:22,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8570/203307 [9:47:22<222:27:08,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8570/203307 [9:47:22<222:27:09,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8571/203307 [9:47:26<222:26:55,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8571/203307 [9:47:26<222:26:55,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8572/203307 [9:47:31<222:26:59,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8572/203307 [9:47:31<222:26:59,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8573/203307 [9:47:34<222:26:45,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8573/203307 [9:47:34<222:26:45,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8574/203307 [9:47:38<222:26:42,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8574/203307 [9:47:38<222:26:42,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8575/203307 [9:47:42<222:26:28,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8575/203307 [9:47:42<222:26:28,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8576/203307 [9:47:47<222:26:30,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8576/203307 [9:47:47<222:26:30,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8577/203307 [9:47:51<222:26:29,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8577/203307 [9:47:51<222:26:29,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8578/203307 [9:47:54<222:26:15,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8578/203307 [9:47:54<222:26:15,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8579/203307 [9:47:58<222:26:01,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8579/203307 [9:47:58<222:26:01,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8580/203307 [9:48:02<222:25:49,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8580/203307 [9:48:02<222:25:49,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8581/203307 [9:48:06<222:25:51,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   4%|▍         | 8581/203307 [9:48:06<222:25:51,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8582/203307 [9:48:10<222:25:38,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8582/203307 [9:48:10<222:25:38,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8583/203307 [9:48:14<222:25:38,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8583/203307 [9:48:14<222:25:38,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8584/203307 [9:48:19<222:25:41,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8584/203307 [9:48:19<222:25:41,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8585/203307 [9:48:23<222:25:31,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8585/203307 [9:48:23<222:25:31,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8586/203307 [9:48:27<222:25:33,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8586/203307 [9:48:27<222:25:33,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8587/203307 [9:48:31<222:25:21,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8587/203307 [9:48:31<222:25:21,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8588/203307 [9:48:34<222:25:09,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8588/203307 [9:48:34<222:25:09,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8589/203307 [9:48:39<222:25:13,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8589/203307 [9:48:39<222:25:13,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8590/203307 [9:48:43<222:24:59,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8590/203307 [9:48:43<222:25:00,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8591/203307 [9:48:46<222:24:45,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8591/203307 [9:48:46<222:24:45,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8592/203307 [9:48:51<222:24:51,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8592/203307 [9:48:51<222:24:51,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8593/203307 [9:48:55<222:24:39,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8593/203307 [9:48:55<222:24:39,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8594/203307 [9:48:59<222:24:40,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8594/203307 [9:48:59<222:24:40,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8595/203307 [9:49:03<222:24:28,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8595/203307 [9:49:03<222:24:28,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8596/203307 [9:49:06<222:24:15,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8596/203307 [9:49:06<222:24:15,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8597/203307 [9:49:10<222:24:01,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8597/203307 [9:49:10<222:24:02,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8598/203307 [9:49:15<222:24:07,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8598/203307 [9:49:15<222:24:07,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8599/203307 [9:49:18<222:23:56,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8599/203307 [9:49:18<222:23:56,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8600/203307 [9:49:22<222:23:46,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8600/203307 [9:49:22<222:23:46,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8601/203307 [9:49:27<222:23:50,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8601/203307 [9:49:27<222:23:50,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8602/203307 [9:49:31<222:23:51,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8602/203307 [9:49:31<222:23:51,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8603/203307 [9:49:35<222:23:38,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8603/203307 [9:49:35<222:23:39,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8604/203307 [9:49:39<222:23:27,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8604/203307 [9:49:39<222:23:28,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8605/203307 [9:49:42<222:23:14,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8605/203307 [9:49:42<222:23:14,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8606/203307 [9:49:46<222:23:03,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8606/203307 [9:49:46<222:23:03,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8607/203307 [9:49:51<222:23:08,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8607/203307 [9:49:51<222:23:08,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8608/203307 [9:49:54<222:22:55,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8608/203307 [9:49:54<222:22:55,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8609/203307 [9:49:59<222:22:58,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8609/203307 [9:49:59<222:22:59,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8610/203307 [9:50:03<222:22:56,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8610/203307 [9:50:03<222:22:56,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8611/203307 [9:50:07<222:22:58,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8611/203307 [9:50:07<222:22:58,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8612/203307 [9:50:11<222:22:44,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8612/203307 [9:50:11<222:22:45,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8613/203307 [9:50:15<222:22:33,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8613/203307 [9:50:15<222:22:33,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8614/203307 [9:50:19<222:22:22,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8614/203307 [9:50:19<222:22:22,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8615/203307 [9:50:23<222:22:26,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8615/203307 [9:50:23<222:22:26,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8616/203307 [9:50:27<222:22:14,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8616/203307 [9:50:27<222:22:15,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8617/203307 [9:50:31<222:22:19,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8617/203307 [9:50:31<222:22:19,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8618/203307 [9:50:35<222:22:08,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8618/203307 [9:50:35<222:22:08,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8619/203307 [9:50:40<222:22:10,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8619/203307 [9:50:40<222:22:10,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8620/203307 [9:50:43<222:21:58,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8620/203307 [9:50:43<222:21:58,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8621/203307 [9:50:47<222:21:45,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8621/203307 [9:50:47<222:21:45,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8622/203307 [9:50:51<222:21:32,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8622/203307 [9:50:51<222:21:33,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8623/203307 [9:50:55<222:21:20,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8623/203307 [9:50:55<222:21:20,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8624/203307 [9:50:59<222:21:25,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8624/203307 [9:50:59<222:21:25,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8625/203307 [9:51:03<222:21:13,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8625/203307 [9:51:03<222:21:13,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8626/203307 [9:51:07<222:21:17,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8626/203307 [9:51:07<222:21:17,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8627/203307 [9:51:12<222:21:17,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8627/203307 [9:51:12<222:21:17,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8628/203307 [9:51:16<222:21:14,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8628/203307 [9:51:16<222:21:14,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8629/203307 [9:51:20<222:21:00,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8629/203307 [9:51:20<222:21:01,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8630/203307 [9:51:23<222:20:48,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8630/203307 [9:51:23<222:20:48,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8631/203307 [9:51:27<222:20:36,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8631/203307 [9:51:27<222:20:36,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8632/203307 [9:51:31<222:20:24,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8632/203307 [9:51:31<222:20:24,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8633/203307 [9:51:35<222:20:29,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8633/203307 [9:51:35<222:20:29,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8634/203307 [9:51:40<222:20:30,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8634/203307 [9:51:40<222:20:30,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8635/203307 [9:51:43<222:20:18,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8635/203307 [9:51:43<222:20:18,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8636/203307 [9:51:48<222:20:18,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8636/203307 [9:51:48<222:20:18,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8637/203307 [9:51:52<222:20:15,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8637/203307 [9:51:52<222:20:16,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8638/203307 [9:51:56<222:20:01,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8638/203307 [9:51:56<222:20:02,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8639/203307 [9:51:59<222:19:48,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8639/203307 [9:51:59<222:19:48,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8640/203307 [9:52:03<222:19:34,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8640/203307 [9:52:03<222:19:34,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8641/203307 [9:52:07<222:19:37,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   4%|▍         | 8641/203307 [9:52:07<222:19:37,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8642/203307 [9:52:12<222:19:39,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8642/203307 [9:52:12<222:19:39,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8643/203307 [9:52:15<222:19:27,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8643/203307 [9:52:16<222:19:28,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8644/203307 [9:52:20<222:19:30,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8644/203307 [9:52:20<222:19:30,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8645/203307 [9:52:24<222:19:18,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8645/203307 [9:52:24<222:19:18,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8646/203307 [9:52:28<222:19:15,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8646/203307 [9:52:28<222:19:15,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8647/203307 [9:52:32<222:19:02,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8647/203307 [9:52:32<222:19:02,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8648/203307 [9:52:35<222:18:49,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8648/203307 [9:52:35<222:18:49,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8649/203307 [9:52:39<222:18:36,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8649/203307 [9:52:39<222:18:36,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8650/203307 [9:52:44<222:18:42,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8650/203307 [9:52:44<222:18:42,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8651/203307 [9:52:48<222:18:44,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8651/203307 [9:52:48<222:18:45,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8652/203307 [9:52:52<222:18:44,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8652/203307 [9:52:52<222:18:44,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8653/203307 [9:52:56<222:18:31,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8653/203307 [9:52:56<222:18:31,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8654/203307 [9:53:00<222:18:17,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8654/203307 [9:53:00<222:18:17,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8655/203307 [9:53:04<222:18:16,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8655/203307 [9:53:04<222:18:16,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8656/203307 [9:53:08<222:18:05,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8656/203307 [9:53:08<222:18:05,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8657/203307 [9:53:11<222:17:53,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8657/203307 [9:53:11<222:17:53,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8658/203307 [9:53:15<222:17:40,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8658/203307 [9:53:15<222:17:40,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8659/203307 [9:53:20<222:17:48,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8659/203307 [9:53:20<222:17:49,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8660/203307 [9:53:24<222:17:35,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8660/203307 [9:53:24<222:17:36,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8661/203307 [9:53:28<222:17:36,  0.24it/s, v_num=t5e6, training/loss=0.0782]Epoch 0:   4%|▍         | 8661/203307 [9:53:28<222:17:36,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8662/203307 [9:53:31<222:17:21,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8662/203307 [9:53:31<222:17:21,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8663/203307 [9:53:35<222:17:10,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8663/203307 [9:53:35<222:17:10,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8664/203307 [9:53:39<222:17:08,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8664/203307 [9:53:40<222:17:09,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8665/203307 [9:53:43<222:16:55,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8665/203307 [9:53:43<222:16:55,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8666/203307 [9:53:47<222:16:40,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8666/203307 [9:53:47<222:16:41,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8667/203307 [9:53:51<222:16:45,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8667/203307 [9:53:51<222:16:46,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8668/203307 [9:53:55<222:16:32,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8668/203307 [9:53:55<222:16:32,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8669/203307 [9:53:59<222:16:32,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8669/203307 [9:53:59<222:16:32,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8670/203307 [9:54:03<222:16:18,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8670/203307 [9:54:03<222:16:18,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8671/203307 [9:54:07<222:16:04,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8671/203307 [9:54:07<222:16:04,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8672/203307 [9:54:10<222:15:52,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8672/203307 [9:54:10<222:15:52,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8673/203307 [9:54:15<222:15:49,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8673/203307 [9:54:15<222:15:50,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8674/203307 [9:54:18<222:15:37,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8674/203307 [9:54:18<222:15:37,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8675/203307 [9:54:22<222:15:25,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8675/203307 [9:54:22<222:15:25,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8676/203307 [9:54:27<222:15:28,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8676/203307 [9:54:27<222:15:28,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8677/203307 [9:54:31<222:15:30,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8677/203307 [9:54:31<222:15:30,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8678/203307 [9:54:35<222:15:17,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8678/203307 [9:54:35<222:15:17,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8679/203307 [9:54:38<222:15:05,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8679/203307 [9:54:38<222:15:05,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8680/203307 [9:54:42<222:14:52,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8680/203307 [9:54:42<222:14:52,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8681/203307 [9:54:46<222:14:39,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 8681/203307 [9:54:46<222:14:39,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8682/203307 [9:54:50<222:14:38,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8682/203307 [9:54:50<222:14:38,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8683/203307 [9:54:54<222:14:25,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8683/203307 [9:54:54<222:14:25,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8684/203307 [9:54:58<222:14:26,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8684/203307 [9:54:58<222:14:26,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8685/203307 [9:55:03<222:14:29,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8685/203307 [9:55:03<222:14:29,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8686/203307 [9:55:07<222:14:28,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8686/203307 [9:55:07<222:14:28,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8687/203307 [9:55:10<222:14:14,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8687/203307 [9:55:10<222:14:14,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8688/203307 [9:55:14<222:14:01,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8688/203307 [9:55:14<222:14:01,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8689/203307 [9:55:18<222:13:48,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8689/203307 [9:55:18<222:13:48,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8690/203307 [9:55:22<222:13:36,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8690/203307 [9:55:22<222:13:37,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8691/203307 [9:55:26<222:13:35,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8691/203307 [9:55:26<222:13:35,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8692/203307 [9:55:30<222:13:40,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8692/203307 [9:55:30<222:13:40,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8693/203307 [9:55:35<222:13:41,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8693/203307 [9:55:35<222:13:41,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8694/203307 [9:55:39<222:13:39,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8694/203307 [9:55:39<222:13:40,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8695/203307 [9:55:43<222:13:26,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8695/203307 [9:55:43<222:13:26,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8696/203307 [9:55:46<222:13:12,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8696/203307 [9:55:46<222:13:12,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8697/203307 [9:55:50<222:12:59,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8697/203307 [9:55:50<222:13:00,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8698/203307 [9:55:54<222:12:47,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8698/203307 [9:55:54<222:12:47,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8699/203307 [9:55:58<222:12:34,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8699/203307 [9:55:58<222:12:34,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8700/203307 [9:56:02<222:12:33,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8700/203307 [9:56:02<222:12:33,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8701/203307 [9:56:06<222:12:36,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   4%|▍         | 8701/203307 [9:56:06<222:12:36,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8702/203307 [9:56:11<222:12:36,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8702/203307 [9:56:11<222:12:37,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8703/203307 [9:56:14<222:12:23,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8703/203307 [9:56:14<222:12:23,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8704/203307 [9:56:18<222:12:10,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8704/203307 [9:56:18<222:12:10,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8705/203307 [9:56:22<222:11:57,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8705/203307 [9:56:22<222:11:57,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8706/203307 [9:56:25<222:11:45,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8706/203307 [9:56:25<222:11:45,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8707/203307 [9:56:29<222:11:32,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8707/203307 [9:56:29<222:11:32,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8708/203307 [9:56:33<222:11:20,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8708/203307 [9:56:33<222:11:20,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8709/203307 [9:56:37<222:11:23,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8709/203307 [9:56:37<222:11:23,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8710/203307 [9:56:41<222:11:11,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8710/203307 [9:56:41<222:11:11,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8711/203307 [9:56:46<222:11:15,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8711/203307 [9:56:46<222:11:15,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8712/203307 [9:56:49<222:11:03,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8712/203307 [9:56:49<222:11:03,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8713/203307 [9:56:53<222:10:49,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8713/203307 [9:56:53<222:10:49,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8714/203307 [9:56:57<222:10:36,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8714/203307 [9:56:57<222:10:36,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8715/203307 [9:57:00<222:10:22,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8715/203307 [9:57:00<222:10:22,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8716/203307 [9:57:04<222:10:09,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8716/203307 [9:57:04<222:10:09,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8717/203307 [9:57:09<222:10:15,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8717/203307 [9:57:09<222:10:15,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8718/203307 [9:57:13<222:10:10,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8718/203307 [9:57:13<222:10:10,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8719/203307 [9:57:17<222:10:11,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8719/203307 [9:57:17<222:10:11,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8720/203307 [9:57:21<222:09:57,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8720/203307 [9:57:21<222:09:57,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8721/203307 [9:57:24<222:09:44,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   4%|▍         | 8721/203307 [9:57:24<222:09:44,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8722/203307 [9:57:28<222:09:31,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8722/203307 [9:57:28<222:09:31,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8723/203307 [9:57:32<222:09:27,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8723/203307 [9:57:32<222:09:27,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8724/203307 [9:57:36<222:09:18,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8724/203307 [9:57:36<222:09:18,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8725/203307 [9:57:40<222:09:05,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8725/203307 [9:57:40<222:09:05,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8726/203307 [9:57:44<222:09:08,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8726/203307 [9:57:44<222:09:09,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8727/203307 [9:57:49<222:09:08,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8727/203307 [9:57:49<222:09:08,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8728/203307 [9:57:53<222:09:09,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8728/203307 [9:57:53<222:09:09,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8729/203307 [9:57:57<222:08:55,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8729/203307 [9:57:57<222:08:55,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8730/203307 [9:58:00<222:08:41,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8730/203307 [9:58:00<222:08:41,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8731/203307 [9:58:04<222:08:29,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8731/203307 [9:58:04<222:08:29,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8732/203307 [9:58:08<222:08:17,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8732/203307 [9:58:08<222:08:17,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8733/203307 [9:58:11<222:08:03,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8733/203307 [9:58:11<222:08:04,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8734/203307 [9:58:16<222:08:11,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8734/203307 [9:58:16<222:08:11,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8735/203307 [9:58:20<222:07:59,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8735/203307 [9:58:20<222:07:59,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8736/203307 [9:58:24<222:08:00,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8736/203307 [9:58:24<222:08:00,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8737/203307 [9:58:29<222:08:03,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8737/203307 [9:58:29<222:08:04,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8738/203307 [9:58:32<222:07:50,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8738/203307 [9:58:32<222:07:50,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8739/203307 [9:58:36<222:07:37,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8739/203307 [9:58:36<222:07:38,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8740/203307 [9:58:40<222:07:25,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8740/203307 [9:58:40<222:07:26,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8741/203307 [9:58:44<222:07:13,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   4%|▍         | 8741/203307 [9:58:44<222:07:13,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8742/203307 [9:58:48<222:07:18,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8742/203307 [9:58:48<222:07:18,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8743/203307 [9:58:52<222:07:06,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8743/203307 [9:58:52<222:07:06,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8744/203307 [9:58:56<222:07:05,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8744/203307 [9:58:56<222:07:05,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8745/203307 [9:59:01<222:07:08,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8745/203307 [9:59:01<222:07:09,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8746/203307 [9:59:04<222:06:55,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8746/203307 [9:59:04<222:06:55,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8747/203307 [9:59:08<222:06:41,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8747/203307 [9:59:08<222:06:41,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8748/203307 [9:59:12<222:06:28,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8748/203307 [9:59:12<222:06:29,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8749/203307 [9:59:15<222:06:15,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8749/203307 [9:59:15<222:06:16,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8750/203307 [9:59:19<222:06:04,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8750/203307 [9:59:19<222:06:04,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8751/203307 [9:59:24<222:06:07,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8751/203307 [9:59:24<222:06:07,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8752/203307 [9:59:28<222:06:07,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8752/203307 [9:59:28<222:06:08,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8753/203307 [9:59:32<222:05:55,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8753/203307 [9:59:32<222:05:56,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8754/203307 [9:59:36<222:05:57,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8754/203307 [9:59:36<222:05:58,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8755/203307 [9:59:40<222:05:44,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8755/203307 [9:59:40<222:05:44,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8756/203307 [9:59:43<222:05:30,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8756/203307 [9:59:43<222:05:30,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8757/203307 [9:59:47<222:05:17,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8757/203307 [9:59:47<222:05:17,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8758/203307 [9:59:51<222:05:02,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8758/203307 [9:59:51<222:05:02,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8759/203307 [9:59:55<222:05:06,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8759/203307 [9:59:55<222:05:06,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8760/203307 [9:59:59<222:04:53,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8760/203307 [9:59:59<222:04:53,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8761/203307 [10:00:03<222:04:54,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   4%|▍         | 8761/203307 [10:00:03<222:04:54,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8762/203307 [10:00:07<222:04:40,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8762/203307 [10:00:07<222:04:41,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8763/203307 [10:00:11<222:04:42,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8763/203307 [10:00:11<222:04:43,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8764/203307 [10:00:15<222:04:28,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8764/203307 [10:00:15<222:04:28,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8765/203307 [10:00:19<222:04:15,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8765/203307 [10:00:19<222:04:15,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8766/203307 [10:00:22<222:04:02,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8766/203307 [10:00:22<222:04:02,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8767/203307 [10:00:27<222:04:07,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8767/203307 [10:00:27<222:04:07,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8768/203307 [10:00:31<222:03:54,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8768/203307 [10:00:31<222:03:54,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8769/203307 [10:00:35<222:03:54,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8769/203307 [10:00:35<222:03:54,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8770/203307 [10:00:39<222:03:41,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8770/203307 [10:00:39<222:03:41,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8771/203307 [10:00:43<222:03:44,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8771/203307 [10:00:43<222:03:44,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8772/203307 [10:00:47<222:03:42,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8772/203307 [10:00:47<222:03:42,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8773/203307 [10:00:51<222:03:30,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8773/203307 [10:00:51<222:03:30,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8774/203307 [10:00:55<222:03:15,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8774/203307 [10:00:55<222:03:15,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8775/203307 [10:00:58<222:03:03,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8775/203307 [10:00:58<222:03:03,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8776/203307 [10:01:03<222:03:08,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8776/203307 [10:01:03<222:03:08,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8777/203307 [10:01:07<222:03:07,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8777/203307 [10:01:07<222:03:07,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8778/203307 [10:01:11<222:02:52,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8778/203307 [10:01:11<222:02:53,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8779/203307 [10:01:14<222:02:39,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8779/203307 [10:01:14<222:02:39,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8780/203307 [10:01:19<222:02:45,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8780/203307 [10:01:19<222:02:45,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8781/203307 [10:01:23<222:02:44,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   4%|▍         | 8781/203307 [10:01:23<222:02:45,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8782/203307 [10:01:27<222:02:32,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8782/203307 [10:01:27<222:02:32,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8783/203307 [10:01:31<222:02:19,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8783/203307 [10:01:31<222:02:19,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8784/203307 [10:01:35<222:02:21,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8784/203307 [10:01:35<222:02:21,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8785/203307 [10:01:39<222:02:10,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8785/203307 [10:01:39<222:02:10,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8786/203307 [10:01:43<222:02:10,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8786/203307 [10:01:43<222:02:10,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8787/203307 [10:01:47<222:01:56,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8787/203307 [10:01:47<222:01:56,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8788/203307 [10:01:50<222:01:43,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8788/203307 [10:01:51<222:01:43,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8789/203307 [10:01:55<222:01:46,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8789/203307 [10:01:55<222:01:46,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8790/203307 [10:01:59<222:01:46,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8790/203307 [10:01:59<222:01:46,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8791/203307 [10:02:03<222:01:34,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8791/203307 [10:02:03<222:01:34,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8792/203307 [10:02:07<222:01:38,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8792/203307 [10:02:07<222:01:38,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8793/203307 [10:02:11<222:01:26,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8793/203307 [10:02:11<222:01:26,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8794/203307 [10:02:16<222:01:26,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8794/203307 [10:02:16<222:01:26,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8795/203307 [10:02:19<222:01:14,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8795/203307 [10:02:19<222:01:14,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8796/203307 [10:02:23<222:00:59,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8796/203307 [10:02:23<222:01:00,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8797/203307 [10:02:27<222:01:02,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8797/203307 [10:02:27<222:01:03,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8798/203307 [10:02:31<222:00:49,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8798/203307 [10:02:31<222:00:49,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8799/203307 [10:02:35<222:00:46,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8799/203307 [10:02:35<222:00:46,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8800/203307 [10:02:39<222:00:32,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8800/203307 [10:02:39<222:00:32,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8801/203307 [10:02:43<222:00:35,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   4%|▍         | 8801/203307 [10:02:43<222:00:35,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8802/203307 [10:02:48<222:00:34,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8802/203307 [10:02:48<222:00:35,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8803/203307 [10:02:51<222:00:20,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8803/203307 [10:02:51<222:00:20,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8804/203307 [10:02:55<222:00:06,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8804/203307 [10:02:55<222:00:06,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8805/203307 [10:02:59<221:59:54,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8805/203307 [10:02:59<221:59:54,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8806/203307 [10:03:03<221:59:57,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8806/203307 [10:03:03<221:59:57,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8807/203307 [10:03:07<221:59:43,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8807/203307 [10:03:07<221:59:43,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8808/203307 [10:03:11<221:59:44,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8808/203307 [10:03:11<221:59:44,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8809/203307 [10:03:16<221:59:49,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8809/203307 [10:03:16<221:59:49,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8810/203307 [10:03:19<221:59:37,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8810/203307 [10:03:19<221:59:37,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8811/203307 [10:03:24<221:59:40,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8811/203307 [10:03:24<221:59:40,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8812/203307 [10:03:27<221:59:26,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8812/203307 [10:03:27<221:59:26,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8813/203307 [10:03:31<221:59:11,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8813/203307 [10:03:31<221:59:12,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8814/203307 [10:03:35<221:59:00,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8814/203307 [10:03:35<221:59:00,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8815/203307 [10:03:39<221:59:04,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8815/203307 [10:03:39<221:59:04,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8816/203307 [10:03:43<221:58:50,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8816/203307 [10:03:43<221:58:51,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8817/203307 [10:03:47<221:58:54,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8817/203307 [10:03:47<221:58:54,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8818/203307 [10:03:51<221:58:41,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8818/203307 [10:03:51<221:58:41,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8819/203307 [10:03:55<221:58:41,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8819/203307 [10:03:55<221:58:42,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8820/203307 [10:03:59<221:58:27,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8820/203307 [10:03:59<221:58:28,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8821/203307 [10:04:03<221:58:14,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   4%|▍         | 8821/203307 [10:04:03<221:58:15,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8822/203307 [10:04:06<221:58:01,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8822/203307 [10:04:07<221:58:01,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8823/203307 [10:04:11<221:58:04,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8823/203307 [10:04:11<221:58:04,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8824/203307 [10:04:15<221:57:50,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8824/203307 [10:04:15<221:57:51,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8825/203307 [10:04:18<221:57:37,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8825/203307 [10:04:18<221:57:37,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8826/203307 [10:04:23<221:57:43,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8826/203307 [10:04:23<221:57:43,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8827/203307 [10:04:27<221:57:44,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8827/203307 [10:04:27<221:57:44,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8828/203307 [10:04:31<221:57:32,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8828/203307 [10:04:31<221:57:32,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8829/203307 [10:04:35<221:57:20,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8829/203307 [10:04:35<221:57:20,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8830/203307 [10:04:38<221:57:08,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8830/203307 [10:04:38<221:57:08,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8831/203307 [10:04:42<221:56:57,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8831/203307 [10:04:42<221:56:57,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8832/203307 [10:04:47<221:57:02,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8832/203307 [10:04:47<221:57:02,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8833/203307 [10:04:51<221:56:52,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8833/203307 [10:04:51<221:56:52,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8834/203307 [10:04:55<221:56:54,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8834/203307 [10:04:55<221:56:54,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8835/203307 [10:04:59<221:56:55,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8835/203307 [10:04:59<221:56:55,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8836/203307 [10:05:04<221:56:57,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8836/203307 [10:05:04<221:56:57,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8837/203307 [10:05:07<221:56:45,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8837/203307 [10:05:07<221:56:45,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8838/203307 [10:05:11<221:56:34,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8838/203307 [10:05:11<221:56:34,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8839/203307 [10:05:15<221:56:21,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8839/203307 [10:05:15<221:56:21,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8840/203307 [10:05:19<221:56:09,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8840/203307 [10:05:19<221:56:09,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8841/203307 [10:05:23<221:56:13,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   4%|▍         | 8841/203307 [10:05:23<221:56:13,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8842/203307 [10:05:28<221:56:16,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8842/203307 [10:05:28<221:56:17,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8843/203307 [10:05:31<221:56:05,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8843/203307 [10:05:31<221:56:05,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8844/203307 [10:05:36<221:56:06,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8844/203307 [10:05:36<221:56:06,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8845/203307 [10:05:39<221:55:53,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8845/203307 [10:05:39<221:55:53,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8846/203307 [10:05:43<221:55:41,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8846/203307 [10:05:43<221:55:42,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8847/203307 [10:05:47<221:55:30,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8847/203307 [10:05:47<221:55:31,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8848/203307 [10:05:51<221:55:16,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8848/203307 [10:05:51<221:55:16,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8849/203307 [10:05:55<221:55:18,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8849/203307 [10:05:55<221:55:18,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8850/203307 [10:05:59<221:55:08,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8850/203307 [10:05:59<221:55:08,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8851/203307 [10:06:03<221:55:11,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8851/203307 [10:06:03<221:55:12,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8852/203307 [10:06:08<221:55:10,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8852/203307 [10:06:08<221:55:10,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8853/203307 [10:06:12<221:55:08,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8853/203307 [10:06:12<221:55:09,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8854/203307 [10:06:15<221:54:55,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8854/203307 [10:06:15<221:54:55,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8855/203307 [10:06:19<221:54:42,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8855/203307 [10:06:19<221:54:42,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8856/203307 [10:06:23<221:54:30,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8856/203307 [10:06:23<221:54:31,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8857/203307 [10:06:27<221:54:22,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8857/203307 [10:06:27<221:54:22,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8858/203307 [10:06:31<221:54:26,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8858/203307 [10:06:31<221:54:27,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8859/203307 [10:06:36<221:54:29,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8859/203307 [10:06:36<221:54:29,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8860/203307 [10:06:40<221:54:18,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8860/203307 [10:06:40<221:54:18,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8861/203307 [10:06:44<221:54:20,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 8861/203307 [10:06:44<221:54:20,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8862/203307 [10:06:48<221:54:15,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8862/203307 [10:06:48<221:54:16,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8863/203307 [10:06:52<221:54:06,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8863/203307 [10:06:52<221:54:06,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8864/203307 [10:06:56<221:53:53,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8864/203307 [10:06:56<221:53:53,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8865/203307 [10:06:59<221:53:41,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8865/203307 [10:06:59<221:53:41,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8866/203307 [10:07:03<221:53:27,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8866/203307 [10:07:03<221:53:27,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8867/203307 [10:07:08<221:53:35,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8867/203307 [10:07:08<221:53:35,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8868/203307 [10:07:11<221:53:23,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8868/203307 [10:07:11<221:53:23,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8869/203307 [10:07:16<221:53:23,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8869/203307 [10:07:16<221:53:23,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8870/203307 [10:07:19<221:53:11,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8870/203307 [10:07:19<221:53:11,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8871/203307 [10:07:24<221:53:08,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8871/203307 [10:07:24<221:53:08,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8872/203307 [10:07:27<221:52:55,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8872/203307 [10:07:27<221:52:55,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8873/203307 [10:07:31<221:52:43,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8873/203307 [10:07:31<221:52:43,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8874/203307 [10:07:35<221:52:29,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8874/203307 [10:07:35<221:52:29,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8875/203307 [10:07:39<221:52:33,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8875/203307 [10:07:39<221:52:33,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8876/203307 [10:07:44<221:52:36,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8876/203307 [10:07:44<221:52:36,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8877/203307 [10:07:48<221:52:36,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8877/203307 [10:07:48<221:52:36,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8878/203307 [10:07:52<221:52:22,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8878/203307 [10:07:52<221:52:22,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8879/203307 [10:07:55<221:52:09,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8879/203307 [10:07:55<221:52:09,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8880/203307 [10:08:00<221:52:07,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8880/203307 [10:08:00<221:52:08,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8881/203307 [10:08:03<221:51:55,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   4%|▍         | 8881/203307 [10:08:03<221:51:55,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8882/203307 [10:08:07<221:51:41,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8882/203307 [10:08:07<221:51:42,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8883/203307 [10:08:11<221:51:28,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8883/203307 [10:08:11<221:51:28,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8884/203307 [10:08:15<221:51:33,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8884/203307 [10:08:15<221:51:34,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8885/203307 [10:08:19<221:51:21,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8885/203307 [10:08:19<221:51:22,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8886/203307 [10:08:23<221:51:23,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8886/203307 [10:08:23<221:51:23,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8887/203307 [10:08:27<221:51:10,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8887/203307 [10:08:27<221:51:10,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8888/203307 [10:08:31<221:50:56,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8888/203307 [10:08:31<221:50:56,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8889/203307 [10:08:35<221:50:53,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8889/203307 [10:08:35<221:50:53,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8890/203307 [10:08:38<221:50:39,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8890/203307 [10:08:38<221:50:39,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8891/203307 [10:08:42<221:50:26,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8891/203307 [10:08:42<221:50:26,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8892/203307 [10:08:47<221:50:30,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8892/203307 [10:08:47<221:50:30,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8893/203307 [10:08:51<221:50:32,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8893/203307 [10:08:51<221:50:32,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8894/203307 [10:08:55<221:50:30,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8894/203307 [10:08:55<221:50:30,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8895/203307 [10:08:59<221:50:15,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8895/203307 [10:08:59<221:50:15,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8896/203307 [10:09:03<221:50:02,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8896/203307 [10:09:03<221:50:02,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8897/203307 [10:09:06<221:49:49,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8897/203307 [10:09:06<221:49:49,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8898/203307 [10:09:10<221:49:46,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8898/203307 [10:09:10<221:49:46,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8899/203307 [10:09:14<221:49:32,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8899/203307 [10:09:14<221:49:32,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8900/203307 [10:09:18<221:49:19,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8900/203307 [10:09:18<221:49:19,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8901/203307 [10:09:22<221:49:24,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   4%|▍         | 8901/203307 [10:09:22<221:49:24,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8902/203307 [10:09:27<221:49:25,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8902/203307 [10:09:27<221:49:26,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8903/203307 [10:09:30<221:49:13,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8903/203307 [10:09:30<221:49:14,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8904/203307 [10:09:34<221:49:01,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8904/203307 [10:09:34<221:49:02,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8905/203307 [10:09:38<221:48:50,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8905/203307 [10:09:38<221:48:50,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8906/203307 [10:09:42<221:48:36,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8906/203307 [10:09:42<221:48:36,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8907/203307 [10:09:46<221:48:34,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8907/203307 [10:09:46<221:48:34,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8908/203307 [10:09:49<221:48:21,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8908/203307 [10:09:49<221:48:22,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8909/203307 [10:09:54<221:48:23,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8909/203307 [10:09:54<221:48:23,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8910/203307 [10:09:58<221:48:24,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8910/203307 [10:09:58<221:48:24,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8911/203307 [10:10:03<221:48:25,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8911/203307 [10:10:03<221:48:25,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8912/203307 [10:10:06<221:48:12,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8912/203307 [10:10:06<221:48:12,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8913/203307 [10:10:10<221:48:00,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8913/203307 [10:10:10<221:48:00,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8914/203307 [10:10:14<221:47:48,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8914/203307 [10:10:14<221:47:49,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8915/203307 [10:10:17<221:47:36,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8915/203307 [10:10:17<221:47:36,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8916/203307 [10:10:22<221:47:35,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8916/203307 [10:10:22<221:47:35,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8917/203307 [10:10:26<221:47:37,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8917/203307 [10:10:26<221:47:37,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8918/203307 [10:10:30<221:47:25,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8918/203307 [10:10:30<221:47:25,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8919/203307 [10:10:34<221:47:28,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8919/203307 [10:10:34<221:47:28,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8920/203307 [10:10:38<221:47:16,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8920/203307 [10:10:38<221:47:16,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8921/203307 [10:10:42<221:47:02,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   4%|▍         | 8921/203307 [10:10:42<221:47:02,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8922/203307 [10:10:45<221:46:50,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8922/203307 [10:10:45<221:46:50,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8923/203307 [10:10:49<221:46:38,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8923/203307 [10:10:49<221:46:38,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8924/203307 [10:10:53<221:46:25,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8924/203307 [10:10:53<221:46:25,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8925/203307 [10:10:57<221:46:25,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8925/203307 [10:10:57<221:46:25,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8926/203307 [10:11:02<221:46:28,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8926/203307 [10:11:02<221:46:28,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8927/203307 [10:11:06<221:46:30,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8927/203307 [10:11:06<221:46:30,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8928/203307 [10:11:10<221:46:17,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8928/203307 [10:11:10<221:46:17,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8929/203307 [10:11:13<221:46:04,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8929/203307 [10:11:13<221:46:04,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8930/203307 [10:11:17<221:45:51,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8930/203307 [10:11:17<221:45:52,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8931/203307 [10:11:21<221:45:45,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8931/203307 [10:11:21<221:45:45,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8932/203307 [10:11:25<221:45:35,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8932/203307 [10:11:25<221:45:36,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8933/203307 [10:11:29<221:45:22,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8933/203307 [10:11:29<221:45:22,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8934/203307 [10:11:33<221:45:25,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8934/203307 [10:11:33<221:45:25,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8935/203307 [10:11:37<221:45:14,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8935/203307 [10:11:37<221:45:14,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8936/203307 [10:11:41<221:45:17,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8936/203307 [10:11:41<221:45:17,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8937/203307 [10:11:45<221:45:04,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8937/203307 [10:11:45<221:45:04,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8938/203307 [10:11:49<221:44:50,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8938/203307 [10:11:49<221:44:51,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8939/203307 [10:11:52<221:44:37,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8939/203307 [10:11:52<221:44:37,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8940/203307 [10:11:56<221:44:26,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8940/203307 [10:11:56<221:44:26,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8941/203307 [10:12:00<221:44:14,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   4%|▍         | 8941/203307 [10:12:00<221:44:15,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8942/203307 [10:12:04<221:44:19,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8942/203307 [10:12:04<221:44:19,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8943/203307 [10:12:09<221:44:17,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8943/203307 [10:12:09<221:44:18,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8944/203307 [10:12:13<221:44:18,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8944/203307 [10:12:13<221:44:18,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8945/203307 [10:12:17<221:44:20,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8945/203307 [10:12:17<221:44:20,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8946/203307 [10:12:21<221:44:07,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8946/203307 [10:12:21<221:44:07,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8947/203307 [10:12:25<221:43:54,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8947/203307 [10:12:25<221:43:54,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8948/203307 [10:12:28<221:43:42,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8948/203307 [10:12:28<221:43:42,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8949/203307 [10:12:32<221:43:29,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8949/203307 [10:12:32<221:43:29,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8950/203307 [10:12:36<221:43:17,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8950/203307 [10:12:36<221:43:17,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8951/203307 [10:12:40<221:43:21,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8951/203307 [10:12:40<221:43:21,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8952/203307 [10:12:45<221:43:20,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8952/203307 [10:12:45<221:43:20,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8953/203307 [10:12:49<221:43:20,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8953/203307 [10:12:49<221:43:20,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8954/203307 [10:12:53<221:43:07,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8954/203307 [10:12:53<221:43:07,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8955/203307 [10:12:56<221:42:54,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8955/203307 [10:12:56<221:42:54,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8956/203307 [10:13:00<221:42:41,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8956/203307 [10:13:00<221:42:41,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8957/203307 [10:13:04<221:42:27,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8957/203307 [10:13:04<221:42:28,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8958/203307 [10:13:07<221:42:15,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8958/203307 [10:13:07<221:42:15,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8959/203307 [10:13:12<221:42:17,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8959/203307 [10:13:12<221:42:17,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8960/203307 [10:13:16<221:42:05,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8960/203307 [10:13:16<221:42:05,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8961/203307 [10:13:20<221:42:07,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   4%|▍         | 8961/203307 [10:13:20<221:42:07,  0.24it/s, v_num=t5e6, training/loss=0.095] Epoch 0:   4%|▍         | 8962/203307 [10:13:24<221:42:10,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8962/203307 [10:13:24<221:42:10,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8963/203307 [10:13:28<221:41:57,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8963/203307 [10:13:28<221:41:58,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8964/203307 [10:13:32<221:41:44,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8964/203307 [10:13:32<221:41:44,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8965/203307 [10:13:35<221:41:29,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8965/203307 [10:13:35<221:41:30,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8966/203307 [10:13:39<221:41:16,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8966/203307 [10:13:39<221:41:17,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8967/203307 [10:13:44<221:41:21,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8967/203307 [10:13:44<221:41:21,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8968/203307 [10:13:47<221:41:07,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8968/203307 [10:13:47<221:41:07,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8969/203307 [10:13:51<221:41:05,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8969/203307 [10:13:51<221:41:06,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8970/203307 [10:13:56<221:41:02,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8970/203307 [10:13:56<221:41:02,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8971/203307 [10:14:00<221:41:02,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8971/203307 [10:14:00<221:41:02,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8972/203307 [10:14:04<221:40:47,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8972/203307 [10:14:04<221:40:47,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8973/203307 [10:14:07<221:40:33,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8973/203307 [10:14:07<221:40:33,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8974/203307 [10:14:11<221:40:19,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8974/203307 [10:14:11<221:40:20,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8975/203307 [10:14:15<221:40:06,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8975/203307 [10:14:15<221:40:06,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8976/203307 [10:14:19<221:40:10,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8976/203307 [10:14:19<221:40:11,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8977/203307 [10:14:23<221:40:11,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8977/203307 [10:14:23<221:40:11,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8978/203307 [10:14:27<221:39:57,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8978/203307 [10:14:27<221:39:57,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8979/203307 [10:14:31<221:40:01,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8979/203307 [10:14:31<221:40:01,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8980/203307 [10:14:35<221:39:48,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8980/203307 [10:14:35<221:39:48,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8981/203307 [10:14:39<221:39:36,  0.24it/s, v_num=t5e6, training/loss=0.095]Epoch 0:   4%|▍         | 8981/203307 [10:14:39<221:39:36,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8982/203307 [10:14:43<221:39:23,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8982/203307 [10:14:43<221:39:23,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8983/203307 [10:14:46<221:39:10,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8983/203307 [10:14:46<221:39:11,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8984/203307 [10:14:51<221:39:14,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8984/203307 [10:14:51<221:39:15,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8985/203307 [10:14:55<221:39:03,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8985/203307 [10:14:55<221:39:03,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8986/203307 [10:14:59<221:39:05,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8986/203307 [10:14:59<221:39:05,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8987/203307 [10:15:03<221:38:53,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8987/203307 [10:15:03<221:38:53,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8988/203307 [10:15:07<221:38:56,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8988/203307 [10:15:07<221:38:56,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8989/203307 [10:15:11<221:38:43,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8989/203307 [10:15:11<221:38:43,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8990/203307 [10:15:15<221:38:31,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8990/203307 [10:15:15<221:38:31,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8991/203307 [10:15:18<221:38:20,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8991/203307 [10:15:18<221:38:20,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8992/203307 [10:15:23<221:38:24,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8992/203307 [10:15:23<221:38:24,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8993/203307 [10:15:27<221:38:11,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8993/203307 [10:15:27<221:38:11,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8994/203307 [10:15:31<221:38:10,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8994/203307 [10:15:31<221:38:11,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8995/203307 [10:15:34<221:37:57,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8995/203307 [10:15:35<221:37:58,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8996/203307 [10:15:39<221:38:02,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8996/203307 [10:15:39<221:38:02,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8997/203307 [10:15:43<221:37:58,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8997/203307 [10:15:43<221:37:58,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8998/203307 [10:15:47<221:37:45,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8998/203307 [10:15:47<221:37:45,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8999/203307 [10:15:50<221:37:31,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 8999/203307 [10:15:50<221:37:31,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 9000/203307 [10:15:54<221:37:19,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 9000/203307 [10:15:54<221:37:19,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 9001/203307 [10:15:59<221:37:22,  0.24it/s, v_num=t5e6, training/loss=0.0996]Epoch 0:   4%|▍         | 9001/203307 [10:15:59<221:37:22,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9002/203307 [10:16:03<221:37:22,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9002/203307 [10:16:03<221:37:22,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9003/203307 [10:16:07<221:37:10,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9003/203307 [10:16:07<221:37:10,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9004/203307 [10:16:10<221:36:56,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9004/203307 [10:16:10<221:36:56,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9005/203307 [10:16:15<221:37:00,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9005/203307 [10:16:15<221:37:00,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9006/203307 [10:16:19<221:36:50,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9006/203307 [10:16:19<221:36:50,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9007/203307 [10:16:22<221:36:37,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9007/203307 [10:16:22<221:36:37,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9008/203307 [10:16:26<221:36:24,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9008/203307 [10:16:26<221:36:24,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9009/203307 [10:16:30<221:36:27,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9009/203307 [10:16:30<221:36:27,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9010/203307 [10:16:34<221:36:13,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9010/203307 [10:16:34<221:36:13,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9011/203307 [10:16:38<221:36:14,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9011/203307 [10:16:38<221:36:14,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9012/203307 [10:16:42<221:36:00,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9012/203307 [10:16:42<221:36:00,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9013/203307 [10:16:46<221:35:47,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9013/203307 [10:16:46<221:35:47,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9014/203307 [10:16:50<221:35:49,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9014/203307 [10:16:50<221:35:49,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9015/203307 [10:16:54<221:35:36,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9015/203307 [10:16:54<221:35:36,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9016/203307 [10:16:58<221:35:22,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9016/203307 [10:16:58<221:35:22,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9017/203307 [10:17:02<221:35:26,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9017/203307 [10:17:02<221:35:26,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9018/203307 [10:17:06<221:35:12,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9018/203307 [10:17:06<221:35:12,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9019/203307 [10:17:10<221:35:12,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9019/203307 [10:17:10<221:35:12,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9020/203307 [10:17:14<221:35:00,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9020/203307 [10:17:14<221:35:00,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9021/203307 [10:17:17<221:34:46,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   4%|▍         | 9021/203307 [10:17:17<221:34:46,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9022/203307 [10:17:21<221:34:33,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9022/203307 [10:17:21<221:34:33,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9023/203307 [10:17:25<221:34:37,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9023/203307 [10:17:25<221:34:37,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9024/203307 [10:17:30<221:34:34,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9024/203307 [10:17:30<221:34:34,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9025/203307 [10:17:33<221:34:20,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9025/203307 [10:17:33<221:34:20,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9026/203307 [10:17:38<221:34:23,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9026/203307 [10:17:38<221:34:23,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9027/203307 [10:17:42<221:34:23,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9027/203307 [10:17:42<221:34:23,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9028/203307 [10:17:46<221:34:12,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9028/203307 [10:17:46<221:34:12,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9029/203307 [10:17:50<221:34:00,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9029/203307 [10:17:50<221:34:00,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9030/203307 [10:17:53<221:33:48,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9030/203307 [10:17:53<221:33:48,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9031/203307 [10:17:58<221:33:53,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9031/203307 [10:17:58<221:33:53,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9032/203307 [10:18:02<221:33:52,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9032/203307 [10:18:02<221:33:52,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9033/203307 [10:18:06<221:33:38,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9033/203307 [10:18:06<221:33:38,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9034/203307 [10:18:10<221:33:41,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9034/203307 [10:18:10<221:33:41,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9035/203307 [10:18:14<221:33:29,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9035/203307 [10:18:14<221:33:30,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9036/203307 [10:18:18<221:33:32,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9036/203307 [10:18:18<221:33:32,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9037/203307 [10:18:22<221:33:21,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9037/203307 [10:18:22<221:33:21,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9038/203307 [10:18:26<221:33:09,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9038/203307 [10:18:26<221:33:09,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9039/203307 [10:18:30<221:32:58,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9039/203307 [10:18:30<221:32:58,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9040/203307 [10:18:34<221:33:01,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9040/203307 [10:18:34<221:33:01,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9041/203307 [10:18:38<221:33:02,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   4%|▍         | 9041/203307 [10:18:38<221:33:02,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9042/203307 [10:18:43<221:33:05,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9042/203307 [10:18:43<221:33:06,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9043/203307 [10:18:47<221:32:54,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9043/203307 [10:18:47<221:32:54,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9044/203307 [10:18:51<221:32:55,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9044/203307 [10:18:51<221:32:55,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9045/203307 [10:18:55<221:32:44,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9045/203307 [10:18:55<221:32:44,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9046/203307 [10:18:58<221:32:30,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9046/203307 [10:18:58<221:32:31,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9047/203307 [10:19:02<221:32:18,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9047/203307 [10:19:02<221:32:18,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9048/203307 [10:19:06<221:32:06,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9048/203307 [10:19:06<221:32:06,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9049/203307 [10:19:10<221:32:09,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9049/203307 [10:19:10<221:32:10,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9050/203307 [10:19:14<221:31:58,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9050/203307 [10:19:14<221:31:58,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9051/203307 [10:19:19<221:32:02,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9051/203307 [10:19:19<221:32:02,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9052/203307 [10:19:23<221:32:01,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9052/203307 [10:19:23<221:32:01,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9053/203307 [10:19:27<221:31:48,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9053/203307 [10:19:27<221:31:48,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9054/203307 [10:19:30<221:31:34,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9054/203307 [10:19:30<221:31:35,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9055/203307 [10:19:34<221:31:23,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9055/203307 [10:19:34<221:31:23,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9056/203307 [10:19:38<221:31:10,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9056/203307 [10:19:38<221:31:10,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9057/203307 [10:19:42<221:31:13,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9057/203307 [10:19:42<221:31:13,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9058/203307 [10:19:46<221:31:00,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9058/203307 [10:19:46<221:31:01,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9059/203307 [10:19:50<221:31:02,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9059/203307 [10:19:50<221:31:02,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9060/203307 [10:19:54<221:31:01,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9060/203307 [10:19:54<221:31:01,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9061/203307 [10:19:59<221:31:02,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   4%|▍         | 9061/203307 [10:19:59<221:31:02,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9062/203307 [10:20:02<221:30:50,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9062/203307 [10:20:02<221:30:50,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9063/203307 [10:20:06<221:30:36,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9063/203307 [10:20:06<221:30:36,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9064/203307 [10:20:10<221:30:23,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9064/203307 [10:20:10<221:30:23,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9065/203307 [10:20:13<221:30:09,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9065/203307 [10:20:14<221:30:10,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9066/203307 [10:20:18<221:30:12,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9066/203307 [10:20:18<221:30:12,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9067/203307 [10:20:22<221:30:14,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9067/203307 [10:20:22<221:30:14,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9068/203307 [10:20:26<221:29:59,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9068/203307 [10:20:26<221:29:59,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9069/203307 [10:20:30<221:30:00,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9069/203307 [10:20:30<221:30:00,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9070/203307 [10:20:34<221:29:46,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9070/203307 [10:20:34<221:29:46,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9071/203307 [10:20:38<221:29:33,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9071/203307 [10:20:38<221:29:33,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9072/203307 [10:20:41<221:29:21,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9072/203307 [10:20:41<221:29:21,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9073/203307 [10:20:45<221:29:08,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9073/203307 [10:20:45<221:29:09,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9074/203307 [10:20:49<221:28:54,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9074/203307 [10:20:49<221:28:55,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9075/203307 [10:20:53<221:28:57,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9075/203307 [10:20:53<221:28:58,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9076/203307 [10:20:57<221:28:59,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9076/203307 [10:20:57<221:28:59,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9077/203307 [10:21:02<221:28:57,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9077/203307 [10:21:02<221:28:57,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9078/203307 [10:21:06<221:28:53,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9078/203307 [10:21:06<221:28:53,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9079/203307 [10:21:09<221:28:39,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9079/203307 [10:21:09<221:28:39,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9080/203307 [10:21:13<221:28:26,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9080/203307 [10:21:13<221:28:26,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9081/203307 [10:21:17<221:28:14,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   4%|▍         | 9081/203307 [10:21:17<221:28:15,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9082/203307 [10:21:21<221:28:03,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9082/203307 [10:21:21<221:28:03,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9083/203307 [10:21:25<221:28:06,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9083/203307 [10:21:25<221:28:06,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9084/203307 [10:21:29<221:28:08,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9084/203307 [10:21:29<221:28:08,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9085/203307 [10:21:33<221:27:55,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9085/203307 [10:21:33<221:27:55,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9086/203307 [10:21:37<221:27:56,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9086/203307 [10:21:37<221:27:56,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9087/203307 [10:21:42<221:27:53,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9087/203307 [10:21:42<221:27:53,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9088/203307 [10:21:45<221:27:40,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9088/203307 [10:21:45<221:27:40,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9089/203307 [10:21:49<221:27:26,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9089/203307 [10:21:49<221:27:26,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9090/203307 [10:21:53<221:27:13,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9090/203307 [10:21:53<221:27:13,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9091/203307 [10:21:56<221:26:59,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9091/203307 [10:21:56<221:26:59,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9092/203307 [10:22:01<221:27:03,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9092/203307 [10:22:01<221:27:04,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9093/203307 [10:22:05<221:26:51,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9093/203307 [10:22:05<221:26:51,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9094/203307 [10:22:09<221:26:51,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9094/203307 [10:22:09<221:26:51,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9095/203307 [10:22:12<221:26:38,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9095/203307 [10:22:13<221:26:38,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9096/203307 [10:22:17<221:26:34,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9096/203307 [10:22:17<221:26:34,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9097/203307 [10:22:20<221:26:22,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9097/203307 [10:22:20<221:26:22,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9098/203307 [10:22:24<221:26:11,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9098/203307 [10:22:24<221:26:11,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9099/203307 [10:22:28<221:25:59,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9099/203307 [10:22:28<221:26:00,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9100/203307 [10:22:32<221:25:48,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9100/203307 [10:22:32<221:25:48,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9101/203307 [10:22:36<221:25:54,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:   4%|▍         | 9101/203307 [10:22:36<221:25:54,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9102/203307 [10:22:41<221:25:53,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9102/203307 [10:22:41<221:25:54,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9103/203307 [10:22:44<221:25:42,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9103/203307 [10:22:44<221:25:42,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9104/203307 [10:22:48<221:25:31,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9104/203307 [10:22:48<221:25:32,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9105/203307 [10:22:52<221:25:32,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9105/203307 [10:22:52<221:25:32,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9106/203307 [10:22:56<221:25:20,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9106/203307 [10:22:56<221:25:20,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9107/203307 [10:23:00<221:25:08,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9107/203307 [10:23:00<221:25:08,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9108/203307 [10:23:04<221:24:55,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9108/203307 [10:23:04<221:24:55,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9109/203307 [10:23:08<221:25:00,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9109/203307 [10:23:08<221:25:00,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9110/203307 [10:23:12<221:24:48,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9110/203307 [10:23:12<221:24:48,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9111/203307 [10:23:16<221:24:49,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9111/203307 [10:23:16<221:24:49,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9112/203307 [10:23:20<221:24:35,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9112/203307 [10:23:20<221:24:35,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9113/203307 [10:23:23<221:24:21,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9113/203307 [10:23:23<221:24:22,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9114/203307 [10:23:28<221:24:19,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9114/203307 [10:23:28<221:24:19,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9115/203307 [10:23:31<221:24:06,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9115/203307 [10:23:31<221:24:06,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9116/203307 [10:23:35<221:23:54,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9116/203307 [10:23:35<221:23:54,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9117/203307 [10:23:40<221:23:59,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9117/203307 [10:23:40<221:23:59,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9118/203307 [10:23:44<221:24:00,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9118/203307 [10:23:44<221:24:00,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9119/203307 [10:23:48<221:23:58,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9119/203307 [10:23:48<221:23:58,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9120/203307 [10:23:52<221:23:44,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9120/203307 [10:23:52<221:23:44,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9121/203307 [10:23:55<221:23:31,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   4%|▍         | 9121/203307 [10:23:55<221:23:31,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9122/203307 [10:23:59<221:23:20,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9122/203307 [10:23:59<221:23:20,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9123/203307 [10:24:03<221:23:18,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9123/203307 [10:24:03<221:23:18,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9124/203307 [10:24:07<221:23:05,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9124/203307 [10:24:07<221:23:05,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9125/203307 [10:24:11<221:22:52,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9125/203307 [10:24:11<221:22:52,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9126/203307 [10:24:15<221:22:56,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9126/203307 [10:24:15<221:22:56,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9127/203307 [10:24:20<221:22:59,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9127/203307 [10:24:20<221:22:59,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9128/203307 [10:24:24<221:22:48,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9128/203307 [10:24:24<221:22:48,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9129/203307 [10:24:27<221:22:39,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9129/203307 [10:24:27<221:22:39,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9130/203307 [10:24:31<221:22:27,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9130/203307 [10:24:31<221:22:27,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9131/203307 [10:24:35<221:22:15,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9131/203307 [10:24:35<221:22:15,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9132/203307 [10:24:39<221:22:15,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9132/203307 [10:24:39<221:22:15,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9133/203307 [10:24:43<221:22:03,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9133/203307 [10:24:43<221:22:03,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9134/203307 [10:24:47<221:22:04,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9134/203307 [10:24:47<221:22:05,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9135/203307 [10:24:52<221:22:07,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9135/203307 [10:24:52<221:22:07,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9136/203307 [10:24:56<221:22:08,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9136/203307 [10:24:56<221:22:08,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9137/203307 [10:25:00<221:21:56,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9137/203307 [10:25:00<221:21:56,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9138/203307 [10:25:03<221:21:43,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9138/203307 [10:25:03<221:21:44,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9139/203307 [10:25:07<221:21:30,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9139/203307 [10:25:07<221:21:30,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9140/203307 [10:25:11<221:21:19,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9140/203307 [10:25:11<221:21:19,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9141/203307 [10:25:15<221:21:19,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   4%|▍         | 9141/203307 [10:25:15<221:21:19,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   4%|▍         | 9142/203307 [10:25:20<221:21:21,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   4%|▍         | 9142/203307 [10:25:20<221:21:21,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   4%|▍         | 9143/203307 [10:25:23<221:21:08,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   4%|▍         | 9143/203307 [10:25:23<221:21:08,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   4%|▍         | 9144/203307 [10:25:28<221:21:12,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   4%|▍         | 9144/203307 [10:25:28<221:21:12,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   4%|▍         | 9145/203307 [10:25:31<221:20:59,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   4%|▍         | 9145/203307 [10:25:31<221:21:00,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   4%|▍         | 9146/203307 [10:25:35<221:20:48,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   4%|▍         | 9146/203307 [10:25:35<221:20:48,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   4%|▍         | 9147/203307 [10:25:39<221:20:35,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   4%|▍         | 9147/203307 [10:25:39<221:20:35,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   4%|▍         | 9148/203307 [10:25:43<221:20:25,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   4%|▍         | 9148/203307 [10:25:43<221:20:25,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   5%|▍         | 9149/203307 [10:25:46<221:20:10,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   5%|▍         | 9149/203307 [10:25:46<221:20:11,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   5%|▍         | 9150/203307 [10:25:51<221:20:10,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   5%|▍         | 9150/203307 [10:25:51<221:20:10,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   5%|▍         | 9151/203307 [10:25:55<221:20:13,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   5%|▍         | 9151/203307 [10:25:55<221:20:13,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   5%|▍         | 9152/203307 [10:25:59<221:20:13,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   5%|▍         | 9152/203307 [10:25:59<221:20:13,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   5%|▍         | 9153/203307 [10:26:04<221:20:14,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   5%|▍         | 9153/203307 [10:26:04<221:20:15,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   5%|▍         | 9154/203307 [10:26:07<221:20:02,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   5%|▍         | 9154/203307 [10:26:07<221:20:02,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   5%|▍         | 9155/203307 [10:26:11<221:19:48,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   5%|▍         | 9155/203307 [10:26:11<221:19:48,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   5%|▍         | 9156/203307 [10:26:15<221:19:38,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   5%|▍         | 9156/203307 [10:26:15<221:19:38,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   5%|▍         | 9157/203307 [10:26:19<221:19:28,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   5%|▍         | 9157/203307 [10:26:19<221:19:28,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   5%|▍         | 9158/203307 [10:26:23<221:19:17,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   5%|▍         | 9158/203307 [10:26:23<221:19:17,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   5%|▍         | 9159/203307 [10:26:27<221:19:20,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   5%|▍         | 9159/203307 [10:26:27<221:19:21,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   5%|▍         | 9160/203307 [10:26:31<221:19:09,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   5%|▍         | 9160/203307 [10:26:31<221:19:09,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   5%|▍         | 9161/203307 [10:26:35<221:19:13,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   5%|▍         | 9161/203307 [10:26:35<221:19:13,  0.24it/s, v_num=t5e6, training/loss=0.076] Epoch 0:   5%|▍         | 9162/203307 [10:26:39<221:19:02,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9162/203307 [10:26:39<221:19:02,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9163/203307 [10:26:43<221:18:49,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9163/203307 [10:26:43<221:18:49,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9164/203307 [10:26:46<221:18:37,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9164/203307 [10:26:46<221:18:37,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9165/203307 [10:26:50<221:18:26,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9165/203307 [10:26:50<221:18:26,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9166/203307 [10:26:54<221:18:15,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9166/203307 [10:26:54<221:18:15,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9167/203307 [10:26:58<221:18:19,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9167/203307 [10:26:58<221:18:19,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9168/203307 [10:27:03<221:18:16,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9168/203307 [10:27:03<221:18:16,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9169/203307 [10:27:07<221:18:16,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9169/203307 [10:27:07<221:18:16,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9170/203307 [10:27:11<221:18:17,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9170/203307 [10:27:11<221:18:17,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9171/203307 [10:27:15<221:18:05,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9171/203307 [10:27:15<221:18:05,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9172/203307 [10:27:19<221:17:53,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9172/203307 [10:27:19<221:17:53,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9173/203307 [10:27:22<221:17:42,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9173/203307 [10:27:22<221:17:42,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9174/203307 [10:27:26<221:17:30,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9174/203307 [10:27:26<221:17:31,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9175/203307 [10:27:30<221:17:18,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9175/203307 [10:27:30<221:17:19,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9176/203307 [10:27:34<221:17:23,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9176/203307 [10:27:34<221:17:23,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9177/203307 [10:27:39<221:17:23,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9177/203307 [10:27:39<221:17:23,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9178/203307 [10:27:42<221:17:10,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9178/203307 [10:27:42<221:17:10,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9179/203307 [10:27:47<221:17:12,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9179/203307 [10:27:47<221:17:12,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9180/203307 [10:27:51<221:16:59,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9180/203307 [10:27:51<221:16:59,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9181/203307 [10:27:54<221:16:46,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:   5%|▍         | 9181/203307 [10:27:54<221:16:46,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9182/203307 [10:27:58<221:16:34,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9182/203307 [10:27:58<221:16:34,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9183/203307 [10:28:02<221:16:21,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9183/203307 [10:28:02<221:16:21,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9184/203307 [10:28:06<221:16:24,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9184/203307 [10:28:06<221:16:24,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9185/203307 [10:28:10<221:16:13,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9185/203307 [10:28:10<221:16:13,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9186/203307 [10:28:14<221:16:13,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9186/203307 [10:28:14<221:16:13,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9187/203307 [10:28:19<221:16:17,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9187/203307 [10:28:19<221:16:17,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9188/203307 [10:28:22<221:16:05,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9188/203307 [10:28:22<221:16:05,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9189/203307 [10:28:26<221:15:52,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9189/203307 [10:28:26<221:15:53,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9190/203307 [10:28:30<221:15:41,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9190/203307 [10:28:30<221:15:42,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9191/203307 [10:28:34<221:15:28,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9191/203307 [10:28:34<221:15:29,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9192/203307 [10:28:38<221:15:33,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9192/203307 [10:28:38<221:15:33,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9193/203307 [10:28:42<221:15:22,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9193/203307 [10:28:42<221:15:22,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9194/203307 [10:28:46<221:15:22,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9194/203307 [10:28:46<221:15:22,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9195/203307 [10:28:50<221:15:20,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9195/203307 [10:28:50<221:15:20,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9196/203307 [10:28:55<221:15:21,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9196/203307 [10:28:55<221:15:21,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9197/203307 [10:28:58<221:15:09,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9197/203307 [10:28:58<221:15:09,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9198/203307 [10:29:02<221:14:57,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9198/203307 [10:29:02<221:14:57,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9199/203307 [10:29:06<221:14:45,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9199/203307 [10:29:06<221:14:45,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9200/203307 [10:29:10<221:14:33,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9200/203307 [10:29:10<221:14:33,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9201/203307 [10:29:14<221:14:37,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   5%|▍         | 9201/203307 [10:29:14<221:14:37,  0.24it/s, v_num=t5e6, training/loss=0.101] Epoch 0:   5%|▍         | 9202/203307 [10:29:18<221:14:36,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9202/203307 [10:29:18<221:14:36,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9203/203307 [10:29:22<221:14:24,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9203/203307 [10:29:22<221:14:24,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9204/203307 [10:29:26<221:14:23,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9204/203307 [10:29:26<221:14:23,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9205/203307 [10:29:31<221:14:25,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9205/203307 [10:29:31<221:14:25,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9206/203307 [10:29:34<221:14:13,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9206/203307 [10:29:34<221:14:13,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9207/203307 [10:29:38<221:14:00,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9207/203307 [10:29:38<221:14:00,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9208/203307 [10:29:42<221:13:48,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9208/203307 [10:29:42<221:13:48,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9209/203307 [10:29:46<221:13:50,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9209/203307 [10:29:46<221:13:51,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9210/203307 [10:29:50<221:13:39,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9210/203307 [10:29:50<221:13:39,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9211/203307 [10:29:54<221:13:40,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9211/203307 [10:29:54<221:13:40,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9212/203307 [10:29:58<221:13:27,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9212/203307 [10:29:58<221:13:27,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9213/203307 [10:30:02<221:13:28,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9213/203307 [10:30:02<221:13:28,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9214/203307 [10:30:06<221:13:15,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9214/203307 [10:30:06<221:13:15,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9215/203307 [10:30:10<221:13:03,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9215/203307 [10:30:10<221:13:03,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9216/203307 [10:30:14<221:12:52,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9216/203307 [10:30:14<221:12:52,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9217/203307 [10:30:18<221:12:56,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9217/203307 [10:30:18<221:12:56,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9218/203307 [10:30:22<221:12:44,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9218/203307 [10:30:22<221:12:44,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9219/203307 [10:30:26<221:12:45,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9219/203307 [10:30:26<221:12:45,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9220/203307 [10:30:30<221:12:32,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9220/203307 [10:30:30<221:12:32,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9221/203307 [10:30:33<221:12:19,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   5%|▍         | 9221/203307 [10:30:33<221:12:19,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9222/203307 [10:30:38<221:12:23,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9222/203307 [10:30:38<221:12:23,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9223/203307 [10:30:42<221:12:09,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9223/203307 [10:30:42<221:12:10,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9224/203307 [10:30:45<221:11:55,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9224/203307 [10:30:45<221:11:56,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9225/203307 [10:30:49<221:11:44,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9225/203307 [10:30:49<221:11:44,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9226/203307 [10:30:53<221:11:48,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9226/203307 [10:30:53<221:11:48,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9227/203307 [10:30:58<221:11:48,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9227/203307 [10:30:58<221:11:48,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9228/203307 [10:31:02<221:11:36,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9228/203307 [10:31:02<221:11:36,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9229/203307 [10:31:05<221:11:23,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9229/203307 [10:31:05<221:11:23,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9230/203307 [10:31:09<221:11:12,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9230/203307 [10:31:09<221:11:12,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9231/203307 [10:31:13<221:11:15,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9231/203307 [10:31:13<221:11:15,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9232/203307 [10:31:17<221:11:04,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9232/203307 [10:31:17<221:11:04,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9233/203307 [10:31:21<221:10:51,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9233/203307 [10:31:21<221:10:51,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9234/203307 [10:31:25<221:10:52,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9234/203307 [10:31:25<221:10:52,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9235/203307 [10:31:29<221:10:42,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9235/203307 [10:31:29<221:10:43,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9236/203307 [10:31:33<221:10:44,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9236/203307 [10:31:33<221:10:44,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9237/203307 [10:31:37<221:10:32,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9237/203307 [10:31:37<221:10:32,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9238/203307 [10:31:41<221:10:20,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9238/203307 [10:31:41<221:10:20,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9239/203307 [10:31:45<221:10:22,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9239/203307 [10:31:45<221:10:22,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9240/203307 [10:31:50<221:10:20,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9240/203307 [10:31:50<221:10:21,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9241/203307 [10:31:53<221:10:10,  0.24it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   5%|▍         | 9241/203307 [10:31:53<221:10:10,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9242/203307 [10:31:58<221:10:13,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9242/203307 [10:31:58<221:10:13,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9243/203307 [10:32:01<221:10:01,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9243/203307 [10:32:02<221:10:02,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9244/203307 [10:32:06<221:10:02,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9244/203307 [10:32:06<221:10:02,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9245/203307 [10:32:10<221:09:50,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9245/203307 [10:32:10<221:09:50,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9246/203307 [10:32:13<221:09:37,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9246/203307 [10:32:13<221:09:37,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9247/203307 [10:32:17<221:09:24,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9247/203307 [10:32:17<221:09:25,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9248/203307 [10:32:21<221:09:28,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9248/203307 [10:32:21<221:09:28,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9249/203307 [10:32:26<221:09:24,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9249/203307 [10:32:26<221:09:24,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9250/203307 [10:32:29<221:09:12,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9250/203307 [10:32:29<221:09:12,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9251/203307 [10:32:34<221:09:16,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9251/203307 [10:32:34<221:09:16,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9252/203307 [10:32:38<221:09:13,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9252/203307 [10:32:38<221:09:13,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9253/203307 [10:32:42<221:09:02,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9253/203307 [10:32:42<221:09:02,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9254/203307 [10:32:45<221:08:48,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9254/203307 [10:32:45<221:08:48,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9255/203307 [10:32:49<221:08:34,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9255/203307 [10:32:49<221:08:34,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9256/203307 [10:32:53<221:08:21,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9256/203307 [10:32:53<221:08:21,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9257/203307 [10:32:57<221:08:24,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9257/203307 [10:32:57<221:08:24,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9258/203307 [10:33:01<221:08:20,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9258/203307 [10:33:01<221:08:20,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9259/203307 [10:33:05<221:08:21,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9259/203307 [10:33:05<221:08:21,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9260/203307 [10:33:09<221:08:07,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9260/203307 [10:33:09<221:08:07,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9261/203307 [10:33:13<221:08:07,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:   5%|▍         | 9261/203307 [10:33:13<221:08:07,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9262/203307 [10:33:17<221:07:54,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9262/203307 [10:33:17<221:07:54,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9263/203307 [10:33:21<221:07:42,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9263/203307 [10:33:21<221:07:42,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9264/203307 [10:33:24<221:07:28,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9264/203307 [10:33:24<221:07:29,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9265/203307 [10:33:29<221:07:32,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9265/203307 [10:33:29<221:07:32,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9266/203307 [10:33:33<221:07:17,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9266/203307 [10:33:33<221:07:18,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9267/203307 [10:33:37<221:07:19,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9267/203307 [10:33:37<221:07:19,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9268/203307 [10:33:41<221:07:06,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9268/203307 [10:33:41<221:07:06,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9269/203307 [10:33:45<221:07:04,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9269/203307 [10:33:45<221:07:04,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9270/203307 [10:33:48<221:06:50,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9270/203307 [10:33:48<221:06:50,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9271/203307 [10:33:52<221:06:37,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9271/203307 [10:33:52<221:06:37,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9272/203307 [10:33:56<221:06:23,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9272/203307 [10:33:56<221:06:23,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9273/203307 [10:33:59<221:06:10,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9273/203307 [10:33:59<221:06:10,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9274/203307 [10:34:04<221:06:13,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9274/203307 [10:34:04<221:06:13,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9275/203307 [10:34:07<221:05:58,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9275/203307 [10:34:07<221:05:58,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9276/203307 [10:34:12<221:05:59,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9276/203307 [10:34:12<221:05:59,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9277/203307 [10:34:16<221:05:59,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9277/203307 [10:34:16<221:05:59,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9278/203307 [10:34:20<221:05:46,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9278/203307 [10:34:20<221:05:46,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9279/203307 [10:34:23<221:05:34,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9279/203307 [10:34:23<221:05:34,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9280/203307 [10:34:27<221:05:21,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9280/203307 [10:34:27<221:05:21,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9281/203307 [10:34:31<221:05:08,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   5%|▍         | 9281/203307 [10:34:31<221:05:08,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9282/203307 [10:34:35<221:04:56,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9282/203307 [10:34:35<221:04:56,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9283/203307 [10:34:39<221:04:58,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9283/203307 [10:34:39<221:04:58,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9284/203307 [10:34:43<221:04:58,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9284/203307 [10:34:43<221:04:58,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9285/203307 [10:34:48<221:04:57,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9285/203307 [10:34:48<221:04:58,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9286/203307 [10:34:52<221:04:56,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9286/203307 [10:34:52<221:04:56,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9287/203307 [10:34:55<221:04:44,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9287/203307 [10:34:55<221:04:44,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9288/203307 [10:34:59<221:04:31,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9288/203307 [10:34:59<221:04:31,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9289/203307 [10:35:03<221:04:19,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9289/203307 [10:35:03<221:04:19,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9290/203307 [10:35:07<221:04:05,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9290/203307 [10:35:07<221:04:05,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9291/203307 [10:35:11<221:04:06,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9291/203307 [10:35:11<221:04:06,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9292/203307 [10:35:15<221:04:11,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9292/203307 [10:35:15<221:04:11,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9293/203307 [10:35:19<221:03:59,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9293/203307 [10:35:19<221:04:00,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9294/203307 [10:35:23<221:03:59,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9294/203307 [10:35:23<221:04:00,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9295/203307 [10:35:27<221:03:48,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9295/203307 [10:35:27<221:03:48,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9296/203307 [10:35:31<221:03:36,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9296/203307 [10:35:31<221:03:36,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9297/203307 [10:35:35<221:03:24,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9297/203307 [10:35:35<221:03:24,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9298/203307 [10:35:38<221:03:13,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9298/203307 [10:35:38<221:03:13,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9299/203307 [10:35:42<221:03:00,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9299/203307 [10:35:42<221:03:00,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9300/203307 [10:35:47<221:03:05,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9300/203307 [10:35:47<221:03:06,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9301/203307 [10:35:51<221:03:09,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   5%|▍         | 9301/203307 [10:35:51<221:03:09,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9302/203307 [10:35:55<221:03:08,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9302/203307 [10:35:55<221:03:08,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9303/203307 [10:35:59<221:03:05,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9303/203307 [10:35:59<221:03:05,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9304/203307 [10:36:03<221:02:51,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9304/203307 [10:36:03<221:02:51,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9305/203307 [10:36:07<221:02:38,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9305/203307 [10:36:07<221:02:38,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9306/203307 [10:36:11<221:02:27,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9306/203307 [10:36:11<221:02:27,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9307/203307 [10:36:14<221:02:13,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9307/203307 [10:36:14<221:02:14,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9308/203307 [10:36:18<221:02:01,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9308/203307 [10:36:18<221:02:01,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9309/203307 [10:36:22<221:02:05,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9309/203307 [10:36:22<221:02:05,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9310/203307 [10:36:26<221:01:52,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9310/203307 [10:36:26<221:01:52,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9311/203307 [10:36:30<221:01:52,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9311/203307 [10:36:30<221:01:52,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9312/203307 [10:36:35<221:01:49,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9312/203307 [10:36:35<221:01:49,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9313/203307 [10:36:38<221:01:36,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9313/203307 [10:36:38<221:01:36,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9314/203307 [10:36:42<221:01:23,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9314/203307 [10:36:42<221:01:23,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9315/203307 [10:36:46<221:01:10,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9315/203307 [10:36:46<221:01:11,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9316/203307 [10:36:49<221:00:58,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9316/203307 [10:36:49<221:00:58,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9317/203307 [10:36:54<221:01:01,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9317/203307 [10:36:54<221:01:01,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9318/203307 [10:36:57<221:00:49,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9318/203307 [10:36:57<221:00:49,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9319/203307 [10:37:02<221:00:48,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9319/203307 [10:37:02<221:00:48,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9320/203307 [10:37:05<221:00:36,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9320/203307 [10:37:05<221:00:36,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9321/203307 [10:37:10<221:00:35,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   5%|▍         | 9321/203307 [10:37:10<221:00:35,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9322/203307 [10:37:13<221:00:23,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9322/203307 [10:37:13<221:00:23,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9323/203307 [10:37:17<221:00:11,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9323/203307 [10:37:17<221:00:11,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9324/203307 [10:37:21<221:00:00,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9324/203307 [10:37:21<221:00:00,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9325/203307 [10:37:25<220:59:49,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9325/203307 [10:37:25<220:59:49,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9326/203307 [10:37:29<220:59:55,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9326/203307 [10:37:29<220:59:55,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9327/203307 [10:37:34<220:59:55,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9327/203307 [10:37:34<220:59:56,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9328/203307 [10:37:37<220:59:44,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9328/203307 [10:37:37<220:59:44,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9329/203307 [10:37:41<220:59:32,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9329/203307 [10:37:41<220:59:33,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9330/203307 [10:37:45<220:59:31,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9330/203307 [10:37:45<220:59:31,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9331/203307 [10:37:49<220:59:19,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9331/203307 [10:37:49<220:59:19,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9332/203307 [10:37:53<220:59:07,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9332/203307 [10:37:53<220:59:07,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9333/203307 [10:37:56<220:58:54,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9333/203307 [10:37:56<220:58:54,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9334/203307 [10:38:01<220:58:57,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9334/203307 [10:38:01<220:58:57,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9335/203307 [10:38:05<220:59:00,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9335/203307 [10:38:05<220:59:00,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9336/203307 [10:38:10<220:59:01,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9336/203307 [10:38:10<220:59:01,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9337/203307 [10:38:13<220:58:48,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9337/203307 [10:38:13<220:58:48,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9338/203307 [10:38:17<220:58:37,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9338/203307 [10:38:17<220:58:38,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9339/203307 [10:38:21<220:58:36,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9339/203307 [10:38:21<220:58:36,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9340/203307 [10:38:25<220:58:23,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9340/203307 [10:38:25<220:58:23,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9341/203307 [10:38:29<220:58:13,  0.24it/s, v_num=t5e6, training/loss=0.0939]Epoch 0:   5%|▍         | 9341/203307 [10:38:29<220:58:14,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9342/203307 [10:38:33<220:58:20,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9342/203307 [10:38:33<220:58:20,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9343/203307 [10:38:38<220:58:24,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9343/203307 [10:38:38<220:58:24,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9344/203307 [10:38:42<220:58:25,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9344/203307 [10:38:42<220:58:25,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9345/203307 [10:38:46<220:58:14,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9345/203307 [10:38:46<220:58:15,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9346/203307 [10:38:50<220:58:07,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9346/203307 [10:38:50<220:58:07,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9347/203307 [10:38:54<220:57:57,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9347/203307 [10:38:54<220:57:57,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9348/203307 [10:38:58<220:57:53,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9348/203307 [10:38:58<220:57:53,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9349/203307 [10:39:02<220:57:42,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9349/203307 [10:39:02<220:57:42,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9350/203307 [10:39:06<220:57:33,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9350/203307 [10:39:06<220:57:33,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9351/203307 [10:39:10<220:57:39,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9351/203307 [10:39:10<220:57:39,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9352/203307 [10:39:15<220:57:41,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9352/203307 [10:39:15<220:57:42,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9353/203307 [10:39:18<220:57:30,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9353/203307 [10:39:18<220:57:31,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9354/203307 [10:39:22<220:57:24,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9354/203307 [10:39:22<220:57:24,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9355/203307 [10:39:26<220:57:15,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9355/203307 [10:39:26<220:57:15,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9356/203307 [10:39:30<220:57:02,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9356/203307 [10:39:30<220:57:02,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9357/203307 [10:39:34<220:57:01,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9357/203307 [10:39:34<220:57:01,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9358/203307 [10:39:38<220:56:53,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9358/203307 [10:39:38<220:56:53,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9359/203307 [10:39:43<220:57:01,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9359/203307 [10:39:43<220:57:01,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9360/203307 [10:39:47<220:56:50,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9360/203307 [10:39:47<220:56:51,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9361/203307 [10:39:51<220:56:53,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▍         | 9361/203307 [10:39:51<220:56:53,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9362/203307 [10:39:55<220:56:45,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9362/203307 [10:39:55<220:56:45,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9363/203307 [10:39:59<220:56:38,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9363/203307 [10:39:59<220:56:38,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9364/203307 [10:40:03<220:56:26,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9364/203307 [10:40:03<220:56:26,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9365/203307 [10:40:06<220:56:13,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9365/203307 [10:40:06<220:56:14,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9366/203307 [10:40:11<220:56:18,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9366/203307 [10:40:11<220:56:18,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9367/203307 [10:40:15<220:56:27,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9367/203307 [10:40:15<220:56:27,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9368/203307 [10:40:19<220:56:14,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9368/203307 [10:40:19<220:56:14,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9369/203307 [10:40:24<220:56:16,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9369/203307 [10:40:24<220:56:16,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9370/203307 [10:40:27<220:56:08,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9370/203307 [10:40:27<220:56:08,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9371/203307 [10:40:31<220:56:01,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9371/203307 [10:40:31<220:56:01,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9372/203307 [10:40:35<220:55:49,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9372/203307 [10:40:35<220:55:49,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9373/203307 [10:40:39<220:55:37,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9373/203307 [10:40:39<220:55:37,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9374/203307 [10:40:43<220:55:28,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9374/203307 [10:40:43<220:55:28,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9375/203307 [10:40:47<220:55:31,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9375/203307 [10:40:47<220:55:31,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9376/203307 [10:40:52<220:55:35,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9376/203307 [10:40:52<220:55:35,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9377/203307 [10:40:56<220:55:33,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9377/203307 [10:40:56<220:55:33,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9378/203307 [10:41:00<220:55:36,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9378/203307 [10:41:00<220:55:36,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9379/203307 [10:41:04<220:55:24,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9379/203307 [10:41:04<220:55:24,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9380/203307 [10:41:08<220:55:10,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9380/203307 [10:41:08<220:55:10,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9381/203307 [10:41:11<220:55:00,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   5%|▍         | 9381/203307 [10:41:11<220:55:00,  0.24it/s, v_num=t5e6, training/loss=0.098] Epoch 0:   5%|▍         | 9382/203307 [10:41:15<220:54:54,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9382/203307 [10:41:15<220:54:54,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9383/203307 [10:41:19<220:54:47,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9383/203307 [10:41:19<220:54:47,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9384/203307 [10:41:24<220:54:51,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9384/203307 [10:41:24<220:54:51,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9385/203307 [10:41:28<220:54:37,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9385/203307 [10:41:28<220:54:38,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9386/203307 [10:41:32<220:54:45,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9386/203307 [10:41:32<220:54:46,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9387/203307 [10:41:37<220:54:53,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9387/203307 [10:41:37<220:54:53,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9388/203307 [10:41:41<220:54:45,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9388/203307 [10:41:41<220:54:45,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9389/203307 [10:41:44<220:54:32,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9389/203307 [10:41:44<220:54:32,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9390/203307 [10:41:49<220:54:26,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9390/203307 [10:41:49<220:54:26,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9391/203307 [10:41:52<220:54:15,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9391/203307 [10:41:52<220:54:15,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9392/203307 [10:41:57<220:54:19,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9392/203307 [10:41:57<220:54:19,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9393/203307 [10:42:01<220:54:15,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9393/203307 [10:42:01<220:54:15,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9394/203307 [10:42:05<220:54:17,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9394/203307 [10:42:05<220:54:17,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9395/203307 [10:42:10<220:54:18,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9395/203307 [10:42:10<220:54:18,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9396/203307 [10:42:13<220:54:06,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9396/203307 [10:42:13<220:54:07,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9397/203307 [10:42:17<220:53:56,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9397/203307 [10:42:17<220:53:56,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9398/203307 [10:42:21<220:53:44,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9398/203307 [10:42:21<220:53:45,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9399/203307 [10:42:25<220:53:32,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9399/203307 [10:42:25<220:53:32,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9400/203307 [10:42:28<220:53:20,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9400/203307 [10:42:28<220:53:20,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9401/203307 [10:42:33<220:53:21,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9401/203307 [10:42:33<220:53:21,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9402/203307 [10:42:37<220:53:20,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9402/203307 [10:42:37<220:53:20,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9403/203307 [10:42:41<220:53:07,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9403/203307 [10:42:41<220:53:08,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9404/203307 [10:42:45<220:53:07,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9404/203307 [10:42:45<220:53:08,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9405/203307 [10:42:49<220:52:54,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9405/203307 [10:42:49<220:52:54,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9406/203307 [10:42:52<220:52:40,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9406/203307 [10:42:52<220:52:40,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9407/203307 [10:42:56<220:52:28,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9407/203307 [10:42:56<220:52:28,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9408/203307 [10:43:00<220:52:15,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9408/203307 [10:43:00<220:52:15,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9409/203307 [10:43:04<220:52:18,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9409/203307 [10:43:04<220:52:19,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9410/203307 [10:43:08<220:52:06,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9410/203307 [10:43:08<220:52:06,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9411/203307 [10:43:12<220:52:05,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9411/203307 [10:43:12<220:52:05,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9412/203307 [10:43:16<220:51:53,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9412/203307 [10:43:16<220:51:53,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9413/203307 [10:43:20<220:51:54,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9413/203307 [10:43:20<220:51:55,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9414/203307 [10:43:24<220:51:41,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9414/203307 [10:43:24<220:51:41,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9415/203307 [10:43:27<220:51:27,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9415/203307 [10:43:27<220:51:28,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9416/203307 [10:43:31<220:51:15,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9416/203307 [10:43:31<220:51:15,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9417/203307 [10:43:36<220:51:20,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9417/203307 [10:43:36<220:51:20,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9418/203307 [10:43:39<220:51:07,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9418/203307 [10:43:39<220:51:08,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9419/203307 [10:43:44<220:51:06,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9419/203307 [10:43:44<220:51:07,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9420/203307 [10:43:48<220:51:04,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9420/203307 [10:43:48<220:51:04,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9421/203307 [10:43:52<220:51:04,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   5%|▍         | 9421/203307 [10:43:52<220:51:04,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9422/203307 [10:43:56<220:50:52,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9422/203307 [10:43:56<220:50:52,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9423/203307 [10:43:59<220:50:40,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9423/203307 [10:43:59<220:50:40,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9424/203307 [10:44:03<220:50:27,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9424/203307 [10:44:03<220:50:27,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9425/203307 [10:44:07<220:50:15,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9425/203307 [10:44:07<220:50:15,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9426/203307 [10:44:11<220:50:19,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9426/203307 [10:44:11<220:50:19,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9427/203307 [10:44:16<220:50:20,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9427/203307 [10:44:16<220:50:20,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9428/203307 [10:44:19<220:50:06,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9428/203307 [10:44:19<220:50:07,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9429/203307 [10:44:24<220:50:05,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9429/203307 [10:44:24<220:50:06,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9430/203307 [10:44:28<220:50:06,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9430/203307 [10:44:28<220:50:06,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9431/203307 [10:44:32<220:49:53,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9431/203307 [10:44:32<220:49:53,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9432/203307 [10:44:35<220:49:40,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9432/203307 [10:44:35<220:49:41,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9433/203307 [10:44:39<220:49:27,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9433/203307 [10:44:39<220:49:27,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9434/203307 [10:44:43<220:49:28,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9434/203307 [10:44:43<220:49:28,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9435/203307 [10:44:47<220:49:18,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9435/203307 [10:44:47<220:49:18,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9436/203307 [10:44:51<220:49:17,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9436/203307 [10:44:51<220:49:17,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9437/203307 [10:44:55<220:49:02,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9437/203307 [10:44:55<220:49:02,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9438/203307 [10:44:59<220:48:59,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9438/203307 [10:44:59<220:48:59,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9439/203307 [10:45:03<220:48:59,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9439/203307 [10:45:03<220:48:59,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9440/203307 [10:45:07<220:48:45,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9440/203307 [10:45:07<220:48:45,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9441/203307 [10:45:11<220:48:32,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   5%|▍         | 9441/203307 [10:45:11<220:48:32,  0.24it/s, v_num=t5e6, training/loss=0.085] Epoch 0:   5%|▍         | 9442/203307 [10:45:15<220:48:34,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9442/203307 [10:45:15<220:48:35,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9443/203307 [10:45:19<220:48:22,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9443/203307 [10:45:19<220:48:23,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9444/203307 [10:45:23<220:48:21,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9444/203307 [10:45:23<220:48:22,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9445/203307 [10:45:27<220:48:09,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9445/203307 [10:45:27<220:48:09,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9446/203307 [10:45:30<220:47:56,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9446/203307 [10:45:30<220:47:56,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9447/203307 [10:45:35<220:47:58,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9447/203307 [10:45:35<220:47:58,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9448/203307 [10:45:38<220:47:45,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9448/203307 [10:45:38<220:47:45,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9449/203307 [10:45:42<220:47:33,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9449/203307 [10:45:42<220:47:33,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9450/203307 [10:45:46<220:47:21,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9450/203307 [10:45:46<220:47:21,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9451/203307 [10:45:50<220:47:25,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9451/203307 [10:45:50<220:47:25,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9452/203307 [10:45:55<220:47:25,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9452/203307 [10:45:55<220:47:25,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9453/203307 [10:45:58<220:47:14,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9453/203307 [10:45:58<220:47:14,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9454/203307 [10:46:02<220:47:01,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9454/203307 [10:46:02<220:47:02,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9455/203307 [10:46:06<220:46:50,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9455/203307 [10:46:06<220:46:50,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9456/203307 [10:46:10<220:46:53,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9456/203307 [10:46:10<220:46:53,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9457/203307 [10:46:14<220:46:42,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9457/203307 [10:46:14<220:46:42,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9458/203307 [10:46:18<220:46:30,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9458/203307 [10:46:18<220:46:30,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9459/203307 [10:46:22<220:46:34,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9459/203307 [10:46:22<220:46:34,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9460/203307 [10:46:26<220:46:23,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9460/203307 [10:46:26<220:46:23,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9461/203307 [10:46:30<220:46:24,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   5%|▍         | 9461/203307 [10:46:30<220:46:24,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9462/203307 [10:46:34<220:46:12,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9462/203307 [10:46:34<220:46:12,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9463/203307 [10:46:38<220:46:00,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9463/203307 [10:46:38<220:46:00,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9464/203307 [10:46:42<220:45:48,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9464/203307 [10:46:42<220:45:49,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9465/203307 [10:46:46<220:45:51,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9465/203307 [10:46:46<220:45:51,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9466/203307 [10:46:50<220:45:39,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9466/203307 [10:46:50<220:45:39,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9467/203307 [10:46:54<220:45:43,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9467/203307 [10:46:54<220:45:43,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9468/203307 [10:46:58<220:45:31,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9468/203307 [10:46:58<220:45:31,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9469/203307 [10:47:02<220:45:32,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9469/203307 [10:47:02<220:45:32,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9470/203307 [10:47:06<220:45:19,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9470/203307 [10:47:06<220:45:20,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9471/203307 [10:47:10<220:45:08,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9471/203307 [10:47:10<220:45:08,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9472/203307 [10:47:13<220:44:58,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9472/203307 [10:47:13<220:44:58,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9473/203307 [10:47:18<220:45:00,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9473/203307 [10:47:18<220:45:00,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9474/203307 [10:47:22<220:44:59,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9474/203307 [10:47:22<220:44:59,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9475/203307 [10:47:26<220:44:48,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9475/203307 [10:47:26<220:44:48,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9476/203307 [10:47:30<220:44:51,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9476/203307 [10:47:30<220:44:51,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9477/203307 [10:47:35<220:44:51,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9477/203307 [10:47:35<220:44:51,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9478/203307 [10:47:38<220:44:40,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9478/203307 [10:47:38<220:44:40,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9479/203307 [10:47:42<220:44:29,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9479/203307 [10:47:42<220:44:29,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9480/203307 [10:47:46<220:44:17,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9480/203307 [10:47:46<220:44:17,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9481/203307 [10:47:50<220:44:06,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   5%|▍         | 9481/203307 [10:47:50<220:44:06,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9482/203307 [10:47:54<220:44:09,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9482/203307 [10:47:54<220:44:09,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9483/203307 [10:47:58<220:44:08,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9483/203307 [10:47:58<220:44:08,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9484/203307 [10:48:03<220:44:09,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9484/203307 [10:48:03<220:44:10,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9485/203307 [10:48:07<220:44:00,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9485/203307 [10:48:07<220:44:00,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9486/203307 [10:48:11<220:44:01,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9486/203307 [10:48:11<220:44:01,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9487/203307 [10:48:15<220:43:51,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9487/203307 [10:48:15<220:43:51,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9488/203307 [10:48:19<220:43:41,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9488/203307 [10:48:19<220:43:41,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9489/203307 [10:48:22<220:43:30,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9489/203307 [10:48:22<220:43:31,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9490/203307 [10:48:26<220:43:19,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9490/203307 [10:48:26<220:43:19,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9491/203307 [10:48:30<220:43:20,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9491/203307 [10:48:30<220:43:21,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9492/203307 [10:48:35<220:43:25,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9492/203307 [10:48:35<220:43:25,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9493/203307 [10:48:39<220:43:13,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9493/203307 [10:48:39<220:43:13,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9494/203307 [10:48:43<220:43:13,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9494/203307 [10:48:43<220:43:13,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9495/203307 [10:48:47<220:43:02,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9495/203307 [10:48:47<220:43:02,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9496/203307 [10:48:50<220:42:51,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9496/203307 [10:48:50<220:42:51,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9497/203307 [10:48:54<220:42:39,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9497/203307 [10:48:54<220:42:40,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9498/203307 [10:48:58<220:42:29,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9498/203307 [10:48:58<220:42:29,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9499/203307 [10:49:02<220:42:31,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9499/203307 [10:49:02<220:42:31,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9500/203307 [10:49:06<220:42:20,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9500/203307 [10:49:06<220:42:20,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9501/203307 [10:49:11<220:42:23,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:   5%|▍         | 9501/203307 [10:49:11<220:42:23,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9502/203307 [10:49:15<220:42:25,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9502/203307 [10:49:15<220:42:25,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9503/203307 [10:49:19<220:42:16,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9503/203307 [10:49:19<220:42:16,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9504/203307 [10:49:23<220:42:06,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9504/203307 [10:49:23<220:42:07,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9505/203307 [10:49:26<220:41:55,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9505/203307 [10:49:26<220:41:55,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9506/203307 [10:49:30<220:41:43,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9506/203307 [10:49:30<220:41:43,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9507/203307 [10:49:34<220:41:32,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9507/203307 [10:49:34<220:41:32,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9508/203307 [10:49:38<220:41:35,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9508/203307 [10:49:38<220:41:35,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9509/203307 [10:49:43<220:41:35,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9509/203307 [10:49:43<220:41:36,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9510/203307 [10:49:47<220:41:33,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9510/203307 [10:49:47<220:41:33,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9511/203307 [10:49:51<220:41:33,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9511/203307 [10:49:51<220:41:34,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9512/203307 [10:49:55<220:41:20,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9512/203307 [10:49:55<220:41:20,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9513/203307 [10:49:59<220:41:08,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9513/203307 [10:49:59<220:41:09,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9514/203307 [10:50:02<220:40:57,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9514/203307 [10:50:02<220:40:57,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9515/203307 [10:50:06<220:40:44,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9515/203307 [10:50:06<220:40:44,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9516/203307 [10:50:10<220:40:32,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9516/203307 [10:50:10<220:40:32,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9517/203307 [10:50:14<220:40:37,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9517/203307 [10:50:14<220:40:37,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9518/203307 [10:50:18<220:40:26,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9518/203307 [10:50:18<220:40:26,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9519/203307 [10:50:22<220:40:26,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9519/203307 [10:50:22<220:40:26,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9520/203307 [10:50:26<220:40:13,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9520/203307 [10:50:26<220:40:13,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9521/203307 [10:50:30<220:40:00,  0.24it/s, v_num=t5e6, training/loss=0.0951]Epoch 0:   5%|▍         | 9521/203307 [10:50:30<220:40:00,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9522/203307 [10:50:33<220:39:48,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9522/203307 [10:50:33<220:39:48,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9523/203307 [10:50:37<220:39:36,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9523/203307 [10:50:37<220:39:37,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9524/203307 [10:50:41<220:39:24,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9524/203307 [10:50:41<220:39:25,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9525/203307 [10:50:45<220:39:26,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9525/203307 [10:50:45<220:39:27,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9526/203307 [10:50:50<220:39:29,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9526/203307 [10:50:50<220:39:29,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9527/203307 [10:50:54<220:39:29,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9527/203307 [10:50:54<220:39:29,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9528/203307 [10:50:58<220:39:26,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9528/203307 [10:50:58<220:39:27,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9529/203307 [10:51:02<220:39:13,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9529/203307 [10:51:02<220:39:14,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9530/203307 [10:51:05<220:39:02,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9530/203307 [10:51:05<220:39:02,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9531/203307 [10:51:09<220:38:50,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9531/203307 [10:51:09<220:38:51,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9532/203307 [10:51:13<220:38:38,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9532/203307 [10:51:13<220:38:38,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9533/203307 [10:51:17<220:38:28,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9533/203307 [10:51:17<220:38:28,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9534/203307 [10:51:21<220:38:35,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9534/203307 [10:51:21<220:38:35,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9535/203307 [10:51:25<220:38:23,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9535/203307 [10:51:25<220:38:24,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9536/203307 [10:51:29<220:38:25,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9536/203307 [10:51:29<220:38:25,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9537/203307 [10:51:34<220:38:25,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9537/203307 [10:51:34<220:38:25,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9538/203307 [10:51:37<220:38:13,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9538/203307 [10:51:37<220:38:13,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9539/203307 [10:51:41<220:38:02,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9539/203307 [10:51:41<220:38:02,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9540/203307 [10:51:45<220:37:51,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9540/203307 [10:51:45<220:37:51,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9541/203307 [10:51:49<220:37:40,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   5%|▍         | 9541/203307 [10:51:49<220:37:40,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9542/203307 [10:51:53<220:37:44,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9542/203307 [10:51:53<220:37:44,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9543/203307 [10:51:58<220:37:48,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9543/203307 [10:51:58<220:37:49,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9544/203307 [10:52:02<220:37:50,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9544/203307 [10:52:02<220:37:50,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9545/203307 [10:52:06<220:37:39,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9545/203307 [10:52:06<220:37:39,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9546/203307 [10:52:10<220:37:37,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9546/203307 [10:52:10<220:37:37,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9547/203307 [10:52:14<220:37:26,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9547/203307 [10:52:14<220:37:26,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9548/203307 [10:52:18<220:37:16,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9548/203307 [10:52:18<220:37:16,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9549/203307 [10:52:21<220:37:03,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9549/203307 [10:52:21<220:37:04,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9550/203307 [10:52:25<220:36:52,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9550/203307 [10:52:25<220:36:52,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9551/203307 [10:52:30<220:36:58,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9551/203307 [10:52:30<220:36:58,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9552/203307 [10:52:34<220:36:57,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9552/203307 [10:52:34<220:36:57,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9553/203307 [10:52:38<220:36:46,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9553/203307 [10:52:38<220:36:46,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9554/203307 [10:52:41<220:36:33,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9554/203307 [10:52:41<220:36:33,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9555/203307 [10:52:46<220:36:31,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9555/203307 [10:52:46<220:36:31,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9556/203307 [10:52:49<220:36:19,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9556/203307 [10:52:49<220:36:19,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9557/203307 [10:52:53<220:36:09,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9557/203307 [10:52:53<220:36:09,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9558/203307 [10:52:57<220:35:58,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9558/203307 [10:52:57<220:35:58,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9559/203307 [10:53:01<220:36:00,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9559/203307 [10:53:01<220:36:00,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9560/203307 [10:53:06<220:36:04,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9560/203307 [10:53:06<220:36:04,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9561/203307 [10:53:10<220:36:04,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9561/203307 [10:53:10<220:36:04,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9562/203307 [10:53:14<220:35:52,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9562/203307 [10:53:14<220:35:52,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9563/203307 [10:53:17<220:35:41,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9563/203307 [10:53:17<220:35:41,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9564/203307 [10:53:22<220:35:40,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9564/203307 [10:53:22<220:35:40,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9565/203307 [10:53:25<220:35:28,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9565/203307 [10:53:25<220:35:28,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9566/203307 [10:53:29<220:35:18,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9566/203307 [10:53:29<220:35:18,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9567/203307 [10:53:34<220:35:21,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9567/203307 [10:53:34<220:35:21,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9568/203307 [10:53:38<220:35:11,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9568/203307 [10:53:38<220:35:11,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9569/203307 [10:53:42<220:35:15,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9569/203307 [10:53:42<220:35:15,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9570/203307 [10:53:46<220:35:03,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9570/203307 [10:53:46<220:35:03,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9571/203307 [10:53:49<220:34:52,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9571/203307 [10:53:49<220:34:52,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9572/203307 [10:53:53<220:34:41,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9572/203307 [10:53:53<220:34:41,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9573/203307 [10:53:57<220:34:39,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9573/203307 [10:53:57<220:34:39,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9574/203307 [10:54:01<220:34:27,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9574/203307 [10:54:01<220:34:27,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9575/203307 [10:54:05<220:34:18,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9575/203307 [10:54:05<220:34:18,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9576/203307 [10:54:10<220:34:23,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9576/203307 [10:54:10<220:34:23,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9577/203307 [10:54:14<220:34:25,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9577/203307 [10:54:14<220:34:25,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9578/203307 [10:54:18<220:34:15,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9578/203307 [10:54:18<220:34:15,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9579/203307 [10:54:21<220:34:03,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9579/203307 [10:54:21<220:34:03,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9580/203307 [10:54:25<220:33:51,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9580/203307 [10:54:25<220:33:51,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9581/203307 [10:54:29<220:33:41,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   5%|▍         | 9581/203307 [10:54:29<220:33:41,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9582/203307 [10:54:33<220:33:40,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9582/203307 [10:54:33<220:33:40,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9583/203307 [10:54:37<220:33:34,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9583/203307 [10:54:37<220:33:34,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9584/203307 [10:54:42<220:33:38,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9584/203307 [10:54:42<220:33:38,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9585/203307 [10:54:46<220:33:27,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9585/203307 [10:54:46<220:33:27,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9586/203307 [10:54:50<220:33:32,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9586/203307 [10:54:50<220:33:32,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9587/203307 [10:54:54<220:33:20,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9587/203307 [10:54:54<220:33:21,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9588/203307 [10:54:57<220:33:09,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9588/203307 [10:54:58<220:33:09,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9589/203307 [10:55:01<220:32:57,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9589/203307 [10:55:01<220:32:57,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9590/203307 [10:55:05<220:32:45,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9590/203307 [10:55:05<220:32:45,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9591/203307 [10:55:09<220:32:42,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9591/203307 [10:55:09<220:32:42,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9592/203307 [10:55:14<220:32:45,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9592/203307 [10:55:14<220:32:45,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9593/203307 [10:55:17<220:32:32,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9593/203307 [10:55:17<220:32:32,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9594/203307 [10:55:21<220:32:31,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9594/203307 [10:55:21<220:32:32,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9595/203307 [10:55:26<220:32:33,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9595/203307 [10:55:26<220:32:33,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9596/203307 [10:55:29<220:32:20,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9596/203307 [10:55:30<220:32:20,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9597/203307 [10:55:33<220:32:07,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9597/203307 [10:55:33<220:32:07,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9598/203307 [10:55:37<220:31:55,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9598/203307 [10:55:37<220:31:55,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9599/203307 [10:55:41<220:31:44,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9599/203307 [10:55:41<220:31:44,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9600/203307 [10:55:45<220:31:42,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9600/203307 [10:55:45<220:31:42,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9601/203307 [10:55:49<220:31:44,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▍         | 9601/203307 [10:55:49<220:31:44,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9602/203307 [10:55:53<220:31:42,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9602/203307 [10:55:53<220:31:42,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9603/203307 [10:55:58<220:31:43,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9603/203307 [10:55:58<220:31:43,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9604/203307 [10:56:01<220:31:31,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9604/203307 [10:56:02<220:31:31,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9605/203307 [10:56:05<220:31:19,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9605/203307 [10:56:05<220:31:20,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9606/203307 [10:56:09<220:31:08,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9606/203307 [10:56:09<220:31:08,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9607/203307 [10:56:13<220:30:56,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9607/203307 [10:56:13<220:30:56,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9608/203307 [10:56:16<220:30:45,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9608/203307 [10:56:16<220:30:45,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9609/203307 [10:56:21<220:30:49,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9609/203307 [10:56:21<220:30:49,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9610/203307 [10:56:25<220:30:38,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9610/203307 [10:56:25<220:30:39,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9611/203307 [10:56:29<220:30:41,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9611/203307 [10:56:29<220:30:41,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9612/203307 [10:56:34<220:30:45,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9612/203307 [10:56:34<220:30:45,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9613/203307 [10:56:37<220:30:33,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9613/203307 [10:56:37<220:30:33,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9614/203307 [10:56:41<220:30:22,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9614/203307 [10:56:41<220:30:22,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9615/203307 [10:56:45<220:30:11,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9615/203307 [10:56:45<220:30:11,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9616/203307 [10:56:49<220:30:00,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9616/203307 [10:56:49<220:30:00,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9617/203307 [10:56:53<220:30:05,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9617/203307 [10:56:53<220:30:05,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9618/203307 [10:56:57<220:30:04,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9618/203307 [10:56:57<220:30:04,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9619/203307 [10:57:02<220:30:03,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9619/203307 [10:57:02<220:30:03,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9620/203307 [10:57:05<220:29:53,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9620/203307 [10:57:05<220:29:54,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9621/203307 [10:57:10<220:29:56,  0.24it/s, v_num=t5e6, training/loss=0.0999]Epoch 0:   5%|▍         | 9621/203307 [10:57:10<220:29:56,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9622/203307 [10:57:14<220:29:45,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9622/203307 [10:57:14<220:29:45,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9623/203307 [10:57:18<220:29:36,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9623/203307 [10:57:18<220:29:36,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9624/203307 [10:57:21<220:29:24,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9624/203307 [10:57:21<220:29:24,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9625/203307 [10:57:25<220:29:12,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9625/203307 [10:57:25<220:29:13,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9626/203307 [10:57:29<220:29:15,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9626/203307 [10:57:29<220:29:15,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9627/203307 [10:57:34<220:29:15,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9627/203307 [10:57:34<220:29:15,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9628/203307 [10:57:37<220:29:03,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9628/203307 [10:57:37<220:29:03,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9629/203307 [10:57:42<220:29:04,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9629/203307 [10:57:42<220:29:04,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9630/203307 [10:57:45<220:28:53,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9630/203307 [10:57:45<220:28:53,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9631/203307 [10:57:49<220:28:41,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9631/203307 [10:57:49<220:28:41,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9632/203307 [10:57:53<220:28:31,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9632/203307 [10:57:53<220:28:31,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9633/203307 [10:57:57<220:28:20,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9633/203307 [10:57:57<220:28:20,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9634/203307 [10:58:01<220:28:24,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9634/203307 [10:58:01<220:28:24,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9635/203307 [10:58:05<220:28:14,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9635/203307 [10:58:05<220:28:14,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9636/203307 [10:58:09<220:28:15,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9636/203307 [10:58:09<220:28:15,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9637/203307 [10:58:13<220:28:03,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9637/203307 [10:58:13<220:28:04,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9638/203307 [10:58:18<220:28:09,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9638/203307 [10:58:18<220:28:09,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9639/203307 [10:58:22<220:27:59,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9639/203307 [10:58:22<220:27:59,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9640/203307 [10:58:25<220:27:48,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9640/203307 [10:58:25<220:27:48,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9641/203307 [10:58:29<220:27:38,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   5%|▍         | 9641/203307 [10:58:29<220:27:38,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9642/203307 [10:58:34<220:27:41,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9642/203307 [10:58:34<220:27:42,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9643/203307 [10:58:37<220:27:30,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9643/203307 [10:58:37<220:27:30,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9644/203307 [10:58:42<220:27:32,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9644/203307 [10:58:42<220:27:32,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9645/203307 [10:58:46<220:27:30,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9645/203307 [10:58:46<220:27:30,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9646/203307 [10:58:50<220:27:18,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9646/203307 [10:58:50<220:27:18,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9647/203307 [10:58:54<220:27:19,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9647/203307 [10:58:54<220:27:19,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9648/203307 [10:58:58<220:27:07,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9648/203307 [10:58:58<220:27:07,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9649/203307 [10:59:01<220:26:55,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9649/203307 [10:59:01<220:26:55,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9650/203307 [10:59:05<220:26:45,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9650/203307 [10:59:05<220:26:45,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9651/203307 [10:59:10<220:26:48,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9651/203307 [10:59:10<220:26:48,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9652/203307 [10:59:14<220:26:47,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9652/203307 [10:59:14<220:26:48,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9653/203307 [10:59:18<220:26:36,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9653/203307 [10:59:18<220:26:36,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9654/203307 [10:59:22<220:26:33,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9654/203307 [10:59:22<220:26:33,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9655/203307 [10:59:26<220:26:35,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9655/203307 [10:59:26<220:26:35,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9656/203307 [10:59:30<220:26:24,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9656/203307 [10:59:30<220:26:24,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9657/203307 [10:59:34<220:26:12,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9657/203307 [10:59:34<220:26:13,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9658/203307 [10:59:37<220:26:01,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9658/203307 [10:59:37<220:26:01,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9659/203307 [10:59:42<220:26:03,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9659/203307 [10:59:42<220:26:03,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9660/203307 [10:59:46<220:25:53,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9660/203307 [10:59:46<220:25:53,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9661/203307 [10:59:50<220:25:54,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9661/203307 [10:59:50<220:25:54,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9662/203307 [10:59:54<220:25:42,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9662/203307 [10:59:54<220:25:42,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9663/203307 [10:59:58<220:25:41,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9663/203307 [10:59:58<220:25:41,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9664/203307 [11:00:02<220:25:42,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9664/203307 [11:00:02<220:25:43,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9665/203307 [11:00:06<220:25:32,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9665/203307 [11:00:06<220:25:32,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9666/203307 [11:00:10<220:25:20,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9666/203307 [11:00:10<220:25:21,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9667/203307 [11:00:14<220:25:24,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9667/203307 [11:00:14<220:25:24,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9668/203307 [11:00:18<220:25:14,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9668/203307 [11:00:18<220:25:14,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9669/203307 [11:00:22<220:25:15,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9669/203307 [11:00:22<220:25:15,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9670/203307 [11:00:26<220:25:05,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9670/203307 [11:00:26<220:25:05,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9671/203307 [11:00:30<220:24:54,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9671/203307 [11:00:30<220:24:54,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9672/203307 [11:00:34<220:24:52,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9672/203307 [11:00:34<220:24:53,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9673/203307 [11:00:39<220:24:55,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9673/203307 [11:00:39<220:24:55,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9674/203307 [11:00:42<220:24:42,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9674/203307 [11:00:42<220:24:42,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9675/203307 [11:00:46<220:24:31,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9675/203307 [11:00:46<220:24:31,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9676/203307 [11:00:51<220:24:37,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9676/203307 [11:00:51<220:24:37,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9677/203307 [11:00:55<220:24:37,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9677/203307 [11:00:55<220:24:37,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9678/203307 [11:00:59<220:24:26,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9678/203307 [11:00:59<220:24:26,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9679/203307 [11:01:02<220:24:14,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9679/203307 [11:01:02<220:24:14,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9680/203307 [11:01:06<220:24:02,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9680/203307 [11:01:06<220:24:03,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9681/203307 [11:01:11<220:24:07,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:   5%|▍         | 9681/203307 [11:01:11<220:24:07,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9682/203307 [11:01:14<220:23:54,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9682/203307 [11:01:14<220:23:54,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9683/203307 [11:01:18<220:23:44,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9683/203307 [11:01:18<220:23:44,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9684/203307 [11:01:23<220:23:47,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9684/203307 [11:01:23<220:23:48,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9685/203307 [11:01:26<220:23:37,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9685/203307 [11:01:26<220:23:38,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9686/203307 [11:01:31<220:23:39,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9686/203307 [11:01:31<220:23:39,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9687/203307 [11:01:34<220:23:26,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9687/203307 [11:01:34<220:23:26,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9688/203307 [11:01:38<220:23:15,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9688/203307 [11:01:38<220:23:15,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9689/203307 [11:01:42<220:23:03,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9689/203307 [11:01:42<220:23:03,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9690/203307 [11:01:46<220:23:06,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9690/203307 [11:01:46<220:23:06,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9691/203307 [11:01:50<220:22:54,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9691/203307 [11:01:50<220:22:55,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9692/203307 [11:01:55<220:22:59,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9692/203307 [11:01:55<220:22:59,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9693/203307 [11:01:58<220:22:47,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9693/203307 [11:01:58<220:22:47,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9694/203307 [11:02:03<220:22:48,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9694/203307 [11:02:03<220:22:48,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9695/203307 [11:02:06<220:22:38,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9695/203307 [11:02:06<220:22:38,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9696/203307 [11:02:10<220:22:25,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9696/203307 [11:02:10<220:22:26,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9697/203307 [11:02:14<220:22:14,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9697/203307 [11:02:14<220:22:14,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9698/203307 [11:02:18<220:22:04,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9698/203307 [11:02:18<220:22:05,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9699/203307 [11:02:22<220:22:08,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9699/203307 [11:02:22<220:22:08,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9700/203307 [11:02:26<220:21:58,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9700/203307 [11:02:26<220:21:58,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9701/203307 [11:02:30<220:21:59,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   5%|▍         | 9701/203307 [11:02:30<220:21:59,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9702/203307 [11:02:35<220:22:00,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9702/203307 [11:02:35<220:22:00,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9703/203307 [11:02:38<220:21:50,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9703/203307 [11:02:38<220:21:50,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9704/203307 [11:02:42<220:21:39,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9704/203307 [11:02:42<220:21:39,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9705/203307 [11:02:46<220:21:27,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9705/203307 [11:02:46<220:21:28,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9706/203307 [11:02:50<220:21:16,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9706/203307 [11:02:50<220:21:16,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9707/203307 [11:02:54<220:21:19,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9707/203307 [11:02:54<220:21:19,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9708/203307 [11:02:58<220:21:18,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9708/203307 [11:02:58<220:21:18,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9709/203307 [11:03:03<220:21:19,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9709/203307 [11:03:03<220:21:19,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9710/203307 [11:03:06<220:21:07,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9710/203307 [11:03:06<220:21:07,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9711/203307 [11:03:11<220:21:07,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9711/203307 [11:03:11<220:21:07,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9712/203307 [11:03:14<220:20:54,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9712/203307 [11:03:14<220:20:54,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9713/203307 [11:03:18<220:20:43,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9713/203307 [11:03:18<220:20:43,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9714/203307 [11:03:22<220:20:31,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9714/203307 [11:03:22<220:20:32,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9715/203307 [11:03:26<220:20:19,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9715/203307 [11:03:26<220:20:19,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9716/203307 [11:03:30<220:20:23,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9716/203307 [11:03:30<220:20:23,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9717/203307 [11:03:35<220:20:28,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9717/203307 [11:03:35<220:20:28,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9718/203307 [11:03:38<220:20:16,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9718/203307 [11:03:38<220:20:16,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9719/203307 [11:03:43<220:20:17,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9719/203307 [11:03:43<220:20:17,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9720/203307 [11:03:46<220:20:05,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9720/203307 [11:03:46<220:20:06,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9721/203307 [11:03:50<220:19:54,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▍         | 9721/203307 [11:03:50<220:19:54,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9722/203307 [11:03:54<220:19:44,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9722/203307 [11:03:54<220:19:45,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9723/203307 [11:03:58<220:19:32,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9723/203307 [11:03:58<220:19:33,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9724/203307 [11:04:01<220:19:20,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9724/203307 [11:04:01<220:19:21,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9725/203307 [11:04:06<220:19:25,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9725/203307 [11:04:06<220:19:25,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9726/203307 [11:04:10<220:19:27,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9726/203307 [11:04:10<220:19:27,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9727/203307 [11:04:14<220:19:26,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9727/203307 [11:04:14<220:19:26,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9728/203307 [11:04:18<220:19:15,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9728/203307 [11:04:18<220:19:15,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9729/203307 [11:04:22<220:19:04,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9729/203307 [11:04:22<220:19:04,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9730/203307 [11:04:26<220:18:52,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9730/203307 [11:04:26<220:18:52,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9731/203307 [11:04:29<220:18:42,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9731/203307 [11:04:29<220:18:42,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9732/203307 [11:04:33<220:18:31,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9732/203307 [11:04:33<220:18:31,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9733/203307 [11:04:38<220:18:32,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9733/203307 [11:04:38<220:18:32,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9734/203307 [11:04:42<220:18:35,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9734/203307 [11:04:42<220:18:35,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9735/203307 [11:04:46<220:18:35,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9735/203307 [11:04:46<220:18:35,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9736/203307 [11:04:51<220:18:36,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9736/203307 [11:04:51<220:18:36,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9737/203307 [11:04:54<220:18:24,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9737/203307 [11:04:54<220:18:24,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9738/203307 [11:04:58<220:18:12,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9738/203307 [11:04:58<220:18:13,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9739/203307 [11:05:02<220:18:01,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9739/203307 [11:05:02<220:18:01,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9740/203307 [11:05:06<220:17:51,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9740/203307 [11:05:06<220:17:51,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9741/203307 [11:05:09<220:17:39,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   5%|▍         | 9741/203307 [11:05:09<220:17:39,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9742/203307 [11:05:14<220:17:45,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9742/203307 [11:05:14<220:17:45,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9743/203307 [11:05:18<220:17:35,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9743/203307 [11:05:18<220:17:35,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9744/203307 [11:05:22<220:17:37,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9744/203307 [11:05:22<220:17:37,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9745/203307 [11:05:26<220:17:25,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9745/203307 [11:05:26<220:17:25,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9746/203307 [11:05:30<220:17:13,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9746/203307 [11:05:30<220:17:14,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9747/203307 [11:05:33<220:17:02,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9747/203307 [11:05:33<220:17:02,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9748/203307 [11:05:37<220:16:50,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9748/203307 [11:05:37<220:16:51,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9749/203307 [11:05:41<220:16:39,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9749/203307 [11:05:41<220:16:39,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9750/203307 [11:05:45<220:16:28,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9750/203307 [11:05:45<220:16:29,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9751/203307 [11:05:49<220:16:32,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9751/203307 [11:05:49<220:16:33,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9752/203307 [11:05:53<220:16:32,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9752/203307 [11:05:53<220:16:33,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9753/203307 [11:05:58<220:16:30,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9753/203307 [11:05:58<220:16:31,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9754/203307 [11:06:01<220:16:20,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9754/203307 [11:06:01<220:16:20,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9755/203307 [11:06:05<220:16:06,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9755/203307 [11:06:05<220:16:06,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9756/203307 [11:06:09<220:15:55,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9756/203307 [11:06:09<220:15:56,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9757/203307 [11:06:12<220:15:44,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9757/203307 [11:06:12<220:15:45,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9758/203307 [11:06:16<220:15:33,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9758/203307 [11:06:16<220:15:33,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9759/203307 [11:06:21<220:15:37,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9759/203307 [11:06:21<220:15:37,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9760/203307 [11:06:24<220:15:26,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9760/203307 [11:06:24<220:15:26,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9761/203307 [11:06:29<220:15:30,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9761/203307 [11:06:29<220:15:30,  0.24it/s, v_num=t5e6, training/loss=0.098] Epoch 0:   5%|▍         | 9762/203307 [11:06:33<220:15:29,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9762/203307 [11:06:33<220:15:30,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9763/203307 [11:06:37<220:15:18,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9763/203307 [11:06:37<220:15:18,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9764/203307 [11:06:41<220:15:07,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9764/203307 [11:06:41<220:15:08,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9765/203307 [11:06:44<220:14:57,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9765/203307 [11:06:44<220:14:57,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9766/203307 [11:06:48<220:14:46,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9766/203307 [11:06:48<220:14:47,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9767/203307 [11:06:53<220:14:50,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9767/203307 [11:06:53<220:14:51,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9768/203307 [11:06:57<220:14:53,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9768/203307 [11:06:57<220:14:53,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9769/203307 [11:07:01<220:14:52,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9769/203307 [11:07:01<220:14:52,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9770/203307 [11:07:05<220:14:42,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9770/203307 [11:07:05<220:14:42,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9771/203307 [11:07:09<220:14:39,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9771/203307 [11:07:09<220:14:40,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9772/203307 [11:07:13<220:14:28,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9772/203307 [11:07:13<220:14:28,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9773/203307 [11:07:17<220:14:18,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9773/203307 [11:07:17<220:14:18,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9774/203307 [11:07:21<220:14:08,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9774/203307 [11:07:21<220:14:08,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9775/203307 [11:07:25<220:13:58,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9775/203307 [11:07:25<220:13:58,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9776/203307 [11:07:29<220:14:04,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9776/203307 [11:07:29<220:14:04,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9777/203307 [11:07:34<220:14:08,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9777/203307 [11:07:34<220:14:08,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9778/203307 [11:07:37<220:13:56,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9778/203307 [11:07:37<220:13:57,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9779/203307 [11:07:41<220:13:46,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9779/203307 [11:07:41<220:13:46,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9780/203307 [11:07:45<220:13:46,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9780/203307 [11:07:45<220:13:47,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9781/203307 [11:07:49<220:13:35,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:   5%|▍         | 9781/203307 [11:07:49<220:13:35,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9782/203307 [11:07:53<220:13:24,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9782/203307 [11:07:53<220:13:24,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9783/203307 [11:07:57<220:13:13,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9783/203307 [11:07:57<220:13:13,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9784/203307 [11:08:01<220:13:15,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9784/203307 [11:08:01<220:13:15,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9785/203307 [11:08:05<220:13:16,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9785/203307 [11:08:05<220:13:16,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9786/203307 [11:08:10<220:13:18,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9786/203307 [11:08:10<220:13:18,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9787/203307 [11:08:13<220:13:05,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9787/203307 [11:08:14<220:13:05,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9788/203307 [11:08:17<220:12:53,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9788/203307 [11:08:17<220:12:54,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9789/203307 [11:08:21<220:12:52,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9789/203307 [11:08:21<220:12:52,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9790/203307 [11:08:25<220:12:39,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9790/203307 [11:08:25<220:12:39,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9791/203307 [11:08:29<220:12:26,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9791/203307 [11:08:29<220:12:26,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9792/203307 [11:08:33<220:12:29,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9792/203307 [11:08:33<220:12:30,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9793/203307 [11:08:37<220:12:17,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9793/203307 [11:08:37<220:12:17,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9794/203307 [11:08:41<220:12:19,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9794/203307 [11:08:41<220:12:19,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9795/203307 [11:08:45<220:12:07,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9795/203307 [11:08:45<220:12:07,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9796/203307 [11:08:49<220:11:54,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9796/203307 [11:08:49<220:11:54,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9797/203307 [11:08:52<220:11:44,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9797/203307 [11:08:52<220:11:44,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9798/203307 [11:08:57<220:11:41,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9798/203307 [11:08:57<220:11:41,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9799/203307 [11:09:00<220:11:28,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9799/203307 [11:09:00<220:11:29,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9800/203307 [11:09:04<220:11:17,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9800/203307 [11:09:04<220:11:17,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9801/203307 [11:09:08<220:11:19,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   5%|▍         | 9801/203307 [11:09:08<220:11:19,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9802/203307 [11:09:13<220:11:19,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9802/203307 [11:09:13<220:11:19,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9803/203307 [11:09:17<220:11:21,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9803/203307 [11:09:17<220:11:21,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9804/203307 [11:09:21<220:11:11,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9804/203307 [11:09:21<220:11:11,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9805/203307 [11:09:25<220:10:59,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9805/203307 [11:09:25<220:10:59,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9806/203307 [11:09:28<220:10:49,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9806/203307 [11:09:28<220:10:49,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9807/203307 [11:09:33<220:10:47,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9807/203307 [11:09:33<220:10:47,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9808/203307 [11:09:36<220:10:35,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9808/203307 [11:09:36<220:10:35,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9809/203307 [11:09:41<220:10:37,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9809/203307 [11:09:41<220:10:37,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9810/203307 [11:09:44<220:10:27,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9810/203307 [11:09:44<220:10:27,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9811/203307 [11:09:49<220:10:31,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9811/203307 [11:09:49<220:10:31,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9812/203307 [11:09:53<220:10:20,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9812/203307 [11:09:53<220:10:20,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9813/203307 [11:09:57<220:10:09,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9813/203307 [11:09:57<220:10:09,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9814/203307 [11:10:00<220:09:58,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9814/203307 [11:10:00<220:09:59,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9815/203307 [11:10:04<220:09:48,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9815/203307 [11:10:04<220:09:48,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9816/203307 [11:10:08<220:09:45,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9816/203307 [11:10:08<220:09:45,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9817/203307 [11:10:13<220:09:48,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9817/203307 [11:10:13<220:09:48,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9818/203307 [11:10:16<220:09:36,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9818/203307 [11:10:16<220:09:36,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9819/203307 [11:10:21<220:09:37,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9819/203307 [11:10:21<220:09:37,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9820/203307 [11:10:25<220:09:39,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9820/203307 [11:10:25<220:09:40,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9821/203307 [11:10:29<220:09:29,  0.24it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   5%|▍         | 9821/203307 [11:10:29<220:09:29,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9822/203307 [11:10:33<220:09:17,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9822/203307 [11:10:33<220:09:17,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9823/203307 [11:10:36<220:09:05,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9823/203307 [11:10:36<220:09:05,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9824/203307 [11:10:40<220:08:54,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9824/203307 [11:10:40<220:08:54,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9825/203307 [11:10:44<220:08:53,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9825/203307 [11:10:44<220:08:53,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9826/203307 [11:10:49<220:08:54,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9826/203307 [11:10:49<220:08:54,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9827/203307 [11:10:53<220:08:53,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9827/203307 [11:10:53<220:08:53,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9828/203307 [11:10:57<220:08:40,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9828/203307 [11:10:57<220:08:41,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9829/203307 [11:11:01<220:08:42,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9829/203307 [11:11:01<220:08:42,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9830/203307 [11:11:05<220:08:30,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9830/203307 [11:11:05<220:08:30,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9831/203307 [11:11:08<220:08:20,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9831/203307 [11:11:08<220:08:20,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9832/203307 [11:11:12<220:08:08,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9832/203307 [11:11:12<220:08:08,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9833/203307 [11:11:16<220:07:57,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9833/203307 [11:11:16<220:07:57,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9834/203307 [11:11:20<220:07:59,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9834/203307 [11:11:20<220:07:59,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9835/203307 [11:11:24<220:07:47,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9835/203307 [11:11:24<220:07:47,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9836/203307 [11:11:28<220:07:47,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9836/203307 [11:11:28<220:07:47,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9837/203307 [11:11:33<220:07:47,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9837/203307 [11:11:33<220:07:47,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9838/203307 [11:11:36<220:07:34,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9838/203307 [11:11:36<220:07:34,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9839/203307 [11:11:40<220:07:21,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9839/203307 [11:11:40<220:07:21,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9840/203307 [11:11:44<220:07:09,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9840/203307 [11:11:44<220:07:09,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9841/203307 [11:11:47<220:06:56,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   5%|▍         | 9841/203307 [11:11:47<220:06:56,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9842/203307 [11:11:52<220:06:58,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9842/203307 [11:11:52<220:06:58,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9843/203307 [11:11:56<220:06:55,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9843/203307 [11:11:56<220:06:56,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9844/203307 [11:12:00<220:06:53,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9844/203307 [11:12:00<220:06:53,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9845/203307 [11:12:04<220:06:40,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9845/203307 [11:12:04<220:06:40,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9846/203307 [11:12:08<220:06:41,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9846/203307 [11:12:08<220:06:41,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9847/203307 [11:12:12<220:06:29,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9847/203307 [11:12:12<220:06:29,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9848/203307 [11:12:15<220:06:19,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9848/203307 [11:12:15<220:06:19,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9849/203307 [11:12:19<220:06:10,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9849/203307 [11:12:19<220:06:10,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9850/203307 [11:12:23<220:06:00,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9850/203307 [11:12:23<220:06:00,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9851/203307 [11:12:27<220:06:02,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9851/203307 [11:12:27<220:06:02,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9852/203307 [11:12:32<220:06:03,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9852/203307 [11:12:32<220:06:03,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9853/203307 [11:12:36<220:05:51,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9853/203307 [11:12:36<220:05:51,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9854/203307 [11:12:39<220:05:41,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9854/203307 [11:12:39<220:05:41,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9855/203307 [11:12:44<220:05:43,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9855/203307 [11:12:44<220:05:43,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9856/203307 [11:12:47<220:05:32,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9856/203307 [11:12:47<220:05:32,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9857/203307 [11:12:51<220:05:19,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9857/203307 [11:12:51<220:05:19,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9858/203307 [11:12:55<220:05:08,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9858/203307 [11:12:55<220:05:08,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9859/203307 [11:12:59<220:05:12,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9859/203307 [11:12:59<220:05:12,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9860/203307 [11:13:03<220:05:01,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9860/203307 [11:13:03<220:05:01,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9861/203307 [11:13:08<220:05:03,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   5%|▍         | 9861/203307 [11:13:08<220:05:03,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9862/203307 [11:13:11<220:04:52,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9862/203307 [11:13:11<220:04:52,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9863/203307 [11:13:16<220:04:54,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9863/203307 [11:13:16<220:04:54,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9864/203307 [11:13:19<220:04:42,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9864/203307 [11:13:19<220:04:42,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9865/203307 [11:13:23<220:04:30,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9865/203307 [11:13:23<220:04:30,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9866/203307 [11:13:27<220:04:18,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9866/203307 [11:13:27<220:04:18,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9867/203307 [11:13:31<220:04:22,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9867/203307 [11:13:31<220:04:22,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9868/203307 [11:13:35<220:04:11,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9868/203307 [11:13:35<220:04:11,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9869/203307 [11:13:39<220:04:10,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9869/203307 [11:13:39<220:04:10,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9870/203307 [11:13:43<220:04:06,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9870/203307 [11:13:43<220:04:06,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9871/203307 [11:13:47<220:03:55,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9871/203307 [11:13:47<220:03:55,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9872/203307 [11:13:51<220:03:56,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9872/203307 [11:13:51<220:03:56,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9873/203307 [11:13:55<220:03:44,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9873/203307 [11:13:55<220:03:44,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9874/203307 [11:13:59<220:03:31,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9874/203307 [11:13:59<220:03:31,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9875/203307 [11:14:03<220:03:20,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9875/203307 [11:14:03<220:03:20,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9876/203307 [11:14:07<220:03:23,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9876/203307 [11:14:07<220:03:23,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9877/203307 [11:14:11<220:03:21,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9877/203307 [11:14:11<220:03:21,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9878/203307 [11:14:15<220:03:09,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9878/203307 [11:14:15<220:03:09,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9879/203307 [11:14:19<220:03:06,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9879/203307 [11:14:19<220:03:06,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9880/203307 [11:14:23<220:02:55,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9880/203307 [11:14:23<220:02:55,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9881/203307 [11:14:27<220:02:58,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   5%|▍         | 9881/203307 [11:14:27<220:02:58,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9882/203307 [11:14:31<220:02:47,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9882/203307 [11:14:31<220:02:47,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9883/203307 [11:14:35<220:02:35,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9883/203307 [11:14:35<220:02:35,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9884/203307 [11:14:39<220:02:36,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9884/203307 [11:14:39<220:02:36,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9885/203307 [11:14:43<220:02:26,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9885/203307 [11:14:43<220:02:26,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9886/203307 [11:14:47<220:02:25,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9886/203307 [11:14:47<220:02:25,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9887/203307 [11:14:51<220:02:14,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9887/203307 [11:14:51<220:02:14,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9888/203307 [11:14:55<220:02:11,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9888/203307 [11:14:55<220:02:11,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9889/203307 [11:14:59<220:02:12,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9889/203307 [11:14:59<220:02:12,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9890/203307 [11:15:03<220:01:59,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9890/203307 [11:15:03<220:01:59,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9891/203307 [11:15:07<220:01:46,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9891/203307 [11:15:07<220:01:46,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9892/203307 [11:15:11<220:01:49,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9892/203307 [11:15:11<220:01:50,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9893/203307 [11:15:15<220:01:37,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9893/203307 [11:15:15<220:01:37,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9894/203307 [11:15:19<220:01:37,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9894/203307 [11:15:19<220:01:37,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9895/203307 [11:15:23<220:01:25,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9895/203307 [11:15:23<220:01:25,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9896/203307 [11:15:26<220:01:13,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9896/203307 [11:15:26<220:01:13,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9897/203307 [11:15:31<220:01:11,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9897/203307 [11:15:31<220:01:11,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9898/203307 [11:15:35<220:01:12,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9898/203307 [11:15:35<220:01:13,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9899/203307 [11:15:39<220:01:00,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9899/203307 [11:15:39<220:01:00,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9900/203307 [11:15:42<220:00:48,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9900/203307 [11:15:42<220:00:48,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9901/203307 [11:15:47<220:00:50,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▍         | 9901/203307 [11:15:47<220:00:50,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9902/203307 [11:15:51<220:00:48,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9902/203307 [11:15:51<220:00:49,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9903/203307 [11:15:55<220:00:36,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9903/203307 [11:15:55<220:00:36,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9904/203307 [11:15:58<220:00:24,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9904/203307 [11:15:58<220:00:24,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9905/203307 [11:16:02<220:00:12,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9905/203307 [11:16:02<220:00:12,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9906/203307 [11:16:06<220:00:11,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9906/203307 [11:16:06<220:00:11,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9907/203307 [11:16:11<220:00:13,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9907/203307 [11:16:11<220:00:13,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9908/203307 [11:16:14<220:00:01,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9908/203307 [11:16:14<220:00:01,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9909/203307 [11:16:19<220:00:03,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9909/203307 [11:16:19<220:00:03,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9910/203307 [11:16:23<219:59:55,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9910/203307 [11:16:23<219:59:55,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9911/203307 [11:16:27<219:59:55,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9911/203307 [11:16:27<219:59:56,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9912/203307 [11:16:31<219:59:44,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9912/203307 [11:16:31<219:59:45,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9913/203307 [11:16:35<219:59:33,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9913/203307 [11:16:35<219:59:33,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9914/203307 [11:16:38<219:59:21,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9914/203307 [11:16:38<219:59:21,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9915/203307 [11:16:43<219:59:23,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9915/203307 [11:16:43<219:59:23,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9916/203307 [11:16:46<219:59:12,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9916/203307 [11:16:46<219:59:13,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9917/203307 [11:16:51<219:59:16,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9917/203307 [11:16:51<219:59:16,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9918/203307 [11:16:55<219:59:05,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9918/203307 [11:16:55<219:59:05,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9919/203307 [11:16:59<219:59:05,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9919/203307 [11:16:59<219:59:06,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9920/203307 [11:17:03<219:58:54,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9920/203307 [11:17:03<219:58:54,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9921/203307 [11:17:06<219:58:43,  0.24it/s, v_num=t5e6, training/loss=0.0904]Epoch 0:   5%|▍         | 9921/203307 [11:17:06<219:58:43,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9922/203307 [11:17:10<219:58:32,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9922/203307 [11:17:10<219:58:33,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9923/203307 [11:17:14<219:58:22,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9923/203307 [11:17:14<219:58:22,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9924/203307 [11:17:18<219:58:25,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9924/203307 [11:17:18<219:58:25,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9925/203307 [11:17:22<219:58:15,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9925/203307 [11:17:22<219:58:15,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9926/203307 [11:17:27<219:58:18,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9926/203307 [11:17:27<219:58:19,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9927/203307 [11:17:31<219:58:19,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9927/203307 [11:17:31<219:58:19,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9928/203307 [11:17:35<219:58:10,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9928/203307 [11:17:35<219:58:10,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9929/203307 [11:17:39<219:58:00,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9929/203307 [11:17:39<219:58:00,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9930/203307 [11:17:42<219:57:51,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9930/203307 [11:17:42<219:57:51,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9931/203307 [11:17:46<219:57:40,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9931/203307 [11:17:46<219:57:40,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9932/203307 [11:17:50<219:57:29,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9932/203307 [11:17:50<219:57:29,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9933/203307 [11:17:54<219:57:32,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9933/203307 [11:17:54<219:57:32,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9934/203307 [11:17:59<219:57:33,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9934/203307 [11:17:59<219:57:33,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9935/203307 [11:18:03<219:57:23,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9935/203307 [11:18:03<219:57:23,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9936/203307 [11:18:07<219:57:24,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9936/203307 [11:18:07<219:57:24,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9937/203307 [11:18:11<219:57:13,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9937/203307 [11:18:11<219:57:13,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9938/203307 [11:18:14<219:57:02,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9938/203307 [11:18:14<219:57:02,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9939/203307 [11:18:18<219:56:52,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9939/203307 [11:18:18<219:56:52,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9940/203307 [11:18:22<219:56:42,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9940/203307 [11:18:22<219:56:42,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9941/203307 [11:18:26<219:56:44,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▍         | 9941/203307 [11:18:26<219:56:44,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9942/203307 [11:18:31<219:56:50,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9942/203307 [11:18:31<219:56:50,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9943/203307 [11:18:35<219:56:40,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9943/203307 [11:18:35<219:56:40,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9944/203307 [11:18:39<219:56:41,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9944/203307 [11:18:39<219:56:41,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9945/203307 [11:18:43<219:56:31,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9945/203307 [11:18:43<219:56:31,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9946/203307 [11:18:47<219:56:19,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9946/203307 [11:18:47<219:56:19,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9947/203307 [11:18:50<219:56:07,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9947/203307 [11:18:50<219:56:07,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9948/203307 [11:18:54<219:55:57,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9948/203307 [11:18:54<219:55:57,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9949/203307 [11:18:58<219:55:47,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9949/203307 [11:18:58<219:55:47,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9950/203307 [11:19:02<219:55:52,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9950/203307 [11:19:02<219:55:52,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9951/203307 [11:19:07<219:55:55,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9951/203307 [11:19:07<219:55:55,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9952/203307 [11:19:11<219:55:55,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9952/203307 [11:19:11<219:55:55,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9953/203307 [11:19:15<219:55:44,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9953/203307 [11:19:15<219:55:44,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9954/203307 [11:19:19<219:55:31,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9954/203307 [11:19:19<219:55:31,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9955/203307 [11:19:22<219:55:20,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9955/203307 [11:19:22<219:55:21,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9956/203307 [11:19:26<219:55:11,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9956/203307 [11:19:26<219:55:11,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9957/203307 [11:19:30<219:55:00,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9957/203307 [11:19:30<219:55:01,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9958/203307 [11:19:34<219:54:49,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9958/203307 [11:19:34<219:54:49,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9959/203307 [11:19:38<219:54:53,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9959/203307 [11:19:38<219:54:53,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9960/203307 [11:19:42<219:54:52,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9960/203307 [11:19:42<219:54:52,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9961/203307 [11:19:47<219:54:52,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:   5%|▍         | 9961/203307 [11:19:47<219:54:52,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9962/203307 [11:19:50<219:54:41,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9962/203307 [11:19:50<219:54:41,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9963/203307 [11:19:54<219:54:29,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9963/203307 [11:19:54<219:54:29,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9964/203307 [11:19:58<219:54:17,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9964/203307 [11:19:58<219:54:17,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9965/203307 [11:20:02<219:54:06,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9965/203307 [11:20:02<219:54:06,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9966/203307 [11:20:05<219:53:55,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9966/203307 [11:20:05<219:53:56,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9967/203307 [11:20:10<219:53:59,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9967/203307 [11:20:10<219:53:59,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9968/203307 [11:20:14<219:53:48,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9968/203307 [11:20:14<219:53:48,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9969/203307 [11:20:18<219:53:49,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9969/203307 [11:20:18<219:53:49,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9970/203307 [11:20:22<219:53:38,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9970/203307 [11:20:22<219:53:38,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9971/203307 [11:20:25<219:53:27,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9971/203307 [11:20:25<219:53:27,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9972/203307 [11:20:29<219:53:17,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9972/203307 [11:20:29<219:53:17,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9973/203307 [11:20:33<219:53:05,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9973/203307 [11:20:33<219:53:06,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9974/203307 [11:20:37<219:52:55,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9974/203307 [11:20:37<219:52:55,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9975/203307 [11:20:40<219:52:44,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9975/203307 [11:20:40<219:52:45,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9976/203307 [11:20:45<219:52:49,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9976/203307 [11:20:45<219:52:49,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9977/203307 [11:20:49<219:52:47,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9977/203307 [11:20:49<219:52:48,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9978/203307 [11:20:53<219:52:44,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9978/203307 [11:20:53<219:52:44,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9979/203307 [11:20:57<219:52:32,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9979/203307 [11:20:57<219:52:33,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9980/203307 [11:21:01<219:52:21,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9980/203307 [11:21:01<219:52:21,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9981/203307 [11:21:04<219:52:09,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   5%|▍         | 9981/203307 [11:21:04<219:52:10,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9982/203307 [11:21:08<219:51:58,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9982/203307 [11:21:08<219:51:58,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9983/203307 [11:21:12<219:51:46,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9983/203307 [11:21:12<219:51:47,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9984/203307 [11:21:16<219:51:49,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9984/203307 [11:21:16<219:51:50,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9985/203307 [11:21:21<219:51:53,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9985/203307 [11:21:21<219:51:53,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9986/203307 [11:21:25<219:51:54,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9986/203307 [11:21:25<219:51:55,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9987/203307 [11:21:29<219:51:51,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9987/203307 [11:21:29<219:51:51,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9988/203307 [11:21:33<219:51:41,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9988/203307 [11:21:33<219:51:41,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9989/203307 [11:21:37<219:51:29,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9989/203307 [11:21:37<219:51:29,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9990/203307 [11:21:41<219:51:19,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9990/203307 [11:21:41<219:51:19,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9991/203307 [11:21:44<219:51:07,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9991/203307 [11:21:44<219:51:08,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9992/203307 [11:21:49<219:51:10,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9992/203307 [11:21:49<219:51:11,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9993/203307 [11:21:53<219:51:13,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9993/203307 [11:21:53<219:51:13,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9994/203307 [11:21:58<219:51:13,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9994/203307 [11:21:58<219:51:13,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9995/203307 [11:22:01<219:51:02,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9995/203307 [11:22:01<219:51:02,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9996/203307 [11:22:05<219:51:00,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9996/203307 [11:22:05<219:51:00,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9997/203307 [11:22:09<219:50:47,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9997/203307 [11:22:09<219:50:48,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9998/203307 [11:22:13<219:50:35,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9998/203307 [11:22:13<219:50:36,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9999/203307 [11:22:17<219:50:24,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 9999/203307 [11:22:17<219:50:24,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 10000/203307 [11:22:20<219:50:13,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 10000/203307 [11:22:20<219:50:13,  0.24it/s, v_num=t5e6, training/loss=0.0917]
Validation: |          | 0/? [00:00<?, ?it/s][A
Validation:   0%|          | 0/1 [00:00<?, ?it/s][A


Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s][A[A

Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:26,  1.14it/s][A[A

Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:24,  1.15it/s][A[A

Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:23,  1.16it/s][A[A

Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:22,  1.17it/s][A[A

Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:21,  1.17it/s][A[A

Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:20,  1.17it/s][A[A

Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:19,  1.17it/s][A[A

Sampling (mamba memory):  54%|█████▍    | 108/200 [00:06<01:18,  1.17it/s][A[A

Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:17,  1.17it/s][A[A

Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:17,  1.17it/s][A[A

Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:25,  1.16it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:24,  1.15it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:24,  1.15it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:23,  1.15it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:22,  1.16it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:21,  1.16it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:20,  1.16it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:06<01:19,  1.16it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:18,  1.16it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:18,  1.15it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:17,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:26,  1.14it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:25,  1.14it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:24,  1.14it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:23,  1.15it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:22,  1.16it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:21,  1.16it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:20,  1.16it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:06<01:19,  1.15it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:18,  1.15it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:18,  1.15it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:17,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:28,  1.12it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:26,  1.13it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:25,  1.13it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:24,  1.14it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:23,  1.14it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:22,  1.14it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:21,  1.14it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:20,  1.14it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:20,  1.13it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:19,  1.13it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:18,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:28,  1.12it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:26,  1.14it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:24,  1.15it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:23,  1.15it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:23,  1.14it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:22,  1.14it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:21,  1.14it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:20,  1.14it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:20,  1.13it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:19,  1.13it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:19,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:29,  1.11it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:28,  1.11it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:27,  1.11it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:26,  1.11it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:25,  1.12it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:24,  1.12it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:23,  1.12it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:22,  1.12it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:21,  1.11it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:21,  1.11it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:20,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:28,  1.12it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:28,  1.11it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:27,  1.10it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:26,  1.10it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:26,  1.10it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:25,  1.10it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:24,  1.10it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:24,  1.09it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:23,  1.09it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:09<01:22,  1.09it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:10<01:21,  1.0Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:31,  1.08it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:29,  1.09it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:28,  1.09it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:27,  1.09it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:27,  1.09it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:26,  1.09it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:25,  1.09it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:24,  1.09it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:23,  1.08it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:09<01:23,  1.08it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:10<01:22,  1.0Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:16,  1.17it/s][A[A

Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:15,  1.17it/s][A[A

Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:14,  1.16it/s][A[A

Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:14,  1.16it/s][A[A

Sampling (mamba memory):  57%|█████▊    | 115/200 [00:12<01:13,  1.16it/s][A[A

Sampling (mamba memory):  58%|█████▊    | 116/200 [00:13<01:12,  1.16it/s][A[A

Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:11,  1.15it/s][A[A

Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:11,  1.15it/s][A[A

Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:10,  1.15it/s][A[A

Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:09,  1.14it/s][A[A

Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:09,  1.14it/s][A[A

Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:08,  1.14it/s][A[A

5it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:16,  1.15it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:15,  1.15it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:14,  1.16it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:12<01:13,  1.16it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:13<01:12,  1.15it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:12,  1.15it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:11,  1.14it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:11,  1.14it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:10,  1.14it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:09,  1.13it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:09,  1.13it/s]Sampling (mamba memory):  62%|██████▏   | 123/5it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:16,  1.15it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:16,  1.14it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:15,  1.14it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:14,  1.14it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:13<01:14,  1.13it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:13,  1.13it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:12,  1.13it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:11,  1.13it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:10,  1.13it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:10,  1.13it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:09,  1.12it/s]Sampling (mamba memory):  62%|██████▏   | 123/3it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:17,  1.13it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:16,  1.14it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:15,  1.14it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:15,  1.13it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:14,  1.13it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:13,  1.13it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:13,  1.12it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:12,  1.12it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:12,  1.11it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:11,  1.11it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:10,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 123/2it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:18,  1.11it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:18,  1.11it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:17,  1.11it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:16,  1.10it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:16,  1.10it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:15,  1.10it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:14,  1.10it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:13,  1.10it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:12,  1.10it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:11,  1.10it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:11,  1.10it/s]Sampling (mamba memory):  62%|██████▏   | 123/1it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:18,  1.11it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:17,  1.12it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:16,  1.12it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:15,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:15,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:14,  1.11it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:14,  1.11it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:13,  1.10it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:13,  1.09it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:12,  1.09it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:11,  1.09it/s]Sampling (mamba memory):  62%|██████▏   | 123/Sampling (mamba memory):  62%|██████▏   | 123/200 [00:19<01:07,  1.14it/s][A[A

9it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:20,  1.09it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:19,  1.09it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:18,  1.09it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:18,  1.09it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:17,  1.09it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:16,  1.09it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:15,  1.09it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:14,  1.09it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:13,  1.09it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:19<01:12,  1.08it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:20<01:12,  1.08it/s]Sampling (mamba memory):  62%|██████▏   | 123/8it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:11<01:21,  1.08it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:20,  1.08it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:19,  1.08it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:19,  1.07it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:18,  1.07it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:17,  1.07it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:16,  1.07it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:16,  1.07it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:14,  1.07it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:19<01:14,  1.06it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:20<01:13,  1.06it/s]Sampling (mamba memory):  62%|██████▏   | 123/Sampling (mamba memory):  62%|██████▏   | 124/200 [00:20<01:06,  1.14it/s][A[A

Sampling (mamba memory):  62%|██████▎   | 125/200 [00:21<01:06,  1.13it/s][A[A

Sampling (mamba memory):  63%|██████▎   | 126/200 [00:22<01:05,  1.13it/s][A[A

Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:04,  1.13it/s][A[A

Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:03,  1.13it/s][A[A

Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:03,  1.13it/s][A[A

Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:02,  1.12it/s][A[A

Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:01,  1.12it/s][A[A

Sampling (mamba memory):  66%|██████▌   | 132/200 [00:27<01:00,  1.12it/s][A[A

Sampling (mamba memory):  66%|██████▋   | 133/200 [00:28<00:59,  1.12it/s][A[A

Sampling (mamba memory):  67%|██████▋   | 134/200 [00:29<00:59,  1.12it/s][A[A

200 [00:20<01:08,  1.13it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:20<01:07,  1.13it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:21<01:06,  1.13it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:22<01:05,  1.13it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:04,  1.12it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:04,  1.12it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:03,  1.12it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:02,  1.12it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:01,  1.12it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:01,  1.11it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:00,  1.11it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:29<00:59,  1.11it/s]Sampling (mamba 200 [00:20<01:08,  1.12it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:07,  1.12it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:21<01:06,  1.12it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:22<01:05,  1.12it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:05,  1.12it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:04,  1.12it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:03,  1.11it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:03,  1.11it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:02,  1.10it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:01,  1.10it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:01,  1.09it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:01,  1.07it/s]Sampling (mamba Sampling (mamba memory):  68%|██████▊   | 135/200 [00:30<00:58,  1.11it/s][A[A

200 [00:20<01:09,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:09,  1.10it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:08,  1.09it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:08,  1.09it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:07,  1.08it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:06,  1.08it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:05,  1.08it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:04,  1.08it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:04,  1.08it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:03,  1.08it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:02,  1.07it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:01,  1.07it/s]Sampling (mamba 200 [00:20<01:10,  1.10it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:09,  1.09it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:09,  1.09it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:08,  1.08it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:07,  1.08it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:06,  1.08it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:05,  1.08it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:05,  1.07it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:04,  1.07it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:03,  1.07it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:02,  1.07it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:02,  1.06it/s]Sampling (mamba 200 [00:20<01:10,  1.09it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:09,  1.09it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:08,  1.09it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:07,  1.09it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:06,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:05,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:05,  1.09it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:04,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:03,  1.08it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:03,  1.08it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:02,  1.07it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:01,  1.07it/s]Sampling (mamba Sampling (mamba memory):  68%|██████▊   | 136/200 [00:31<00:57,  1.11it/s][A[A

200 [00:21<01:11,  1.08it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:22<01:10,  1.08it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:09,  1.07it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:08,  1.08it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:08,  1.07it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:07,  1.07it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:06,  1.06it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:06,  1.06it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:05,  1.05it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:04,  1.05it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:03,  1.05it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<01:03,  1.04it/s]Sampling (mamba 200 [00:21<01:12,  1.06it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:22<01:11,  1.06it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:23<01:10,  1.06it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:24<01:10,  1.06it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:25<01:09,  1.05it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:26<01:08,  1.05it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:27<01:07,  1.05it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:28<01:06,  1.05it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:29<01:05,  1.05it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:05,  1.05it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:04,  1.04it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<01:03,  1.04it/s]Sampling (mamba Sampling (mamba memory):  68%|██████▊   | 137/200 [00:32<00:56,  1.11it/s][A[A

Sampling (mamba memory):  69%|██████▉   | 138/200 [00:33<00:56,  1.10it/s][A[A

Sampling (mamba memory):  70%|██████▉   | 139/200 [00:34<00:55,  1.10it/s][A[A

Sampling (mamba memory):  70%|███████   | 140/200 [00:35<00:54,  1.09it/s][A[A

Sampling (mamba memory):  70%|███████   | 141/200 [00:36<00:54,  1.09it/s][A[A

Sampling (mamba memory):  71%|███████   | 142/200 [00:37<00:53,  1.09it/s][A[A

Sampling (mamba memory):  72%|███████▏  | 143/200 [00:37<00:52,  1.08it/s][A[A

Sampling (mamba memory):  72%|███████▏  | 144/200 [00:38<00:51,  1.08it/s][A[A

Sampling (mamba memory):  72%|███████▎  | 145/200 [00:39<00:51,  1.07it/s][A[A

memory):  68%|██████▊   | 135/200 [00:30<00:58,  1.11it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:31<00:58,  1.10it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:32<00:57,  1.10it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:33<00:56,  1.10it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:34<00:55,  1.10it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:35<00:54,  1.10it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:36<00:53,  1.10it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:37<00:52,  1.10it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:38<00:51,  1.10it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:51,  1.10it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:39<00:50,  1.09it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:31<01:00,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:59,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:58,  1.07it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:33<00:57,  1.07it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:34<00:56,  1.07it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:35<00:55,  1.07it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:36<00:54,  1.08it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:37<00:53,  1.08it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:38<00:53,  1.08it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:52,  1.07it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:51,  1.07it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  73%|███████▎  | 146/200 [00:40<00:50,  1.07it/s][A[A

memory):  68%|██████▊   | 135/200 [00:31<01:00,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:59,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:59,  1.07it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:58,  1.07it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:57,  1.07it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:56,  1.07it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:55,  1.06it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:54,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:53,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:53,  1.06it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:52,  1.05it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:31<01:00,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:59,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:58,  1.07it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:57,  1.07it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:56,  1.07it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:55,  1.07it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:54,  1.07it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:53,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:53,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:52,  1.07it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:51,  1.06it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:31<01:01,  1.06it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<01:00,  1.06it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:59,  1.06it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:58,  1.06it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:57,  1.05it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:56,  1.05it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:56,  1.05it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:55,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:54,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:53,  1.05it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:52,  1.04it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▎  | 147/200 [00:41<00:49,  1.06it/s][A[A

memory):  68%|██████▊   | 135/200 [00:32<01:02,  1.04it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:33<01:01,  1.03it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:34<01:01,  1.03it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:35<01:00,  1.03it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:36<00:58,  1.04it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:37<00:57,  1.04it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:38<00:56,  1.05it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:39<00:55,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:40<00:54,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:41<00:53,  1.05it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:42<00:52,  1.04it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▍  | 148/200 [00:42<00:48,  1.06it/s][A[A

memory):  68%|██████▊   | 135/200 [00:32<01:02,  1.04it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:33<01:01,  1.03it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:34<01:01,  1.03it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:35<01:00,  1.03it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:36<00:59,  1.03it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:37<00:58,  1.03it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:38<00:57,  1.02it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:39<00:56,  1.02it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:40<00:56,  1.02it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:41<00:55,  1.01it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:42<00:54,  1.01it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▍  | 149/200 [00:43<00:47,  1.06it/s][A[A

Sampling (mamba memory):  75%|███████▌  | 150/200 [00:44<00:46,  1.07it/s][A[A

Sampling (mamba memory):  76%|███████▌  | 151/200 [00:45<00:45,  1.07it/s][A[A

Sampling (mamba memory):  76%|███████▌  | 152/200 [00:46<00:44,  1.07it/s][A[A

Sampling (mamba memory):  76%|███████▋  | 153/200 [00:47<00:43,  1.07it/s][A[A

Sampling (mamba memory):  77%|███████▋  | 154/200 [00:48<00:43,  1.07it/s][A[A

Sampling (mamba memory):  78%|███████▊  | 155/200 [00:49<00:42,  1.06it/s][A[A

Sampling (mamba memory):  78%|███████▊  | 156/200 [00:50<00:41,  1.06it/s][A[A

 | 146/200 [00:40<00:49,  1.09it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:41<00:48,  1.09it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:42<00:47,  1.09it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:43<00:47,  1.08it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:44<00:46,  1.08it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:45<00:45,  1.07it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:46<00:44,  1.07it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:47<00:43,  1.07it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:48<00:43,  1.07it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:49<00:42,  1.07it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:50<00:41,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:51<00:40 | 146/200 [00:41<00:50,  1.06it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:49,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:49,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:48,  1.06it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:47,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:46,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:45,  1.05it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:44,  1.05it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:43,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:42,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:50<00:41,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:51<00:41Sampling (mamba memory):  78%|███████▊  | 157/200 [00:51<00:40,  1.06it/s][A[A

 | 146/200 [00:42<00:51,  1.05it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:50,  1.04it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:49,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:48,  1.05it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:47,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:46,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:45,  1.05it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:45,  1.04it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:44,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:43,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:42,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:41 | 146/200 [00:42<00:50,  1.06it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:50,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:49,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:49,  1.04it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:48,  1.03it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:47,  1.03it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:48<00:46,  1.02it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:49<00:45,  1.02it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:45,  1.02it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:44,  1.02it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:43,  1.02it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:42 | 146/200 [00:42<00:51,  1.04it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:51,  1.04it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:50,  1.04it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:48,  1.04it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:47,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:46,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:48<00:46,  1.04it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:49<00:45,  1.04it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:50<00:44,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:51<00:43,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:52<00:42,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:41Sampling (mamba memory):  79%|███████▉  | 158/200 [00:52<00:39,  1.06it/s][A[A

 | 146/200 [00:43<00:52,  1.04it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:44<00:51,  1.03it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:45<00:50,  1.03it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:49,  1.03it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:48,  1.03it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:47,  1.02it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:48<00:46,  1.02it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:49<00:46,  1.02it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:50<00:45,  1.02it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:51<00:44,  1.02it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:52<00:43,  1.02it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:53<00:42Sampling (mamba memory):  80%|███████▉  | 159/200 [00:53<00:38,  1.06it/s][A[A

 | 146/200 [00:43<00:53,  1.01it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:44<00:52,  1.01it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:45<00:51,  1.01it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:46<00:50,  1.02it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:47<00:49,  1.02it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:48<00:48,  1.01it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:49<00:47,  1.01it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:50<00:46,  1.01it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:51<00:45,  1.01it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:52<00:44,  1.01it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:53<00:43,  1.01it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:54<00:42Sampling (mamba memory):  80%|████████  | 160/200 [00:53<00:37,  1.06it/s][A[A

Sampling (mamba memory):  80%|████████  | 161/200 [00:54<00:36,  1.06it/s][A[A

Sampling (mamba memory):  81%|████████  | 162/200 [00:55<00:36,  1.05it/s][A[A

Sampling (mamba memory):  82%|████████▏ | 163/200 [00:56<00:35,  1.05it/s][A[A

Sampling (mamba memory):  82%|████████▏ | 164/200 [00:57<00:34,  1.05it/s][A[A

Sampling (mamba memory):  82%|████████▎ | 165/200 [00:58<00:33,  1.04it/s][A[A

Sampling (mamba memory):  83%|████████▎ | 166/200 [00:59<00:32,  1.04it/s][A[A

Sampling (mamba memory):  84%|████████▎ | 167/200 [01:00<00:31,  1.04it/s][A[A

,  1.06it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:52<00:39,  1.06it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:53<00:38,  1.06it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:54<00:37,  1.06it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:54<00:36,  1.05it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:55<00:36,  1.05it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:56<00:35,  1.05it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:57<00:34,  1.05it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [00:58<00:33,  1.05it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [00:59<00:32,  1.05it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:00<00:31,  1.04it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:01<00:30,  1.04it/s,  1.05it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:52<00:40,  1.04it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:53<00:39,  1.04it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:54<00:38,  1.04it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:55<00:37,  1.04it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:56<00:36,  1.03it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:57<00:35,  1.03it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:58<00:35,  1.03it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [00:59<00:34,  1.03it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:00<00:33,  1.02it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:01<00:32,  1.03it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:02<00:31,  1.02it/sSampling (mamba memory):  84%|████████▍ | 168/200 [01:01<00:30,  1.04it/s][A[A

,  1.04it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:53<00:40,  1.04it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:54<00:39,  1.03it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:55<00:38,  1.03it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:56<00:37,  1.03it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:57<00:36,  1.03it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:36,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:35,  1.02it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:34,  1.02it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:33,  1.02it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:02<00:32,  1.02it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:03<00:31,  1.02it/sSampling (mamba memory):  84%|████████▍ | 169/200 [01:02<00:29,  1.04it/s][A[A

,  1.03it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:53<00:40,  1.03it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:54<00:39,  1.03it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:55<00:38,  1.03it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:56<00:37,  1.03it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:57<00:37,  1.03it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:36,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:35,  1.02it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:34,  1.02it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:33,  1.02it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:02<00:32,  1.02it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:03<00:31,  1.02it/s,  1.02it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:53<00:41,  1.02it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:54<00:40,  1.02it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:55<00:39,  1.02it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:56<00:38,  1.01it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:57<00:37,  1.01it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:36,  1.01it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:35,  1.01it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:34,  1.01it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:33,  1.01it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:02<00:32,  1.01it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:03<00:31,  1.01it/sSampling (mamba memory):  85%|████████▌ | 170/200 [01:03<00:28,  1.04it/s][A[A

,  1.02it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:54<00:41,  1.01it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:55<00:40,  1.01it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:56<00:39,  1.01it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:57<00:38,  1.01it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:58<00:37,  1.01it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:59<00:36,  1.00it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:00<00:36,  1.00s/it]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:01<00:35,  1.01s/it]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:02<00:34,  1.01s/it]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:03<00:33,  1.01s/it]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:04<00:32,  1.01s/itSampling (mamba memory):  86%|████████▌ | 171/200 [01:04<00:27,  1.04it/s][A[A

,  1.01it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:55<00:41,  1.01it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:56<00:40,  1.00it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:57<00:39,  1.00it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:58<00:39,  1.00s/it]Sampling (mamba memory):  81%|████████  | 162/200 [00:59<00:38,  1.00s/it]Sampling (mamba memory):  82%|████████▏ | 163/200 [01:00<00:37,  1.01s/it]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:01<00:36,  1.01s/it]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:02<00:35,  1.01s/it]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:03<00:34,  1.01s/it]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:04<00:33,  1.01s/it]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:05<00:32,  1.01s/itSampling (mamba memory):  86%|████████▌ | 172/200 [01:05<00:27,  1.04it/s][A[A

Sampling (mamba memory):  86%|████████▋ | 173/200 [01:06<00:26,  1.03it/s][A[A

Sampling (mamba memory):  87%|████████▋ | 174/200 [01:07<00:25,  1.03it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 175/200 [01:08<00:24,  1.03it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 176/200 [01:09<00:23,  1.03it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 177/200 [01:10<00:22,  1.03it/s][A[A

Sampling (mamba memory):  89%|████████▉ | 178/200 [01:11<00:21,  1.03it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:02<00:29,  1.04it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:03<00:29,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:04<00:28,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:05<00:27,  1.03it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:06<00:26,  1.03it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:07<00:25,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:08<00:24,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:09<00:23,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:10<00:22,  1.02it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:11<00:21,  1.02it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:12<00:20,  1.02it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:12<00:20,  1.03it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:03<00:30,  1.02it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:04<00:29,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:05<00:28,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:06<00:27,  1.02it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:07<00:26,  1.02it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:08<00:25,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:09<00:24,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:10<00:23,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:11<00:22,  1.01it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:12<00:21,  1.01it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:13<00:20,  1.01it/s]]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:04<00:30,  1.02it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:05<00:29,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:06<00:28,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:07<00:27,  1.02it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:08<00:26,  1.01it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:09<00:25,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:10<00:24,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:11<00:23,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:12<00:22,  1.01it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:13<00:21,  1.01it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:14<00:20,  1.00it/s]Sampling (mamba memory):  90%|█████████ | 180/200 [01:13<00:19,  1.03it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:04<00:30,  1.01it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:05<00:29,  1.01it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:06<00:28,  1.01it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:07<00:27,  1.01it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:08<00:26,  1.01it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:09<00:25,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:10<00:24,  1.00it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:11<00:23,  1.00it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:12<00:22,  1.00it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:13<00:21,  1.00it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:14<00:20,  1.00it/s]]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:04<00:30,  1.01it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:05<00:29,  1.01it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:06<00:28,  1.01it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:07<00:27,  1.01it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:08<00:26,  1.00it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:09<00:26,  1.00s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:10<00:24,  1.00it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:11<00:23,  1.00it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:12<00:23,  1.00s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:13<00:22,  1.01s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:14<00:21,  1.01s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:14<00:18,  1.02it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:05<00:31,  1.01s/it]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:06<00:30,  1.01s/it]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:07<00:29,  1.02s/it]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:08<00:28,  1.02s/it]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:10<00:27,  1.03s/it]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:11<00:26,  1.03s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:12<00:25,  1.03s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:13<00:24,  1.03s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:14<00:23,  1.03s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:15<00:22,  1.03s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:16<00:21,  1.04s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:15<00:17,  1.02it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:06<00:31,  1.01s/it]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:07<00:30,  1.01s/it]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:08<00:29,  1.01s/it]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:09<00:28,  1.01s/it]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:10<00:27,  1.02s/it]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:11<00:26,  1.02s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:12<00:25,  1.02s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:13<00:24,  1.02s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:14<00:23,  1.03s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:15<00:22,  1.03s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:16<00:21,  1.03s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:16<00:16,  1.02it/s][A[A

Sampling (mamba memory):  92%|█████████▏| 184/200 [01:17<00:15,  1.02it/s][A[A

Sampling (mamba memory):  92%|█████████▎| 185/200 [01:18<00:14,  1.02it/s][A[A

Sampling (mamba memory):  93%|█████████▎| 186/200 [01:19<00:13,  1.01it/s][A[A

Sampling (mamba memory):  94%|█████████▎| 187/200 [01:20<00:12,  1.01it/s][A[A

Sampling (mamba memory):  94%|█████████▍| 188/200 [01:21<00:11,  1.01it/s][A[A

Sampling (mamba memory):  94%|█████████▍| 189/200 [01:22<00:10,  1.00it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:13<00:19,  1.02it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:14<00:18,  1.01it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:15<00:17,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:16<00:16,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:17<00:15,  1.01it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:18<00:14,  1.01it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:19<00:13,  1.01it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:20<00:12,  1.01it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:21<00:11,  1.01it/s]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:22<00:10,  1.01it/s]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:23<00Sampling (mamba memory):  95%|█████████▌| 190/200 [01:23<00:09,  1.00it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:14<00:19,  1.00it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:15<00:18,  1.00it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:16<00:17,  1.00it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:17<00:17,  1.00s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:18<00:16,  1.00s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:19<00:15,  1.00s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:20<00:14,  1.00s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:21<00:13,  1.00s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:22<00:12,  1.00s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:23<00:11,  1.00s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:24<00Sampling (mamba memory):  96%|█████████▌| 191/200 [01:24<00:08,  1.00it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:15<00:19,  1.00it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:16<00:18,  1.00it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:17<00:18,  1.00s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:18<00:17,  1.00s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:19<00:16,  1.00s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:20<00:15,  1.01s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:21<00:14,  1.01s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:22<00:13,  1.02s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:23<00:12,  1.02s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:24<00:11,  1.02s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:25<00Sampling (mamba memory):  90%|█████████ | 180/200 [01:15<00:20,  1.00s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:16<00:19,  1.00s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:17<00:18,  1.00s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:18<00:17,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:19<00:16,  1.01s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:20<00:15,  1.01s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:21<00:14,  1.01s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:22<00:13,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:23<00:12,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:24<00:11,  1.02s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:25<00Sampling (mamba memory):  90%|█████████ | 180/200 [01:15<00:20,  1.01s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:16<00:19,  1.01s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:17<00:18,  1.02s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:18<00:17,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:19<00:16,  1.02s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:20<00:15,  1.02s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:21<00:14,  1.02s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:23<00:13,  1.02s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:24<00:12,  1.02s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:25<00:11,  1.03s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:26<00Sampling (mamba memory):  96%|█████████▌| 192/200 [01:25<00:07,  1.00it/s][A[A

Sampling (mamba memory):  96%|█████████▋| 193/200 [01:26<00:07,  1.00s/it][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:17<00:20,  1.04s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:18<00:19,  1.04s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:19<00:18,  1.04s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:20<00:17,  1.04s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:21<00:16,  1.04s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:22<00:15,  1.04s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:23<00:14,  1.04s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:24<00:13,  1.04s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:25<00:12,  1.05s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:26<00:11,  1.05s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:27<00Sampling (mamba memory):  97%|█████████▋| 194/200 [01:27<00:06,  1.00s/it][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:17<00:20,  1.03s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:19<00:19,  1.03s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:20<00:18,  1.03s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:21<00:17,  1.04s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:22<00:16,  1.04s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:23<00:15,  1.04s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:24<00:14,  1.04s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:25<00:13,  1.04s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:26<00:12,  1.05s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:27<00:11,  1.05s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:28<00Sampling (mamba memory):  98%|█████████▊| 195/200 [01:28<00:05,  1.00s/it][A[A

Sampling (mamba memory):  98%|█████████▊| 196/200 [01:29<00:04,  1.01s/it][A[A

Sampling (mamba memory):  98%|█████████▊| 197/200 [01:30<00:03,  1.01s/it][A[A

Sampling (mamba memory):  99%|█████████▉| 198/200 [01:31<00:02,  1.01s/it][A[A

Sampling (mamba memory): 100%|█████████▉| 199/200 [01:32<00:01,  1.01s/it][A[A

:09,  1.00it/s]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:24<00:08,  1.00it/s]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:25<00:08,  1.00s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:26<00:07,  1.00s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:27<00:06,  1.00s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:28<00:05,  1.00s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:29<00:04,  1.00s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:30<00:03,  1.01s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:31<00:02,  1.01s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:32<00:01,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:33<00:00,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:38<00:00,  1.02it/s]
Sampling (mamba memory): 100%|██████████| 200/200 [01:33<00:00,  1.01s/it][A[ASampling (mamba memory): 100%|██████████| 200/200 [01:38<00:00,  1.02it/s]
Validation DataLoader 0:   0%|          | 0/1 [00:00<?, ?it/s][A
:10,  1.01s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:25<00:09,  1.01s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:26<00:08,  1.01s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:27<00:07,  1.01s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:28<00:06,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:29<00:05,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:30<00:04,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:31<00:03,  1.01s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:32<00:02,  1.02s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:33<00:01,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:34<00:00,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:39<00:00,  1.00it/s]
:10,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:26<00:09,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:27<00:08,  1.02s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:28<00:07,  1.02s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:29<00:06,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:30<00:05,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:31<00:04,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:32<00:03,  1.02s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:33<00:02,  1.03s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:34<00:01,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:35<00:00,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:40<00:00,  1.01s/it]
:10,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:26<00:09,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:27<00:08,  1.02s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:28<00:07,  1.02s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:29<00:06,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:30<00:05,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:31<00:04,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:32<00:03,  1.01s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:34<00:02,  1.01s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:35<00:01,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:36<00:00,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:40<00:00,  1.01s/it]
:10,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:27<00:09,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:28<00:08,  1.03s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:29<00:07,  1.03s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:30<00:06,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:31<00:05,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:32<00:04,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:33<00:03,  1.03s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:34<00:02,  1.04s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:35<00:01,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:36<00:00,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:41<00:00,  1.01s/it]
:10,  1.05s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:28<00:09,  1.05s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:29<00:08,  1.05s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:30<00:07,  1.05s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:31<00:06,  1.05s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:33<00:05,  1.06s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:34<00:04,  1.06s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:35<00:03,  1.05s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:36<00:02,  1.05s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:37<00:01,  1.06s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:38<00:00,  1.06s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:43<00:00,  1.03s/it]
:10,  1.05s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:29<00:09,  1.05s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:30<00:08,  1.05s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:31<00:07,  1.05s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:32<00:06,  1.05s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:33<00:05,  1.05s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:34<00:04,  1.05s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:35<00:03,  1.04s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:36<00:02,  1.04s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:37<00:01,  1.05s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:38<00:00,  1.05s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:43<00:00,  1.04s/it]
Validation DataLoader 0: 100%|██████████| 1/1 [01:38<00:00,  0.01it/s][A
                                                                      [AEpoch 0:   5%|▍         | 10000/203307 [11:24:16<220:27:38,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 10001/203307 [11:24:21<220:27:45,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   5%|▍         | 10001/203307 [11:24:21<220:27:45,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10002/203307 [11:24:25<220:27:44,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10002/203307 [11:24:25<220:27:44,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10003/203307 [11:24:29<220:27:34,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10003/203307 [11:24:29<220:27:34,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10004/203307 [11:24:33<220:27:32,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10004/203307 [11:24:33<220:27:32,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10005/203307 [11:24:37<220:27:22,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10005/203307 [11:24:37<220:27:22,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10006/203307 [11:24:41<220:27:13,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10006/203307 [11:24:41<220:27:14,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10007/203307 [11:24:45<220:27:00,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10007/203307 [11:24:45<220:27:00,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10008/203307 [11:24:49<220:26:59,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10008/203307 [11:24:49<220:26:59,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10009/203307 [11:24:53<220:26:51,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10009/203307 [11:24:53<220:26:51,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10010/203307 [11:24:57<220:26:56,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10010/203307 [11:24:57<220:26:56,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10011/203307 [11:25:01<220:26:46,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10011/203307 [11:25:01<220:26:46,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10012/203307 [11:25:06<220:26:51,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10012/203307 [11:25:06<220:26:51,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10013/203307 [11:25:09<220:26:33,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10013/203307 [11:25:09<220:26:33,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10014/203307 [11:25:13<220:26:20,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10014/203307 [11:25:13<220:26:20,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10015/203307 [11:25:17<220:26:10,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10015/203307 [11:25:17<220:26:10,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10016/203307 [11:25:21<220:26:02,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10016/203307 [11:25:21<220:26:02,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10017/203307 [11:25:25<220:26:09,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10017/203307 [11:25:25<220:26:09,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10018/203307 [11:25:30<220:26:10,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10018/203307 [11:25:30<220:26:10,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10019/203307 [11:25:33<220:25:58,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10019/203307 [11:25:33<220:25:59,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10020/203307 [11:25:38<220:26:00,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10020/203307 [11:25:38<220:26:00,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10021/203307 [11:25:42<220:25:58,  0.24it/s, v_num=t5e6, training/loss=0.0958]Epoch 0:   5%|▍         | 10021/203307 [11:25:42<220:25:58,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10022/203307 [11:25:46<220:25:47,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10022/203307 [11:25:46<220:25:47,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10023/203307 [11:25:49<220:25:35,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10023/203307 [11:25:49<220:25:35,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10024/203307 [11:25:53<220:25:23,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10024/203307 [11:25:53<220:25:23,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10025/203307 [11:25:57<220:25:12,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10025/203307 [11:25:57<220:25:12,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10026/203307 [11:26:01<220:25:15,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10026/203307 [11:26:01<220:25:15,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10027/203307 [11:26:06<220:25:17,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10027/203307 [11:26:06<220:25:17,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10028/203307 [11:26:10<220:25:18,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10028/203307 [11:26:10<220:25:18,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10029/203307 [11:26:14<220:25:08,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10029/203307 [11:26:14<220:25:08,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10030/203307 [11:26:18<220:25:05,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10030/203307 [11:26:18<220:25:05,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10031/203307 [11:26:22<220:24:53,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10031/203307 [11:26:22<220:24:53,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10032/203307 [11:26:25<220:24:41,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10032/203307 [11:26:25<220:24:41,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10033/203307 [11:26:29<220:24:31,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10033/203307 [11:26:29<220:24:31,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10034/203307 [11:26:34<220:24:35,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10034/203307 [11:26:34<220:24:35,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10035/203307 [11:26:38<220:24:35,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10035/203307 [11:26:38<220:24:35,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10036/203307 [11:26:43<220:24:39,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10036/203307 [11:26:43<220:24:39,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10037/203307 [11:26:46<220:24:28,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10037/203307 [11:26:46<220:24:28,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10038/203307 [11:26:50<220:24:15,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10038/203307 [11:26:50<220:24:15,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10039/203307 [11:26:54<220:24:05,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10039/203307 [11:26:54<220:24:05,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10040/203307 [11:26:58<220:24:04,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10040/203307 [11:26:58<220:24:04,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10041/203307 [11:27:02<220:23:52,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▍         | 10041/203307 [11:27:02<220:23:52,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10042/203307 [11:27:05<220:23:40,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10042/203307 [11:27:05<220:23:40,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10043/203307 [11:27:10<220:23:46,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10043/203307 [11:27:10<220:23:46,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10044/203307 [11:27:14<220:23:34,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10044/203307 [11:27:14<220:23:34,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10045/203307 [11:27:18<220:23:37,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10045/203307 [11:27:18<220:23:37,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10046/203307 [11:27:22<220:23:25,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10046/203307 [11:27:22<220:23:25,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10047/203307 [11:27:26<220:23:13,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10047/203307 [11:27:26<220:23:13,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10048/203307 [11:27:30<220:23:12,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10048/203307 [11:27:30<220:23:12,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10049/203307 [11:27:34<220:23:01,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10049/203307 [11:27:34<220:23:01,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10050/203307 [11:27:37<220:22:49,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10050/203307 [11:27:37<220:22:49,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10051/203307 [11:27:41<220:22:39,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10051/203307 [11:27:41<220:22:40,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10052/203307 [11:27:46<220:22:43,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10052/203307 [11:27:46<220:22:43,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10053/203307 [11:27:50<220:22:44,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10053/203307 [11:27:50<220:22:44,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10054/203307 [11:27:54<220:22:32,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10054/203307 [11:27:54<220:22:32,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10055/203307 [11:27:57<220:22:21,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10055/203307 [11:27:57<220:22:21,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10056/203307 [11:28:01<220:22:09,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10056/203307 [11:28:01<220:22:09,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10057/203307 [11:28:05<220:22:08,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10057/203307 [11:28:05<220:22:08,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10058/203307 [11:28:09<220:21:57,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10058/203307 [11:28:09<220:21:58,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10059/203307 [11:28:13<220:21:46,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10059/203307 [11:28:13<220:21:46,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10060/203307 [11:28:17<220:21:48,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10060/203307 [11:28:17<220:21:48,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10061/203307 [11:28:21<220:21:39,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   5%|▍         | 10061/203307 [11:28:21<220:21:39,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10062/203307 [11:28:26<220:21:40,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10062/203307 [11:28:26<220:21:40,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10063/203307 [11:28:29<220:21:29,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10063/203307 [11:28:29<220:21:29,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10064/203307 [11:28:33<220:21:17,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10064/203307 [11:28:33<220:21:17,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10065/203307 [11:28:37<220:21:07,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10065/203307 [11:28:37<220:21:07,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10066/203307 [11:28:41<220:20:57,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10066/203307 [11:28:41<220:20:57,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10067/203307 [11:28:45<220:20:55,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10067/203307 [11:28:45<220:20:55,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10068/203307 [11:28:49<220:20:57,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10068/203307 [11:28:49<220:20:57,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10069/203307 [11:28:54<220:20:59,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10069/203307 [11:28:54<220:20:59,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10070/203307 [11:28:57<220:20:48,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10070/203307 [11:28:57<220:20:49,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10071/203307 [11:29:02<220:20:52,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10071/203307 [11:29:02<220:20:52,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10072/203307 [11:29:06<220:20:41,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10072/203307 [11:29:06<220:20:41,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10073/203307 [11:29:09<220:20:30,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10073/203307 [11:29:09<220:20:30,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10074/203307 [11:29:13<220:20:18,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10074/203307 [11:29:13<220:20:19,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10075/203307 [11:29:17<220:20:08,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10075/203307 [11:29:17<220:20:09,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10076/203307 [11:29:21<220:20:05,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10076/203307 [11:29:21<220:20:05,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10077/203307 [11:29:25<220:20:04,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10077/203307 [11:29:25<220:20:04,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10078/203307 [11:29:30<220:20:05,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10078/203307 [11:29:30<220:20:05,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10079/203307 [11:29:34<220:20:07,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10079/203307 [11:29:34<220:20:07,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10080/203307 [11:29:38<220:19:54,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10080/203307 [11:29:38<220:19:54,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10081/203307 [11:29:42<220:19:43,  0.24it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   5%|▍         | 10081/203307 [11:29:42<220:19:43,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10082/203307 [11:29:45<220:19:30,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10082/203307 [11:29:45<220:19:30,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10083/203307 [11:29:49<220:19:19,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10083/203307 [11:29:49<220:19:19,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10084/203307 [11:29:53<220:19:07,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10084/203307 [11:29:53<220:19:07,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10085/203307 [11:29:57<220:19:07,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10085/203307 [11:29:57<220:19:07,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10086/203307 [11:30:01<220:19:08,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10086/203307 [11:30:01<220:19:08,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10087/203307 [11:30:05<220:18:55,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10087/203307 [11:30:05<220:18:55,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10088/203307 [11:30:09<220:18:57,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10088/203307 [11:30:09<220:18:57,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10089/203307 [11:30:13<220:18:45,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10089/203307 [11:30:13<220:18:45,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10090/203307 [11:30:17<220:18:34,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10090/203307 [11:30:17<220:18:34,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10091/203307 [11:30:21<220:18:22,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10091/203307 [11:30:21<220:18:23,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10092/203307 [11:30:24<220:18:11,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10092/203307 [11:30:24<220:18:11,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10093/203307 [11:30:29<220:18:10,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10093/203307 [11:30:29<220:18:11,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10094/203307 [11:30:33<220:18:08,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10094/203307 [11:30:33<220:18:08,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10095/203307 [11:30:37<220:18:09,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10095/203307 [11:30:37<220:18:09,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10096/203307 [11:30:41<220:17:55,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10096/203307 [11:30:41<220:17:55,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10097/203307 [11:30:45<220:17:56,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10097/203307 [11:30:45<220:17:56,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10098/203307 [11:30:49<220:17:43,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10098/203307 [11:30:49<220:17:43,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10099/203307 [11:30:52<220:17:30,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10099/203307 [11:30:52<220:17:31,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10100/203307 [11:30:56<220:17:19,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10100/203307 [11:30:56<220:17:19,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10101/203307 [11:31:00<220:17:07,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:   5%|▍         | 10101/203307 [11:31:00<220:17:07,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10102/203307 [11:31:04<220:17:08,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10102/203307 [11:31:04<220:17:08,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10103/203307 [11:31:08<220:17:04,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10103/203307 [11:31:08<220:17:04,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10104/203307 [11:31:13<220:17:06,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10104/203307 [11:31:13<220:17:06,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10105/203307 [11:31:17<220:17:06,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10105/203307 [11:31:17<220:17:06,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10106/203307 [11:31:21<220:16:54,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10106/203307 [11:31:21<220:16:54,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10107/203307 [11:31:24<220:16:42,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10107/203307 [11:31:24<220:16:43,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10108/203307 [11:31:28<220:16:31,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10108/203307 [11:31:28<220:16:31,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10109/203307 [11:31:32<220:16:20,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10109/203307 [11:31:32<220:16:20,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10110/203307 [11:31:36<220:16:20,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10110/203307 [11:31:36<220:16:21,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10111/203307 [11:31:40<220:16:08,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10111/203307 [11:31:40<220:16:09,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10112/203307 [11:31:44<220:16:09,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10112/203307 [11:31:44<220:16:09,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10113/203307 [11:31:48<220:15:58,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10113/203307 [11:31:48<220:15:58,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10114/203307 [11:31:52<220:16:00,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10114/203307 [11:31:52<220:16:00,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10115/203307 [11:31:56<220:15:48,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10115/203307 [11:31:56<220:15:48,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10116/203307 [11:32:00<220:15:36,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10116/203307 [11:32:00<220:15:36,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10117/203307 [11:32:03<220:15:23,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10117/203307 [11:32:03<220:15:23,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10118/203307 [11:32:08<220:15:24,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10118/203307 [11:32:08<220:15:24,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10119/203307 [11:32:11<220:15:11,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10119/203307 [11:32:11<220:15:12,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10120/203307 [11:32:15<220:14:59,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10120/203307 [11:32:15<220:15:00,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10121/203307 [11:32:20<220:15:02,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▍         | 10121/203307 [11:32:20<220:15:02,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10122/203307 [11:32:23<220:14:50,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10122/203307 [11:32:23<220:14:50,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10123/203307 [11:32:28<220:14:51,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10123/203307 [11:32:28<220:14:51,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10124/203307 [11:32:31<220:14:39,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10124/203307 [11:32:31<220:14:39,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10125/203307 [11:32:35<220:14:28,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10125/203307 [11:32:35<220:14:28,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10126/203307 [11:32:39<220:14:17,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10126/203307 [11:32:39<220:14:17,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10127/203307 [11:32:43<220:14:19,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10127/203307 [11:32:43<220:14:19,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10128/203307 [11:32:47<220:14:07,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10128/203307 [11:32:47<220:14:07,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10129/203307 [11:32:51<220:13:56,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10129/203307 [11:32:51<220:13:56,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10130/203307 [11:32:55<220:13:58,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10130/203307 [11:32:55<220:13:58,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10131/203307 [11:32:59<220:13:59,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10131/203307 [11:32:59<220:13:59,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10132/203307 [11:33:03<220:13:47,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10132/203307 [11:33:03<220:13:47,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10133/203307 [11:33:07<220:13:35,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10133/203307 [11:33:07<220:13:35,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10134/203307 [11:33:11<220:13:24,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10134/203307 [11:33:11<220:13:24,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10135/203307 [11:33:15<220:13:25,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10135/203307 [11:33:15<220:13:25,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10136/203307 [11:33:19<220:13:13,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10136/203307 [11:33:19<220:13:14,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10137/203307 [11:33:22<220:13:03,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10137/203307 [11:33:22<220:13:03,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10138/203307 [11:33:27<220:13:05,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10138/203307 [11:33:27<220:13:05,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10139/203307 [11:33:31<220:13:06,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10139/203307 [11:33:31<220:13:06,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10140/203307 [11:33:36<220:13:08,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10140/203307 [11:33:36<220:13:08,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10141/203307 [11:33:39<220:12:56,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   5%|▍         | 10141/203307 [11:33:39<220:12:56,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10142/203307 [11:33:43<220:12:43,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10142/203307 [11:33:43<220:12:43,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10143/203307 [11:33:47<220:12:43,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10143/203307 [11:33:47<220:12:43,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10144/203307 [11:33:51<220:12:32,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10144/203307 [11:33:51<220:12:32,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10145/203307 [11:33:55<220:12:20,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10145/203307 [11:33:55<220:12:20,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10146/203307 [11:33:58<220:12:08,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10146/203307 [11:33:58<220:12:08,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10147/203307 [11:34:03<220:12:11,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10147/203307 [11:34:03<220:12:12,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10148/203307 [11:34:07<220:12:08,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10148/203307 [11:34:07<220:12:08,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10149/203307 [11:34:11<220:12:09,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10149/203307 [11:34:11<220:12:09,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10150/203307 [11:34:15<220:11:58,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10150/203307 [11:34:15<220:11:58,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10151/203307 [11:34:19<220:11:46,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10151/203307 [11:34:19<220:11:46,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10152/203307 [11:34:23<220:11:46,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10152/203307 [11:34:23<220:11:46,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10153/203307 [11:34:27<220:11:34,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10153/203307 [11:34:27<220:11:34,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10154/203307 [11:34:31<220:11:23,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10154/203307 [11:34:31<220:11:23,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10155/203307 [11:34:34<220:11:11,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10155/203307 [11:34:34<220:11:11,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10156/203307 [11:34:39<220:11:12,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10156/203307 [11:34:39<220:11:13,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10157/203307 [11:34:43<220:11:13,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10157/203307 [11:34:43<220:11:13,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10158/203307 [11:34:47<220:11:00,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10158/203307 [11:34:47<220:11:00,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10159/203307 [11:34:50<220:10:47,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10159/203307 [11:34:50<220:10:47,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10160/203307 [11:34:55<220:10:46,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10160/203307 [11:34:55<220:10:46,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10161/203307 [11:34:58<220:10:35,  0.24it/s, v_num=t5e6, training/loss=0.0933]Epoch 0:   5%|▍         | 10161/203307 [11:34:58<220:10:35,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▍         | 10162/203307 [11:35:02<220:10:23,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▍         | 10162/203307 [11:35:02<220:10:23,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▍         | 10163/203307 [11:35:06<220:10:11,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▍         | 10163/203307 [11:35:06<220:10:11,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▍         | 10164/203307 [11:35:10<220:10:12,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▍         | 10164/203307 [11:35:10<220:10:12,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▍         | 10165/203307 [11:35:14<220:10:01,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▍         | 10165/203307 [11:35:14<220:10:01,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▌         | 10166/203307 [11:35:18<220:10:03,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▌         | 10166/203307 [11:35:18<220:10:03,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▌         | 10167/203307 [11:35:22<220:09:50,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▌         | 10167/203307 [11:35:22<220:09:51,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▌         | 10168/203307 [11:35:26<220:09:50,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▌         | 10168/203307 [11:35:26<220:09:50,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▌         | 10169/203307 [11:35:30<220:09:38,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▌         | 10169/203307 [11:35:30<220:09:38,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▌         | 10170/203307 [11:35:34<220:09:25,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▌         | 10170/203307 [11:35:34<220:09:26,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▌         | 10171/203307 [11:35:37<220:09:14,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▌         | 10171/203307 [11:35:37<220:09:14,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▌         | 10172/203307 [11:35:41<220:09:05,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▌         | 10172/203307 [11:35:41<220:09:05,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▌         | 10173/203307 [11:35:46<220:09:07,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▌         | 10173/203307 [11:35:46<220:09:08,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▌         | 10174/203307 [11:35:49<220:08:57,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▌         | 10174/203307 [11:35:49<220:08:57,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▌         | 10175/203307 [11:35:54<220:08:58,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▌         | 10175/203307 [11:35:54<220:08:58,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▌         | 10176/203307 [11:35:57<220:08:47,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▌         | 10176/203307 [11:35:57<220:08:47,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▌         | 10177/203307 [11:36:02<220:08:48,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▌         | 10177/203307 [11:36:02<220:08:48,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▌         | 10178/203307 [11:36:06<220:08:36,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▌         | 10178/203307 [11:36:06<220:08:36,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▌         | 10179/203307 [11:36:09<220:08:25,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▌         | 10179/203307 [11:36:09<220:08:25,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▌         | 10180/203307 [11:36:13<220:08:13,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▌         | 10180/203307 [11:36:13<220:08:13,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▌         | 10181/203307 [11:36:17<220:08:03,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   5%|▌         | 10181/203307 [11:36:17<220:08:03,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10182/203307 [11:36:21<220:08:08,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10182/203307 [11:36:21<220:08:08,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10183/203307 [11:36:26<220:08:09,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10183/203307 [11:36:26<220:08:09,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10184/203307 [11:36:30<220:08:06,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10184/203307 [11:36:30<220:08:06,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10185/203307 [11:36:34<220:08:06,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10185/203307 [11:36:34<220:08:06,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10186/203307 [11:36:38<220:07:54,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10186/203307 [11:36:38<220:07:55,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10187/203307 [11:36:42<220:07:44,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10187/203307 [11:36:42<220:07:44,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10188/203307 [11:36:45<220:07:34,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10188/203307 [11:36:45<220:07:34,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10189/203307 [11:36:49<220:07:23,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10189/203307 [11:36:49<220:07:23,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10190/203307 [11:36:54<220:07:24,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10190/203307 [11:36:54<220:07:24,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10191/203307 [11:36:57<220:07:14,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10191/203307 [11:36:57<220:07:14,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10192/203307 [11:37:02<220:07:15,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10192/203307 [11:37:02<220:07:15,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10193/203307 [11:37:06<220:07:16,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10193/203307 [11:37:06<220:07:16,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10194/203307 [11:37:10<220:07:04,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10194/203307 [11:37:10<220:07:05,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10195/203307 [11:37:14<220:06:53,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10195/203307 [11:37:14<220:06:54,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10196/203307 [11:37:17<220:06:42,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10196/203307 [11:37:17<220:06:43,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10197/203307 [11:37:21<220:06:31,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10197/203307 [11:37:21<220:06:31,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10198/203307 [11:37:25<220:06:20,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10198/203307 [11:37:25<220:06:20,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10199/203307 [11:37:29<220:06:23,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10199/203307 [11:37:29<220:06:23,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10200/203307 [11:37:33<220:06:10,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10200/203307 [11:37:33<220:06:10,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10201/203307 [11:37:37<220:06:12,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   5%|▌         | 10201/203307 [11:37:37<220:06:12,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10202/203307 [11:37:42<220:06:12,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10202/203307 [11:37:42<220:06:13,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10203/203307 [11:37:45<220:06:01,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10203/203307 [11:37:45<220:06:01,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10204/203307 [11:37:49<220:05:48,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10204/203307 [11:37:49<220:05:48,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10205/203307 [11:37:53<220:05:38,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10205/203307 [11:37:53<220:05:38,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10206/203307 [11:37:57<220:05:27,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10206/203307 [11:37:57<220:05:27,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10207/203307 [11:38:00<220:05:16,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10207/203307 [11:38:00<220:05:16,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10208/203307 [11:38:05<220:05:18,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10208/203307 [11:38:05<220:05:18,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10209/203307 [11:38:09<220:05:18,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10209/203307 [11:38:09<220:05:18,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10210/203307 [11:38:13<220:05:19,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10210/203307 [11:38:13<220:05:19,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10211/203307 [11:38:18<220:05:16,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10211/203307 [11:38:18<220:05:16,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10212/203307 [11:38:21<220:05:03,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10212/203307 [11:38:21<220:05:03,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10213/203307 [11:38:25<220:04:52,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10213/203307 [11:38:25<220:04:52,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10214/203307 [11:38:29<220:04:40,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10214/203307 [11:38:29<220:04:40,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10215/203307 [11:38:32<220:04:30,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10215/203307 [11:38:32<220:04:30,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10216/203307 [11:38:37<220:04:31,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10216/203307 [11:38:37<220:04:31,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10217/203307 [11:38:41<220:04:20,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10217/203307 [11:38:41<220:04:20,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10218/203307 [11:38:45<220:04:22,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10218/203307 [11:38:45<220:04:22,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10219/203307 [11:38:49<220:04:10,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10219/203307 [11:38:49<220:04:10,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10220/203307 [11:38:53<220:04:07,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10220/203307 [11:38:53<220:04:07,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10221/203307 [11:38:56<220:03:55,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   5%|▌         | 10221/203307 [11:38:56<220:03:55,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10222/203307 [11:39:00<220:03:42,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10222/203307 [11:39:00<220:03:42,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10223/203307 [11:39:04<220:03:30,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10223/203307 [11:39:04<220:03:30,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10224/203307 [11:39:08<220:03:19,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10224/203307 [11:39:08<220:03:19,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10225/203307 [11:39:12<220:03:23,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10225/203307 [11:39:12<220:03:23,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10226/203307 [11:39:16<220:03:10,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10226/203307 [11:39:16<220:03:10,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10227/203307 [11:39:20<220:03:12,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10227/203307 [11:39:20<220:03:13,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10228/203307 [11:39:24<220:03:02,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10228/203307 [11:39:24<220:03:02,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10229/203307 [11:39:28<220:02:58,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10229/203307 [11:39:28<220:02:58,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10230/203307 [11:39:32<220:02:46,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10230/203307 [11:39:32<220:02:47,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10231/203307 [11:39:35<220:02:35,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10231/203307 [11:39:35<220:02:35,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10232/203307 [11:39:39<220:02:22,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10232/203307 [11:39:39<220:02:23,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10233/203307 [11:39:43<220:02:12,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10233/203307 [11:39:43<220:02:12,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10234/203307 [11:39:47<220:02:14,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10234/203307 [11:39:47<220:02:15,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10235/203307 [11:39:52<220:02:15,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10235/203307 [11:39:52<220:02:15,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10236/203307 [11:39:55<220:02:02,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10236/203307 [11:39:55<220:02:03,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10237/203307 [11:39:59<220:01:50,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10237/203307 [11:39:59<220:01:50,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10238/203307 [11:40:03<220:01:47,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10238/203307 [11:40:03<220:01:47,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10239/203307 [11:40:07<220:01:35,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10239/203307 [11:40:07<220:01:35,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10240/203307 [11:40:11<220:01:24,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10240/203307 [11:40:11<220:01:24,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10241/203307 [11:40:14<220:01:13,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10241/203307 [11:40:14<220:01:13,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10242/203307 [11:40:19<220:01:16,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10242/203307 [11:40:19<220:01:16,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10243/203307 [11:40:23<220:01:17,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10243/203307 [11:40:23<220:01:17,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10244/203307 [11:40:28<220:01:20,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10244/203307 [11:40:28<220:01:20,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10245/203307 [11:40:31<220:01:08,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10245/203307 [11:40:31<220:01:08,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10246/203307 [11:40:35<220:00:57,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10246/203307 [11:40:35<220:00:57,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10247/203307 [11:40:39<220:00:56,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10247/203307 [11:40:39<220:00:56,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10248/203307 [11:40:43<220:00:43,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10248/203307 [11:40:43<220:00:44,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10249/203307 [11:40:47<220:00:31,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10249/203307 [11:40:47<220:00:32,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10250/203307 [11:40:50<220:00:20,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10250/203307 [11:40:50<220:00:20,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10251/203307 [11:40:55<220:00:24,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10251/203307 [11:40:55<220:00:24,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10252/203307 [11:40:59<220:00:24,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10252/203307 [11:40:59<220:00:24,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10253/203307 [11:41:04<220:00:26,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10253/203307 [11:41:04<220:00:26,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10254/203307 [11:41:07<220:00:13,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10254/203307 [11:41:07<220:00:13,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10255/203307 [11:41:11<220:00:01,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10255/203307 [11:41:11<220:00:02,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10256/203307 [11:41:15<220:00:00,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10256/203307 [11:41:15<220:00:00,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10257/203307 [11:41:19<219:59:49,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10257/203307 [11:41:19<219:59:49,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10258/203307 [11:41:23<219:59:38,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10258/203307 [11:41:23<219:59:38,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10259/203307 [11:41:26<219:59:26,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10259/203307 [11:41:26<219:59:26,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10260/203307 [11:41:31<219:59:29,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10260/203307 [11:41:31<219:59:30,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10261/203307 [11:41:35<219:59:32,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   5%|▌         | 10261/203307 [11:41:35<219:59:32,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10262/203307 [11:41:39<219:59:21,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10262/203307 [11:41:39<219:59:21,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10263/203307 [11:41:43<219:59:10,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10263/203307 [11:41:43<219:59:10,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10264/203307 [11:41:46<219:58:58,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10264/203307 [11:41:47<219:58:59,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10265/203307 [11:41:51<219:58:57,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10265/203307 [11:41:51<219:58:57,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10266/203307 [11:41:54<219:58:46,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10266/203307 [11:41:55<219:58:47,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10267/203307 [11:41:58<219:58:36,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10267/203307 [11:41:58<219:58:36,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10268/203307 [11:42:03<219:58:37,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10268/203307 [11:42:03<219:58:38,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10269/203307 [11:42:06<219:58:27,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10269/203307 [11:42:06<219:58:27,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10270/203307 [11:42:11<219:58:29,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10270/203307 [11:42:11<219:58:29,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10271/203307 [11:42:15<219:58:18,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10271/203307 [11:42:15<219:58:18,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10272/203307 [11:42:18<219:58:06,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10272/203307 [11:42:18<219:58:06,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10273/203307 [11:42:22<219:57:56,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10273/203307 [11:42:22<219:57:56,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10274/203307 [11:42:26<219:57:54,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10274/203307 [11:42:26<219:57:55,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10275/203307 [11:42:30<219:57:44,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10275/203307 [11:42:30<219:57:45,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10276/203307 [11:42:34<219:57:36,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10276/203307 [11:42:34<219:57:36,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10277/203307 [11:42:38<219:57:39,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10277/203307 [11:42:38<219:57:39,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10278/203307 [11:42:42<219:57:28,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10278/203307 [11:42:42<219:57:28,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10279/203307 [11:42:47<219:57:30,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10279/203307 [11:42:47<219:57:30,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10280/203307 [11:42:50<219:57:18,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10280/203307 [11:42:50<219:57:18,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10281/203307 [11:42:54<219:57:08,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   5%|▌         | 10281/203307 [11:42:54<219:57:08,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10282/203307 [11:42:58<219:56:57,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10282/203307 [11:42:58<219:56:57,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10283/203307 [11:43:02<219:56:56,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10283/203307 [11:43:02<219:56:56,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10284/203307 [11:43:06<219:56:46,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10284/203307 [11:43:06<219:56:46,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10285/203307 [11:43:10<219:56:46,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10285/203307 [11:43:10<219:56:46,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10286/203307 [11:43:15<219:56:49,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10286/203307 [11:43:15<219:56:49,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10287/203307 [11:43:19<219:56:51,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10287/203307 [11:43:19<219:56:51,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10288/203307 [11:43:23<219:56:38,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10288/203307 [11:43:23<219:56:38,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10289/203307 [11:43:26<219:56:25,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10289/203307 [11:43:26<219:56:26,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10290/203307 [11:43:30<219:56:14,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10290/203307 [11:43:30<219:56:14,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10291/203307 [11:43:34<219:56:04,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10291/203307 [11:43:34<219:56:04,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10292/203307 [11:43:38<219:56:03,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10292/203307 [11:43:38<219:56:04,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10293/203307 [11:43:42<219:56:03,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10293/203307 [11:43:42<219:56:03,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10294/203307 [11:43:47<219:56:04,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10294/203307 [11:43:47<219:56:04,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10295/203307 [11:43:51<219:55:54,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10295/203307 [11:43:51<219:55:54,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10296/203307 [11:43:55<219:55:55,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10296/203307 [11:43:55<219:55:55,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10297/203307 [11:43:59<219:55:43,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10297/203307 [11:43:59<219:55:43,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10298/203307 [11:44:02<219:55:31,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10298/203307 [11:44:02<219:55:31,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10299/203307 [11:44:06<219:55:19,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10299/203307 [11:44:06<219:55:19,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10300/203307 [11:44:10<219:55:08,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10300/203307 [11:44:10<219:55:08,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10301/203307 [11:44:14<219:55:07,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10301/203307 [11:44:14<219:55:07,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10302/203307 [11:44:19<219:55:10,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10302/203307 [11:44:19<219:55:10,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10303/203307 [11:44:23<219:55:13,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10303/203307 [11:44:23<219:55:13,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10304/203307 [11:44:27<219:55:01,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10304/203307 [11:44:27<219:55:01,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10305/203307 [11:44:31<219:55:03,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10305/203307 [11:44:31<219:55:03,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10306/203307 [11:44:35<219:54:53,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10306/203307 [11:44:35<219:54:53,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10307/203307 [11:44:39<219:54:41,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10307/203307 [11:44:39<219:54:42,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10308/203307 [11:44:42<219:54:30,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10308/203307 [11:44:42<219:54:30,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10309/203307 [11:44:46<219:54:20,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10309/203307 [11:44:46<219:54:20,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10310/203307 [11:44:51<219:54:22,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10310/203307 [11:44:51<219:54:22,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10311/203307 [11:44:54<219:54:13,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10311/203307 [11:44:54<219:54:13,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10312/203307 [11:44:59<219:54:15,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10312/203307 [11:44:59<219:54:15,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10313/203307 [11:45:03<219:54:17,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10313/203307 [11:45:03<219:54:17,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10314/203307 [11:45:07<219:54:06,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10314/203307 [11:45:07<219:54:06,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10315/203307 [11:45:11<219:53:55,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10315/203307 [11:45:11<219:53:55,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10316/203307 [11:45:14<219:53:45,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10316/203307 [11:45:14<219:53:45,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10317/203307 [11:45:18<219:53:34,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10317/203307 [11:45:18<219:53:34,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10318/203307 [11:45:23<219:53:39,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10318/203307 [11:45:23<219:53:39,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10319/203307 [11:45:27<219:53:36,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10319/203307 [11:45:27<219:53:37,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10320/203307 [11:45:31<219:53:37,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10320/203307 [11:45:31<219:53:37,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10321/203307 [11:45:35<219:53:27,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   5%|▌         | 10321/203307 [11:45:35<219:53:28,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10322/203307 [11:45:40<219:53:30,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10322/203307 [11:45:40<219:53:30,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10323/203307 [11:45:43<219:53:21,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10323/203307 [11:45:43<219:53:21,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10324/203307 [11:45:47<219:53:10,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10324/203307 [11:45:47<219:53:10,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10325/203307 [11:45:51<219:52:59,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10325/203307 [11:45:51<219:52:59,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10326/203307 [11:45:55<219:52:48,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10326/203307 [11:45:55<219:52:48,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10327/203307 [11:45:59<219:52:48,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10327/203307 [11:45:59<219:52:48,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10328/203307 [11:46:03<219:52:48,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10328/203307 [11:46:03<219:52:49,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10329/203307 [11:46:08<219:52:50,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10329/203307 [11:46:08<219:52:50,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10330/203307 [11:46:11<219:52:38,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10330/203307 [11:46:11<219:52:38,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10331/203307 [11:46:16<219:52:40,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10331/203307 [11:46:16<219:52:40,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10332/203307 [11:46:20<219:52:30,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10332/203307 [11:46:20<219:52:30,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10333/203307 [11:46:23<219:52:18,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10333/203307 [11:46:23<219:52:19,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10334/203307 [11:46:27<219:52:08,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10334/203307 [11:46:27<219:52:08,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10335/203307 [11:46:32<219:52:10,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10335/203307 [11:46:32<219:52:11,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10336/203307 [11:46:35<219:51:59,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10336/203307 [11:46:35<219:51:59,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10337/203307 [11:46:39<219:51:58,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10337/203307 [11:46:39<219:51:58,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10338/203307 [11:46:44<219:52:01,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10338/203307 [11:46:44<219:52:01,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10339/203307 [11:46:48<219:52:01,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10339/203307 [11:46:48<219:52:01,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10340/203307 [11:46:52<219:51:49,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10340/203307 [11:46:52<219:51:49,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10341/203307 [11:46:56<219:51:38,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   5%|▌         | 10341/203307 [11:46:56<219:51:38,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10342/203307 [11:46:59<219:51:26,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10342/203307 [11:46:59<219:51:26,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10343/203307 [11:47:04<219:51:29,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10343/203307 [11:47:04<219:51:29,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10344/203307 [11:47:08<219:51:17,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10344/203307 [11:47:08<219:51:17,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10345/203307 [11:47:11<219:51:04,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10345/203307 [11:47:11<219:51:04,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10346/203307 [11:47:16<219:51:07,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10346/203307 [11:47:16<219:51:07,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10347/203307 [11:47:19<219:50:57,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10347/203307 [11:47:19<219:50:58,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10348/203307 [11:47:24<219:50:58,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10348/203307 [11:47:24<219:50:58,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10349/203307 [11:47:28<219:50:47,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10349/203307 [11:47:28<219:50:47,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10350/203307 [11:47:31<219:50:35,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10350/203307 [11:47:31<219:50:36,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10351/203307 [11:47:35<219:50:24,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10351/203307 [11:47:35<219:50:24,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10352/203307 [11:47:39<219:50:25,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10352/203307 [11:47:39<219:50:25,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10353/203307 [11:47:43<219:50:13,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10353/203307 [11:47:43<219:50:13,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10354/203307 [11:47:47<219:50:01,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10354/203307 [11:47:47<219:50:02,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10355/203307 [11:47:51<219:50:05,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10355/203307 [11:47:51<219:50:05,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10356/203307 [11:47:55<219:49:53,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10356/203307 [11:47:55<219:49:53,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10357/203307 [11:47:59<219:49:54,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10357/203307 [11:47:59<219:49:54,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10358/203307 [11:48:03<219:49:42,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10358/203307 [11:48:03<219:49:42,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10359/203307 [11:48:07<219:49:30,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10359/203307 [11:48:07<219:49:30,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10360/203307 [11:48:11<219:49:30,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10360/203307 [11:48:11<219:49:30,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10361/203307 [11:48:15<219:49:19,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   5%|▌         | 10361/203307 [11:48:15<219:49:19,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10362/203307 [11:48:18<219:49:08,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10362/203307 [11:48:18<219:49:09,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10363/203307 [11:48:22<219:48:59,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10363/203307 [11:48:22<219:49:00,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10364/203307 [11:48:27<219:49:04,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10364/203307 [11:48:27<219:49:04,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10365/203307 [11:48:31<219:49:06,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10365/203307 [11:48:31<219:49:06,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10366/203307 [11:48:35<219:48:56,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10366/203307 [11:48:35<219:48:56,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10367/203307 [11:48:39<219:48:44,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10367/203307 [11:48:39<219:48:45,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10368/203307 [11:48:43<219:48:47,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10368/203307 [11:48:43<219:48:47,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10369/203307 [11:48:47<219:48:37,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10369/203307 [11:48:47<219:48:37,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10370/203307 [11:48:51<219:48:26,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10370/203307 [11:48:51<219:48:27,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10371/203307 [11:48:54<219:48:16,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10371/203307 [11:48:55<219:48:16,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10372/203307 [11:48:59<219:48:20,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10372/203307 [11:48:59<219:48:20,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10373/203307 [11:49:03<219:48:20,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10373/203307 [11:49:03<219:48:20,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10374/203307 [11:49:08<219:48:22,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10374/203307 [11:49:08<219:48:22,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10375/203307 [11:49:12<219:48:11,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10375/203307 [11:49:12<219:48:11,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10376/203307 [11:49:15<219:48:02,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10376/203307 [11:49:15<219:48:02,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10377/203307 [11:49:20<219:48:04,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10377/203307 [11:49:20<219:48:05,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10378/203307 [11:49:24<219:47:53,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10378/203307 [11:49:24<219:47:53,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10379/203307 [11:49:27<219:47:40,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10379/203307 [11:49:27<219:47:40,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10380/203307 [11:49:31<219:47:28,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10380/203307 [11:49:31<219:47:28,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10381/203307 [11:49:35<219:47:31,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   5%|▌         | 10381/203307 [11:49:35<219:47:31,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10382/203307 [11:49:39<219:47:27,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10382/203307 [11:49:39<219:47:27,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10383/203307 [11:49:44<219:47:29,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10383/203307 [11:49:44<219:47:29,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10384/203307 [11:49:48<219:47:17,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10384/203307 [11:49:48<219:47:17,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10385/203307 [11:49:52<219:47:17,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10385/203307 [11:49:52<219:47:17,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10386/203307 [11:49:55<219:47:04,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10386/203307 [11:49:55<219:47:04,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10387/203307 [11:49:59<219:46:51,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10387/203307 [11:49:59<219:46:51,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10388/203307 [11:50:03<219:46:39,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10388/203307 [11:50:03<219:46:39,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10389/203307 [11:50:07<219:46:29,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10389/203307 [11:50:07<219:46:29,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10390/203307 [11:50:11<219:46:32,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10390/203307 [11:50:11<219:46:32,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10391/203307 [11:50:15<219:46:34,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10391/203307 [11:50:15<219:46:35,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10392/203307 [11:50:19<219:46:24,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10392/203307 [11:50:19<219:46:24,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10393/203307 [11:50:24<219:46:25,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10393/203307 [11:50:24<219:46:25,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10394/203307 [11:50:27<219:46:14,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10394/203307 [11:50:27<219:46:15,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10395/203307 [11:50:31<219:46:04,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10395/203307 [11:50:31<219:46:04,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10396/203307 [11:50:35<219:45:53,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10396/203307 [11:50:35<219:45:53,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10397/203307 [11:50:39<219:45:42,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10397/203307 [11:50:39<219:45:43,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10398/203307 [11:50:43<219:45:46,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10398/203307 [11:50:43<219:45:46,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10399/203307 [11:50:47<219:45:36,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10399/203307 [11:50:47<219:45:36,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10400/203307 [11:50:51<219:45:40,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10400/203307 [11:50:51<219:45:40,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10401/203307 [11:50:55<219:45:30,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   5%|▌         | 10401/203307 [11:50:55<219:45:30,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10402/203307 [11:51:00<219:45:31,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10402/203307 [11:51:00<219:45:31,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10403/203307 [11:51:03<219:45:19,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10403/203307 [11:51:03<219:45:20,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10404/203307 [11:51:07<219:45:08,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10404/203307 [11:51:07<219:45:08,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10405/203307 [11:51:11<219:44:58,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10405/203307 [11:51:11<219:44:58,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10406/203307 [11:51:15<219:44:48,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10406/203307 [11:51:15<219:44:48,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10407/203307 [11:51:19<219:44:52,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10407/203307 [11:51:19<219:44:52,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10408/203307 [11:51:23<219:44:42,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10408/203307 [11:51:23<219:44:42,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10409/203307 [11:51:27<219:44:44,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10409/203307 [11:51:27<219:44:44,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10410/203307 [11:51:32<219:44:44,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10410/203307 [11:51:32<219:44:44,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10411/203307 [11:51:35<219:44:32,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10411/203307 [11:51:35<219:44:32,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10412/203307 [11:51:39<219:44:21,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10412/203307 [11:51:39<219:44:21,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10413/203307 [11:51:43<219:44:11,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10413/203307 [11:51:43<219:44:11,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10414/203307 [11:51:47<219:44:00,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10414/203307 [11:51:47<219:44:01,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10415/203307 [11:51:50<219:43:50,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10415/203307 [11:51:50<219:43:50,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10416/203307 [11:51:55<219:43:52,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10416/203307 [11:51:55<219:43:53,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10417/203307 [11:51:59<219:43:53,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10417/203307 [11:51:59<219:43:53,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10418/203307 [11:52:04<219:43:54,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10418/203307 [11:52:04<219:43:54,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10419/203307 [11:52:07<219:43:42,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10419/203307 [11:52:07<219:43:43,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10420/203307 [11:52:11<219:43:33,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10420/203307 [11:52:11<219:43:33,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10421/203307 [11:52:15<219:43:23,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   5%|▌         | 10421/203307 [11:52:15<219:43:23,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10422/203307 [11:52:19<219:43:12,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10422/203307 [11:52:19<219:43:12,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10423/203307 [11:52:22<219:43:01,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10423/203307 [11:52:22<219:43:01,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10424/203307 [11:52:27<219:43:03,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10424/203307 [11:52:27<219:43:03,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10425/203307 [11:52:31<219:42:54,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10425/203307 [11:52:31<219:42:54,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10426/203307 [11:52:35<219:42:57,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10426/203307 [11:52:35<219:42:57,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10427/203307 [11:52:39<219:42:57,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10427/203307 [11:52:39<219:42:57,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10428/203307 [11:52:43<219:42:45,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10428/203307 [11:52:43<219:42:45,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10429/203307 [11:52:47<219:42:34,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10429/203307 [11:52:47<219:42:34,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10430/203307 [11:52:50<219:42:22,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10430/203307 [11:52:50<219:42:22,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10431/203307 [11:52:54<219:42:10,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10431/203307 [11:52:54<219:42:10,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10432/203307 [11:52:58<219:41:59,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10432/203307 [11:52:58<219:42:00,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10433/203307 [11:53:02<219:42:03,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10433/203307 [11:53:02<219:42:03,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10434/203307 [11:53:06<219:41:52,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10434/203307 [11:53:06<219:41:52,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10435/203307 [11:53:10<219:41:53,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10435/203307 [11:53:10<219:41:53,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10436/203307 [11:53:15<219:41:50,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10436/203307 [11:53:15<219:41:50,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10437/203307 [11:53:18<219:41:39,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10437/203307 [11:53:18<219:41:39,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10438/203307 [11:53:22<219:41:30,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10438/203307 [11:53:22<219:41:30,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10439/203307 [11:53:26<219:41:19,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10439/203307 [11:53:26<219:41:20,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10440/203307 [11:53:30<219:41:10,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10440/203307 [11:53:30<219:41:10,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10441/203307 [11:53:34<219:41:00,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   5%|▌         | 10441/203307 [11:53:34<219:41:00,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10442/203307 [11:53:38<219:41:03,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10442/203307 [11:53:38<219:41:03,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10443/203307 [11:53:42<219:41:04,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10443/203307 [11:53:42<219:41:05,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10444/203307 [11:53:46<219:40:54,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10444/203307 [11:53:46<219:40:54,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10445/203307 [11:53:51<219:40:55,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10445/203307 [11:53:51<219:40:55,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10446/203307 [11:53:55<219:40:50,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10446/203307 [11:53:55<219:40:50,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10447/203307 [11:53:58<219:40:40,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10447/203307 [11:53:58<219:40:40,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10448/203307 [11:54:02<219:40:30,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10448/203307 [11:54:02<219:40:31,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10449/203307 [11:54:06<219:40:20,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10449/203307 [11:54:06<219:40:20,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10450/203307 [11:54:10<219:40:22,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10450/203307 [11:54:10<219:40:22,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10451/203307 [11:54:14<219:40:12,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10451/203307 [11:54:14<219:40:12,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10452/203307 [11:54:19<219:40:15,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10452/203307 [11:54:19<219:40:15,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10453/203307 [11:54:22<219:40:05,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10453/203307 [11:54:22<219:40:05,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10454/203307 [11:54:27<219:40:02,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10454/203307 [11:54:27<219:40:02,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10455/203307 [11:54:30<219:39:50,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10455/203307 [11:54:30<219:39:50,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10456/203307 [11:54:34<219:39:40,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10456/203307 [11:54:34<219:39:40,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10457/203307 [11:54:38<219:39:29,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10457/203307 [11:54:38<219:39:29,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10458/203307 [11:54:42<219:39:21,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10458/203307 [11:54:42<219:39:21,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10459/203307 [11:54:46<219:39:23,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10459/203307 [11:54:46<219:39:23,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10460/203307 [11:54:50<219:39:22,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10460/203307 [11:54:50<219:39:22,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10461/203307 [11:54:55<219:39:22,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   5%|▌         | 10461/203307 [11:54:55<219:39:23,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10462/203307 [11:54:58<219:39:12,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10462/203307 [11:54:58<219:39:12,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10463/203307 [11:55:03<219:39:10,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10463/203307 [11:55:03<219:39:10,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10464/203307 [11:55:06<219:38:59,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10464/203307 [11:55:06<219:38:59,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10465/203307 [11:55:10<219:38:49,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10465/203307 [11:55:10<219:38:49,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10466/203307 [11:55:14<219:38:38,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10466/203307 [11:55:14<219:38:38,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10467/203307 [11:55:18<219:38:27,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10467/203307 [11:55:18<219:38:27,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10468/203307 [11:55:22<219:38:30,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10468/203307 [11:55:22<219:38:30,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10469/203307 [11:55:27<219:38:34,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10469/203307 [11:55:27<219:38:34,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10470/203307 [11:55:30<219:38:24,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10470/203307 [11:55:30<219:38:25,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10471/203307 [11:55:34<219:38:15,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10471/203307 [11:55:34<219:38:15,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10472/203307 [11:55:39<219:38:16,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10472/203307 [11:55:39<219:38:16,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10473/203307 [11:55:42<219:38:07,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10473/203307 [11:55:42<219:38:07,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10474/203307 [11:55:46<219:37:56,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10474/203307 [11:55:46<219:37:56,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10475/203307 [11:55:50<219:37:46,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10475/203307 [11:55:50<219:37:46,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10476/203307 [11:55:54<219:37:47,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10476/203307 [11:55:54<219:37:47,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10477/203307 [11:55:59<219:37:48,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10477/203307 [11:55:59<219:37:49,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10478/203307 [11:56:03<219:37:50,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10478/203307 [11:56:03<219:37:50,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10479/203307 [11:56:07<219:37:40,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10479/203307 [11:56:07<219:37:40,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10480/203307 [11:56:11<219:37:29,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10480/203307 [11:56:11<219:37:29,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10481/203307 [11:56:15<219:37:31,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   5%|▌         | 10481/203307 [11:56:15<219:37:31,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10482/203307 [11:56:19<219:37:22,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10482/203307 [11:56:19<219:37:22,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10483/203307 [11:56:23<219:37:12,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10483/203307 [11:56:23<219:37:12,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10484/203307 [11:56:27<219:37:02,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10484/203307 [11:56:27<219:37:02,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10485/203307 [11:56:31<219:37:05,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10485/203307 [11:56:31<219:37:05,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10486/203307 [11:56:35<219:36:55,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10486/203307 [11:56:35<219:36:55,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10487/203307 [11:56:39<219:36:58,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10487/203307 [11:56:39<219:36:58,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10488/203307 [11:56:43<219:36:47,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10488/203307 [11:56:43<219:36:47,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10489/203307 [11:56:47<219:36:36,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10489/203307 [11:56:47<219:36:36,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10490/203307 [11:56:51<219:36:37,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10490/203307 [11:56:51<219:36:38,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10491/203307 [11:56:55<219:36:27,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10491/203307 [11:56:55<219:36:27,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10492/203307 [11:56:59<219:36:17,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10492/203307 [11:56:59<219:36:17,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10493/203307 [11:57:03<219:36:20,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10493/203307 [11:57:03<219:36:20,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10494/203307 [11:57:08<219:36:23,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10494/203307 [11:57:08<219:36:23,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10495/203307 [11:57:12<219:36:24,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10495/203307 [11:57:12<219:36:24,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10496/203307 [11:57:16<219:36:13,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10496/203307 [11:57:16<219:36:13,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10497/203307 [11:57:19<219:36:02,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10497/203307 [11:57:19<219:36:02,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10498/203307 [11:57:23<219:35:52,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10498/203307 [11:57:23<219:35:52,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10499/203307 [11:57:27<219:35:51,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10499/203307 [11:57:27<219:35:51,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10500/203307 [11:57:31<219:35:39,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10500/203307 [11:57:31<219:35:39,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10501/203307 [11:57:35<219:35:27,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   5%|▌         | 10501/203307 [11:57:35<219:35:27,  0.24it/s, v_num=t5e6, training/loss=0.088] Epoch 0:   5%|▌         | 10502/203307 [11:57:39<219:35:32,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10502/203307 [11:57:39<219:35:32,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10503/203307 [11:57:43<219:35:21,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10503/203307 [11:57:43<219:35:21,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10504/203307 [11:57:48<219:35:23,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10504/203307 [11:57:48<219:35:23,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10505/203307 [11:57:51<219:35:13,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10505/203307 [11:57:51<219:35:13,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10506/203307 [11:57:55<219:35:02,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10506/203307 [11:57:55<219:35:03,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10507/203307 [11:57:59<219:34:51,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10507/203307 [11:57:59<219:34:51,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10508/203307 [11:58:03<219:34:51,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10508/203307 [11:58:03<219:34:51,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10509/203307 [11:58:07<219:34:40,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10509/203307 [11:58:07<219:34:40,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10510/203307 [11:58:11<219:34:39,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10510/203307 [11:58:11<219:34:39,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10511/203307 [11:58:16<219:34:42,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10511/203307 [11:58:16<219:34:42,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10512/203307 [11:58:19<219:34:32,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10512/203307 [11:58:19<219:34:32,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10513/203307 [11:58:24<219:34:32,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10513/203307 [11:58:24<219:34:32,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10514/203307 [11:58:27<219:34:21,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10514/203307 [11:58:27<219:34:22,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10515/203307 [11:58:31<219:34:09,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10515/203307 [11:58:31<219:34:10,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10516/203307 [11:58:35<219:33:58,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10516/203307 [11:58:35<219:33:58,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10517/203307 [11:58:39<219:33:58,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10517/203307 [11:58:39<219:33:58,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10518/203307 [11:58:43<219:33:56,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10518/203307 [11:58:43<219:33:56,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10519/203307 [11:58:47<219:33:44,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10519/203307 [11:58:47<219:33:44,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10520/203307 [11:58:51<219:33:46,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10520/203307 [11:58:51<219:33:46,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10521/203307 [11:58:56<219:33:45,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:   5%|▌         | 10521/203307 [11:58:56<219:33:45,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10522/203307 [11:58:59<219:33:33,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10522/203307 [11:58:59<219:33:33,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10523/203307 [11:59:03<219:33:22,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10523/203307 [11:59:03<219:33:22,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10524/203307 [11:59:07<219:33:10,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10524/203307 [11:59:07<219:33:10,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10525/203307 [11:59:11<219:32:59,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10525/203307 [11:59:11<219:32:59,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10526/203307 [11:59:15<219:32:57,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10526/203307 [11:59:15<219:32:57,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10527/203307 [11:59:19<219:32:59,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10527/203307 [11:59:19<219:32:59,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10528/203307 [11:59:24<219:33:00,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10528/203307 [11:59:24<219:33:00,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10529/203307 [11:59:27<219:32:49,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10529/203307 [11:59:27<219:32:49,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10530/203307 [11:59:32<219:32:51,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10530/203307 [11:59:32<219:32:51,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10531/203307 [11:59:35<219:32:40,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10531/203307 [11:59:35<219:32:40,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10532/203307 [11:59:39<219:32:30,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10532/203307 [11:59:39<219:32:30,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10533/203307 [11:59:43<219:32:19,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10533/203307 [11:59:43<219:32:19,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10534/203307 [11:59:47<219:32:08,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10534/203307 [11:59:47<219:32:08,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10535/203307 [11:59:51<219:32:08,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10535/203307 [11:59:51<219:32:08,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10536/203307 [11:59:55<219:31:59,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10536/203307 [11:59:55<219:31:59,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10537/203307 [11:59:59<219:32:03,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10537/203307 [11:59:59<219:32:03,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10538/203307 [12:00:03<219:31:54,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10538/203307 [12:00:03<219:31:54,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10539/203307 [12:00:08<219:31:56,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10539/203307 [12:00:08<219:31:56,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10540/203307 [12:00:11<219:31:46,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10540/203307 [12:00:11<219:31:46,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10541/203307 [12:00:15<219:31:35,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   5%|▌         | 10541/203307 [12:00:15<219:31:35,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10542/203307 [12:00:19<219:31:24,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10542/203307 [12:00:19<219:31:24,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10543/203307 [12:00:23<219:31:24,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10543/203307 [12:00:23<219:31:24,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10544/203307 [12:00:27<219:31:22,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10544/203307 [12:00:27<219:31:22,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10545/203307 [12:00:31<219:31:12,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10545/203307 [12:00:31<219:31:12,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10546/203307 [12:00:36<219:31:13,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10546/203307 [12:00:36<219:31:14,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10547/203307 [12:00:40<219:31:14,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10547/203307 [12:00:40<219:31:15,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10548/203307 [12:00:44<219:31:04,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10548/203307 [12:00:44<219:31:05,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10549/203307 [12:00:47<219:30:54,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10549/203307 [12:00:47<219:30:54,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10550/203307 [12:00:51<219:30:43,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10550/203307 [12:00:51<219:30:44,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10551/203307 [12:00:55<219:30:31,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10551/203307 [12:00:55<219:30:31,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10552/203307 [12:00:59<219:30:33,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10552/203307 [12:00:59<219:30:33,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10553/203307 [12:01:03<219:30:29,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10553/203307 [12:01:03<219:30:29,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10554/203307 [12:01:08<219:30:30,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10554/203307 [12:01:08<219:30:30,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10555/203307 [12:01:12<219:30:19,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10555/203307 [12:01:12<219:30:19,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10556/203307 [12:01:16<219:30:22,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10556/203307 [12:01:16<219:30:22,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10557/203307 [12:01:20<219:30:11,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10557/203307 [12:01:20<219:30:11,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10558/203307 [12:01:23<219:30:00,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10558/203307 [12:01:23<219:30:00,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10559/203307 [12:01:27<219:29:50,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10559/203307 [12:01:27<219:29:50,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10560/203307 [12:01:32<219:29:50,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10560/203307 [12:01:32<219:29:50,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10561/203307 [12:01:35<219:29:40,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   5%|▌         | 10561/203307 [12:01:35<219:29:40,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10562/203307 [12:01:40<219:29:38,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10562/203307 [12:01:40<219:29:38,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10563/203307 [12:01:44<219:29:40,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10563/203307 [12:01:44<219:29:40,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10564/203307 [12:01:48<219:29:28,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10564/203307 [12:01:48<219:29:29,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10565/203307 [12:01:52<219:29:31,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10565/203307 [12:01:52<219:29:31,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10566/203307 [12:01:56<219:29:19,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10566/203307 [12:01:56<219:29:20,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10567/203307 [12:02:00<219:29:09,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10567/203307 [12:02:00<219:29:09,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10568/203307 [12:02:04<219:29:10,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10568/203307 [12:02:04<219:29:10,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10569/203307 [12:02:08<219:28:59,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10569/203307 [12:02:08<219:28:59,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10570/203307 [12:02:11<219:28:47,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10570/203307 [12:02:11<219:28:47,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10571/203307 [12:02:16<219:28:45,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10571/203307 [12:02:16<219:28:46,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10572/203307 [12:02:20<219:28:49,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10572/203307 [12:02:20<219:28:49,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10573/203307 [12:02:25<219:28:51,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10573/203307 [12:02:25<219:28:51,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10574/203307 [12:02:28<219:28:39,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10574/203307 [12:02:28<219:28:39,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10575/203307 [12:02:32<219:28:28,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10575/203307 [12:02:32<219:28:28,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10576/203307 [12:02:36<219:28:17,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10576/203307 [12:02:36<219:28:17,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10577/203307 [12:02:40<219:28:19,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10577/203307 [12:02:40<219:28:19,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10578/203307 [12:02:44<219:28:08,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10578/203307 [12:02:44<219:28:08,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10579/203307 [12:02:47<219:27:55,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10579/203307 [12:02:47<219:27:56,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10580/203307 [12:02:52<219:27:58,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10580/203307 [12:02:52<219:27:58,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10581/203307 [12:02:56<219:27:48,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10581/203307 [12:02:56<219:27:49,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10582/203307 [12:03:00<219:27:50,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10582/203307 [12:03:00<219:27:50,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10583/203307 [12:03:04<219:27:40,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10583/203307 [12:03:04<219:27:40,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10584/203307 [12:03:08<219:27:28,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10584/203307 [12:03:08<219:27:28,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10585/203307 [12:03:12<219:27:29,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10585/203307 [12:03:12<219:27:29,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10586/203307 [12:03:16<219:27:19,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10586/203307 [12:03:16<219:27:19,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10587/203307 [12:03:20<219:27:10,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10587/203307 [12:03:20<219:27:10,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10588/203307 [12:03:23<219:27:01,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10588/203307 [12:03:23<219:27:01,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10589/203307 [12:03:28<219:27:03,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10589/203307 [12:03:28<219:27:03,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10590/203307 [12:03:32<219:26:53,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10590/203307 [12:03:32<219:26:53,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10591/203307 [12:03:36<219:26:55,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10591/203307 [12:03:36<219:26:55,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10592/203307 [12:03:40<219:26:44,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10592/203307 [12:03:40<219:26:44,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10593/203307 [12:03:44<219:26:44,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10593/203307 [12:03:44<219:26:44,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10594/203307 [12:03:48<219:26:36,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10594/203307 [12:03:48<219:26:37,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10595/203307 [12:03:52<219:26:26,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10595/203307 [12:03:52<219:26:26,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10596/203307 [12:03:55<219:26:16,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10596/203307 [12:03:55<219:26:16,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10597/203307 [12:03:59<219:26:06,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10597/203307 [12:03:59<219:26:06,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10598/203307 [12:04:04<219:26:09,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10598/203307 [12:04:04<219:26:09,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10599/203307 [12:04:08<219:26:10,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10599/203307 [12:04:08<219:26:10,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10600/203307 [12:04:12<219:26:00,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10600/203307 [12:04:12<219:26:00,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10601/203307 [12:04:16<219:25:49,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10601/203307 [12:04:16<219:25:49,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10602/203307 [12:04:20<219:25:50,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10602/203307 [12:04:20<219:25:50,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10603/203307 [12:04:24<219:25:39,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10603/203307 [12:04:24<219:25:39,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10604/203307 [12:04:27<219:25:27,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10604/203307 [12:04:27<219:25:28,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10605/203307 [12:04:31<219:25:18,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10605/203307 [12:04:31<219:25:18,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10606/203307 [12:04:36<219:25:19,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10606/203307 [12:04:36<219:25:19,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10607/203307 [12:04:40<219:25:17,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10607/203307 [12:04:40<219:25:17,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10608/203307 [12:04:44<219:25:18,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10608/203307 [12:04:44<219:25:19,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10609/203307 [12:04:48<219:25:07,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10609/203307 [12:04:48<219:25:07,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10610/203307 [12:04:52<219:25:05,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10610/203307 [12:04:52<219:25:06,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10611/203307 [12:04:56<219:24:54,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10611/203307 [12:04:56<219:24:54,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10612/203307 [12:05:00<219:24:42,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10612/203307 [12:05:00<219:24:42,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10613/203307 [12:05:03<219:24:32,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10613/203307 [12:05:03<219:24:32,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10614/203307 [12:05:07<219:24:21,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10614/203307 [12:05:07<219:24:21,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10615/203307 [12:05:11<219:24:24,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10615/203307 [12:05:11<219:24:24,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10616/203307 [12:05:16<219:24:22,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10616/203307 [12:05:16<219:24:22,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10617/203307 [12:05:20<219:24:24,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10617/203307 [12:05:20<219:24:24,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10618/203307 [12:05:24<219:24:24,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10618/203307 [12:05:24<219:24:24,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10619/203307 [12:05:28<219:24:14,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10619/203307 [12:05:28<219:24:14,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10620/203307 [12:05:32<219:24:03,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10620/203307 [12:05:32<219:24:03,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10621/203307 [12:05:36<219:23:54,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10621/203307 [12:05:36<219:23:54,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10622/203307 [12:05:39<219:23:42,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10622/203307 [12:05:39<219:23:43,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10623/203307 [12:05:43<219:23:31,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10623/203307 [12:05:43<219:23:31,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10624/203307 [12:05:48<219:23:34,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10624/203307 [12:05:48<219:23:35,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10625/203307 [12:05:52<219:23:36,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10625/203307 [12:05:52<219:23:36,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10626/203307 [12:05:56<219:23:24,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10626/203307 [12:05:56<219:23:25,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10627/203307 [12:06:00<219:23:25,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10627/203307 [12:06:00<219:23:25,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10628/203307 [12:06:04<219:23:14,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10628/203307 [12:06:04<219:23:14,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10629/203307 [12:06:08<219:23:02,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10629/203307 [12:06:08<219:23:02,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10630/203307 [12:06:11<219:22:51,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10630/203307 [12:06:11<219:22:51,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10631/203307 [12:06:15<219:22:40,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10631/203307 [12:06:15<219:22:40,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10632/203307 [12:06:19<219:22:43,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10632/203307 [12:06:19<219:22:43,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10633/203307 [12:06:23<219:22:33,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10633/203307 [12:06:23<219:22:33,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10634/203307 [12:06:28<219:22:34,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10634/203307 [12:06:28<219:22:34,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10635/203307 [12:06:32<219:22:33,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10635/203307 [12:06:32<219:22:33,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10636/203307 [12:06:36<219:22:23,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10636/203307 [12:06:36<219:22:23,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10637/203307 [12:06:39<219:22:12,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10637/203307 [12:06:39<219:22:12,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10638/203307 [12:06:43<219:22:01,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10638/203307 [12:06:43<219:22:01,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10639/203307 [12:06:47<219:21:49,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10639/203307 [12:06:47<219:21:49,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10640/203307 [12:06:51<219:21:40,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10640/203307 [12:06:51<219:21:40,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10641/203307 [12:06:55<219:21:43,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10641/203307 [12:06:55<219:21:43,  0.24it/s, v_num=t5e6, training/loss=0.087] Epoch 0:   5%|▌         | 10642/203307 [12:06:59<219:21:30,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10642/203307 [12:06:59<219:21:30,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10643/203307 [12:07:03<219:21:31,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10643/203307 [12:07:03<219:21:31,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10644/203307 [12:07:07<219:21:20,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10644/203307 [12:07:07<219:21:20,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10645/203307 [12:07:10<219:21:08,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10645/203307 [12:07:10<219:21:09,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10646/203307 [12:07:14<219:20:58,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10646/203307 [12:07:14<219:20:58,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10647/203307 [12:07:18<219:20:48,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10647/203307 [12:07:18<219:20:49,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10648/203307 [12:07:22<219:20:37,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10648/203307 [12:07:22<219:20:37,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10649/203307 [12:07:25<219:20:26,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10649/203307 [12:07:25<219:20:27,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10650/203307 [12:07:30<219:20:30,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10650/203307 [12:07:30<219:20:31,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10651/203307 [12:07:34<219:20:32,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10651/203307 [12:07:34<219:20:32,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10652/203307 [12:07:39<219:20:31,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10652/203307 [12:07:39<219:20:31,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10653/203307 [12:07:42<219:20:21,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10653/203307 [12:07:42<219:20:21,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10654/203307 [12:07:46<219:20:11,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10654/203307 [12:07:46<219:20:11,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10655/203307 [12:07:50<219:20:01,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10655/203307 [12:07:50<219:20:02,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10656/203307 [12:07:54<219:19:51,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10656/203307 [12:07:54<219:19:51,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10657/203307 [12:07:57<219:19:40,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10657/203307 [12:07:57<219:19:40,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10658/203307 [12:08:02<219:19:43,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10658/203307 [12:08:02<219:19:43,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10659/203307 [12:08:06<219:19:34,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10659/203307 [12:08:06<219:19:34,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10660/203307 [12:08:10<219:19:36,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10660/203307 [12:08:10<219:19:36,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10661/203307 [12:08:15<219:19:36,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   5%|▌         | 10661/203307 [12:08:15<219:19:36,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10662/203307 [12:08:18<219:19:27,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10662/203307 [12:08:18<219:19:27,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10663/203307 [12:08:22<219:19:16,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10663/203307 [12:08:22<219:19:16,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10664/203307 [12:08:26<219:19:06,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10664/203307 [12:08:26<219:19:06,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10665/203307 [12:08:30<219:18:55,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10665/203307 [12:08:30<219:18:55,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10666/203307 [12:08:33<219:18:47,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10666/203307 [12:08:33<219:18:47,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10667/203307 [12:08:38<219:18:50,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10667/203307 [12:08:38<219:18:50,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10668/203307 [12:08:42<219:18:50,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10668/203307 [12:08:42<219:18:50,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10669/203307 [12:08:47<219:18:52,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10669/203307 [12:08:47<219:18:52,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10670/203307 [12:08:51<219:18:50,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10670/203307 [12:08:51<219:18:51,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10671/203307 [12:08:55<219:18:39,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10671/203307 [12:08:55<219:18:39,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10672/203307 [12:08:58<219:18:29,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10672/203307 [12:08:58<219:18:29,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10673/203307 [12:09:02<219:18:20,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10673/203307 [12:09:02<219:18:20,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10674/203307 [12:09:06<219:18:09,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10674/203307 [12:09:06<219:18:09,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10675/203307 [12:09:10<219:17:58,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10675/203307 [12:09:10<219:17:58,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10676/203307 [12:09:14<219:18:01,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10676/203307 [12:09:14<219:18:01,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10677/203307 [12:09:19<219:18:04,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10677/203307 [12:09:19<219:18:04,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10678/203307 [12:09:22<219:17:53,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10678/203307 [12:09:22<219:17:53,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10679/203307 [12:09:27<219:17:50,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10679/203307 [12:09:27<219:17:50,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10680/203307 [12:09:30<219:17:39,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10680/203307 [12:09:30<219:17:39,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10681/203307 [12:09:34<219:17:28,  0.24it/s, v_num=t5e6, training/loss=0.0949]Epoch 0:   5%|▌         | 10681/203307 [12:09:34<219:17:28,  0.24it/s, v_num=t5e6, training/loss=0.100] Epoch 0:   5%|▌         | 10682/203307 [12:09:38<219:17:18,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10682/203307 [12:09:38<219:17:18,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10683/203307 [12:09:41<219:17:07,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10683/203307 [12:09:41<219:17:07,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10684/203307 [12:09:46<219:17:08,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10684/203307 [12:09:46<219:17:08,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10685/203307 [12:09:50<219:17:09,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10685/203307 [12:09:50<219:17:09,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10686/203307 [12:09:55<219:17:11,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10686/203307 [12:09:55<219:17:11,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10687/203307 [12:09:58<219:16:58,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10687/203307 [12:09:58<219:16:58,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10688/203307 [12:10:03<219:16:57,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10688/203307 [12:10:03<219:16:57,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10689/203307 [12:10:06<219:16:46,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10689/203307 [12:10:06<219:16:46,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10690/203307 [12:10:10<219:16:34,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10690/203307 [12:10:10<219:16:34,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10691/203307 [12:10:14<219:16:23,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10691/203307 [12:10:14<219:16:23,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10692/203307 [12:10:17<219:16:13,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10692/203307 [12:10:17<219:16:13,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10693/203307 [12:10:22<219:16:16,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10693/203307 [12:10:22<219:16:16,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10694/203307 [12:10:26<219:16:06,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10694/203307 [12:10:26<219:16:06,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10695/203307 [12:10:30<219:16:08,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10695/203307 [12:10:30<219:16:08,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10696/203307 [12:10:34<219:15:58,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10696/203307 [12:10:34<219:15:58,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10697/203307 [12:10:38<219:15:57,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10697/203307 [12:10:38<219:15:57,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10698/203307 [12:10:42<219:15:46,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10698/203307 [12:10:42<219:15:46,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10699/203307 [12:10:46<219:15:35,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10699/203307 [12:10:46<219:15:35,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10700/203307 [12:10:49<219:15:24,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10700/203307 [12:10:49<219:15:24,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10701/203307 [12:10:53<219:15:14,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   5%|▌         | 10701/203307 [12:10:53<219:15:14,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10702/203307 [12:10:57<219:15:16,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10702/203307 [12:10:57<219:15:16,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10703/203307 [12:11:02<219:15:18,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10703/203307 [12:11:02<219:15:18,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10704/203307 [12:11:06<219:15:07,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10704/203307 [12:11:06<219:15:07,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10705/203307 [12:11:09<219:14:56,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10705/203307 [12:11:09<219:14:56,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10706/203307 [12:11:14<219:14:55,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10706/203307 [12:11:14<219:14:55,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10707/203307 [12:11:17<219:14:44,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10707/203307 [12:11:17<219:14:45,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10708/203307 [12:11:21<219:14:34,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10708/203307 [12:11:21<219:14:34,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10709/203307 [12:11:25<219:14:24,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10709/203307 [12:11:25<219:14:24,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10710/203307 [12:11:29<219:14:26,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10710/203307 [12:11:29<219:14:26,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10711/203307 [12:11:33<219:14:15,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10711/203307 [12:11:33<219:14:15,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10712/203307 [12:11:37<219:14:17,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10712/203307 [12:11:37<219:14:17,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10713/203307 [12:11:41<219:14:05,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10713/203307 [12:11:41<219:14:06,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10714/203307 [12:11:45<219:13:54,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10714/203307 [12:11:45<219:13:54,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10715/203307 [12:11:49<219:13:51,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10715/203307 [12:11:49<219:13:52,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10716/203307 [12:11:53<219:13:39,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10716/203307 [12:11:53<219:13:39,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10717/203307 [12:11:56<219:13:26,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10717/203307 [12:11:56<219:13:26,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10718/203307 [12:12:01<219:13:27,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10718/203307 [12:12:01<219:13:27,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10719/203307 [12:12:05<219:13:29,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10719/203307 [12:12:05<219:13:29,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10720/203307 [12:12:09<219:13:17,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10720/203307 [12:12:09<219:13:17,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10721/203307 [12:12:13<219:13:18,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10721/203307 [12:12:13<219:13:19,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10722/203307 [12:12:17<219:13:08,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10722/203307 [12:12:17<219:13:08,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10723/203307 [12:12:21<219:12:59,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10723/203307 [12:12:21<219:12:59,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10724/203307 [12:12:25<219:12:57,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10724/203307 [12:12:25<219:12:57,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10725/203307 [12:12:29<219:12:47,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10725/203307 [12:12:29<219:12:47,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10726/203307 [12:12:32<219:12:35,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10726/203307 [12:12:32<219:12:35,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10727/203307 [12:12:37<219:12:36,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10727/203307 [12:12:37<219:12:36,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10728/203307 [12:12:41<219:12:37,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10728/203307 [12:12:41<219:12:37,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10729/203307 [12:12:45<219:12:38,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10729/203307 [12:12:45<219:12:38,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10730/203307 [12:12:49<219:12:26,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10730/203307 [12:12:49<219:12:26,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10731/203307 [12:12:53<219:12:14,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10731/203307 [12:12:53<219:12:14,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10732/203307 [12:12:57<219:12:04,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10732/203307 [12:12:57<219:12:04,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10733/203307 [12:13:01<219:12:02,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10733/203307 [12:13:01<219:12:03,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10734/203307 [12:13:05<219:11:52,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10734/203307 [12:13:05<219:11:52,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10735/203307 [12:13:09<219:11:51,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10735/203307 [12:13:09<219:11:51,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10736/203307 [12:13:13<219:11:52,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10736/203307 [12:13:13<219:11:52,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10737/203307 [12:13:17<219:11:43,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10737/203307 [12:13:17<219:11:44,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10738/203307 [12:13:22<219:11:46,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10738/203307 [12:13:22<219:11:46,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10739/203307 [12:13:25<219:11:35,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10739/203307 [12:13:25<219:11:35,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10740/203307 [12:13:29<219:11:24,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10740/203307 [12:13:29<219:11:24,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10741/203307 [12:13:33<219:11:14,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:   5%|▌         | 10741/203307 [12:13:33<219:11:14,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10742/203307 [12:13:37<219:11:11,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10742/203307 [12:13:37<219:11:11,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10743/203307 [12:13:41<219:11:10,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10743/203307 [12:13:41<219:11:10,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10744/203307 [12:13:45<219:11:00,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10744/203307 [12:13:45<219:11:00,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10745/203307 [12:13:49<219:11:02,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10745/203307 [12:13:49<219:11:02,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10746/203307 [12:13:53<219:10:51,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10746/203307 [12:13:53<219:10:51,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10747/203307 [12:13:57<219:10:52,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10747/203307 [12:13:57<219:10:52,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10748/203307 [12:14:01<219:10:41,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10748/203307 [12:14:01<219:10:41,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10749/203307 [12:14:05<219:10:29,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10749/203307 [12:14:05<219:10:29,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10750/203307 [12:14:08<219:10:17,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10750/203307 [12:14:08<219:10:17,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10751/203307 [12:14:13<219:10:16,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10751/203307 [12:14:13<219:10:17,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10752/203307 [12:14:17<219:10:17,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10752/203307 [12:14:17<219:10:17,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10753/203307 [12:14:21<219:10:06,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10753/203307 [12:14:21<219:10:06,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10754/203307 [12:14:25<219:10:09,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10754/203307 [12:14:25<219:10:09,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10755/203307 [12:14:30<219:10:10,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10755/203307 [12:14:30<219:10:10,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10756/203307 [12:14:33<219:10:00,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10756/203307 [12:14:33<219:10:00,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10757/203307 [12:14:37<219:09:49,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10757/203307 [12:14:37<219:09:49,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10758/203307 [12:14:41<219:09:40,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10758/203307 [12:14:41<219:09:40,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10759/203307 [12:14:45<219:09:29,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10759/203307 [12:14:45<219:09:29,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10760/203307 [12:14:49<219:09:31,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10760/203307 [12:14:49<219:09:31,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10761/203307 [12:14:53<219:09:21,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   5%|▌         | 10761/203307 [12:14:53<219:09:21,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10762/203307 [12:14:57<219:09:20,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10762/203307 [12:14:57<219:09:20,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10763/203307 [12:15:01<219:09:09,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10763/203307 [12:15:01<219:09:09,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10764/203307 [12:15:05<219:09:12,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10764/203307 [12:15:05<219:09:12,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10765/203307 [12:15:09<219:09:01,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10765/203307 [12:15:09<219:09:01,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10766/203307 [12:15:13<219:08:50,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10766/203307 [12:15:13<219:08:50,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10767/203307 [12:15:17<219:08:40,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10767/203307 [12:15:17<219:08:40,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10768/203307 [12:15:21<219:08:44,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10768/203307 [12:15:21<219:08:44,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10769/203307 [12:15:25<219:08:42,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10769/203307 [12:15:25<219:08:42,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10770/203307 [12:15:29<219:08:31,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10770/203307 [12:15:29<219:08:31,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10771/203307 [12:15:34<219:08:33,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10771/203307 [12:15:34<219:08:33,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10772/203307 [12:15:37<219:08:22,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10772/203307 [12:15:37<219:08:22,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10773/203307 [12:15:42<219:08:23,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10773/203307 [12:15:42<219:08:23,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10774/203307 [12:15:45<219:08:14,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10774/203307 [12:15:45<219:08:14,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10775/203307 [12:15:49<219:08:02,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10775/203307 [12:15:49<219:08:03,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10776/203307 [12:15:53<219:07:51,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10776/203307 [12:15:53<219:07:51,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10777/203307 [12:15:57<219:07:53,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10777/203307 [12:15:57<219:07:53,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10778/203307 [12:16:01<219:07:51,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10778/203307 [12:16:01<219:07:51,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10779/203307 [12:16:05<219:07:40,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10779/203307 [12:16:05<219:07:41,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10780/203307 [12:16:10<219:07:42,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10780/203307 [12:16:10<219:07:42,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10781/203307 [12:16:14<219:07:44,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   5%|▌         | 10781/203307 [12:16:14<219:07:44,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10782/203307 [12:16:18<219:07:32,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10782/203307 [12:16:18<219:07:32,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10783/203307 [12:16:21<219:07:22,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10783/203307 [12:16:21<219:07:22,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10784/203307 [12:16:25<219:07:11,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10784/203307 [12:16:25<219:07:11,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10785/203307 [12:16:30<219:07:12,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10785/203307 [12:16:30<219:07:12,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10786/203307 [12:16:33<219:07:02,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10786/203307 [12:16:33<219:07:02,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10787/203307 [12:16:38<219:07:00,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10787/203307 [12:16:38<219:07:00,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10788/203307 [12:16:42<219:07:01,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10788/203307 [12:16:42<219:07:02,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10789/203307 [12:16:46<219:06:51,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10789/203307 [12:16:46<219:06:51,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10790/203307 [12:16:50<219:06:53,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10790/203307 [12:16:50<219:06:53,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10791/203307 [12:16:54<219:06:41,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10791/203307 [12:16:54<219:06:41,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10792/203307 [12:16:57<219:06:30,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10792/203307 [12:16:57<219:06:30,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10793/203307 [12:17:02<219:06:30,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10793/203307 [12:17:02<219:06:30,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10794/203307 [12:17:06<219:06:19,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10794/203307 [12:17:06<219:06:19,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10795/203307 [12:17:09<219:06:06,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10795/203307 [12:17:09<219:06:06,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10796/203307 [12:17:13<219:06:06,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10796/203307 [12:17:13<219:06:06,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10797/203307 [12:17:18<219:06:07,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10797/203307 [12:17:18<219:06:07,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10798/203307 [12:17:22<219:05:56,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10798/203307 [12:17:22<219:05:56,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10799/203307 [12:17:26<219:05:59,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10799/203307 [12:17:26<219:05:59,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10800/203307 [12:17:30<219:05:48,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10800/203307 [12:17:30<219:05:48,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10801/203307 [12:17:34<219:05:38,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   5%|▌         | 10801/203307 [12:17:34<219:05:38,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10802/203307 [12:17:38<219:05:39,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10802/203307 [12:17:38<219:05:39,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10803/203307 [12:17:42<219:05:28,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10803/203307 [12:17:42<219:05:28,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10804/203307 [12:17:45<219:05:17,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10804/203307 [12:17:45<219:05:17,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10805/203307 [12:17:50<219:05:18,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10805/203307 [12:17:50<219:05:18,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10806/203307 [12:17:54<219:05:20,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10806/203307 [12:17:54<219:05:20,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10807/203307 [12:17:59<219:05:21,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10807/203307 [12:17:59<219:05:21,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10808/203307 [12:18:02<219:05:10,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10808/203307 [12:18:02<219:05:10,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10809/203307 [12:18:06<219:04:59,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10809/203307 [12:18:06<219:04:59,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10810/203307 [12:18:10<219:04:59,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10810/203307 [12:18:10<219:04:59,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10811/203307 [12:18:14<219:04:48,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10811/203307 [12:18:14<219:04:48,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10812/203307 [12:18:18<219:04:37,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10812/203307 [12:18:18<219:04:38,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10813/203307 [12:18:21<219:04:26,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10813/203307 [12:18:21<219:04:26,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10814/203307 [12:18:26<219:04:28,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10814/203307 [12:18:26<219:04:28,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10815/203307 [12:18:30<219:04:17,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10815/203307 [12:18:30<219:04:17,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10816/203307 [12:18:34<219:04:17,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10816/203307 [12:18:34<219:04:17,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10817/203307 [12:18:38<219:04:06,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10817/203307 [12:18:38<219:04:06,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10818/203307 [12:18:42<219:04:05,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10818/203307 [12:18:42<219:04:05,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10819/203307 [12:18:46<219:03:54,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10819/203307 [12:18:46<219:03:54,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10820/203307 [12:18:49<219:03:43,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10820/203307 [12:18:49<219:03:43,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10821/203307 [12:18:53<219:03:32,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 10821/203307 [12:18:53<219:03:32,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10822/203307 [12:18:57<219:03:22,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10822/203307 [12:18:57<219:03:22,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10823/203307 [12:19:01<219:03:25,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10823/203307 [12:19:01<219:03:25,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10824/203307 [12:19:05<219:03:13,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10824/203307 [12:19:05<219:03:13,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10825/203307 [12:19:09<219:03:13,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10825/203307 [12:19:09<219:03:13,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10826/203307 [12:19:13<219:03:01,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10826/203307 [12:19:13<219:03:01,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10827/203307 [12:19:17<219:03:01,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10827/203307 [12:19:17<219:03:01,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10828/203307 [12:19:21<219:02:50,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10828/203307 [12:19:21<219:02:50,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10829/203307 [12:19:25<219:02:41,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10829/203307 [12:19:25<219:02:41,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10830/203307 [12:19:28<219:02:31,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10830/203307 [12:19:28<219:02:31,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10831/203307 [12:19:32<219:02:20,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10831/203307 [12:19:32<219:02:20,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10832/203307 [12:19:37<219:02:22,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10832/203307 [12:19:37<219:02:22,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10833/203307 [12:19:41<219:02:23,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10833/203307 [12:19:41<219:02:23,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10834/203307 [12:19:45<219:02:12,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10834/203307 [12:19:45<219:02:12,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10835/203307 [12:19:49<219:02:12,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10835/203307 [12:19:49<219:02:12,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10836/203307 [12:19:53<219:02:01,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10836/203307 [12:19:53<219:02:01,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10837/203307 [12:19:56<219:01:49,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10837/203307 [12:19:56<219:01:49,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10838/203307 [12:20:00<219:01:39,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10838/203307 [12:20:00<219:01:39,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10839/203307 [12:20:04<219:01:28,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10839/203307 [12:20:04<219:01:28,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10840/203307 [12:20:08<219:01:31,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10840/203307 [12:20:08<219:01:31,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10841/203307 [12:20:13<219:01:29,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   5%|▌         | 10841/203307 [12:20:13<219:01:29,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10842/203307 [12:20:17<219:01:31,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10842/203307 [12:20:17<219:01:31,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10843/203307 [12:20:21<219:01:31,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10843/203307 [12:20:21<219:01:31,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10844/203307 [12:20:25<219:01:22,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10844/203307 [12:20:25<219:01:22,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10845/203307 [12:20:29<219:01:11,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10845/203307 [12:20:29<219:01:11,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10846/203307 [12:20:33<219:01:00,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10846/203307 [12:20:33<219:01:00,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10847/203307 [12:20:36<219:00:50,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10847/203307 [12:20:36<219:00:50,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10848/203307 [12:20:40<219:00:40,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10848/203307 [12:20:40<219:00:40,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10849/203307 [12:20:45<219:00:45,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10849/203307 [12:20:45<219:00:45,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10850/203307 [12:20:49<219:00:44,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10850/203307 [12:20:49<219:00:44,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10851/203307 [12:20:53<219:00:46,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10851/203307 [12:20:53<219:00:46,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10852/203307 [12:20:58<219:00:46,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10852/203307 [12:20:58<219:00:46,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10853/203307 [12:21:01<219:00:35,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10853/203307 [12:21:01<219:00:35,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10854/203307 [12:21:05<219:00:24,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10854/203307 [12:21:05<219:00:24,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10855/203307 [12:21:09<219:00:13,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10855/203307 [12:21:09<219:00:13,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10856/203307 [12:21:13<219:00:02,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10856/203307 [12:21:13<219:00:02,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10857/203307 [12:21:16<218:59:52,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10857/203307 [12:21:16<218:59:52,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10858/203307 [12:21:21<218:59:56,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10858/203307 [12:21:21<218:59:56,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10859/203307 [12:21:25<218:59:58,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10859/203307 [12:21:25<218:59:58,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10860/203307 [12:21:30<218:59:57,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10860/203307 [12:21:30<218:59:57,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10861/203307 [12:21:33<218:59:46,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   5%|▌         | 10861/203307 [12:21:33<218:59:46,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10862/203307 [12:21:37<218:59:36,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10862/203307 [12:21:37<218:59:36,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10863/203307 [12:21:41<218:59:26,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10863/203307 [12:21:41<218:59:26,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10864/203307 [12:21:45<218:59:17,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10864/203307 [12:21:45<218:59:17,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10865/203307 [12:21:48<218:59:06,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10865/203307 [12:21:48<218:59:07,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10866/203307 [12:21:53<218:59:11,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10866/203307 [12:21:53<218:59:11,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10867/203307 [12:21:57<218:59:01,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10867/203307 [12:21:57<218:59:02,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10868/203307 [12:22:01<218:59:03,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10868/203307 [12:22:01<218:59:03,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10869/203307 [12:22:05<218:58:52,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10869/203307 [12:22:05<218:58:52,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10870/203307 [12:22:09<218:58:42,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10870/203307 [12:22:09<218:58:42,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10871/203307 [12:22:12<218:58:32,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10871/203307 [12:22:12<218:58:32,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10872/203307 [12:22:16<218:58:26,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10872/203307 [12:22:16<218:58:26,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10873/203307 [12:22:20<218:58:21,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10873/203307 [12:22:20<218:58:21,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10874/203307 [12:22:24<218:58:11,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10874/203307 [12:22:24<218:58:11,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10875/203307 [12:22:29<218:58:12,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10875/203307 [12:22:29<218:58:12,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10876/203307 [12:22:32<218:58:02,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10876/203307 [12:22:32<218:58:02,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10877/203307 [12:22:37<218:58:02,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10877/203307 [12:22:37<218:58:02,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10878/203307 [12:22:40<218:57:50,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10878/203307 [12:22:40<218:57:50,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10879/203307 [12:22:44<218:57:39,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10879/203307 [12:22:44<218:57:39,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10880/203307 [12:22:48<218:57:29,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10880/203307 [12:22:48<218:57:29,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10881/203307 [12:22:52<218:57:19,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:   5%|▌         | 10881/203307 [12:22:52<218:57:19,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10882/203307 [12:22:55<218:57:08,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10882/203307 [12:22:55<218:57:08,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10883/203307 [12:22:59<218:56:57,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10883/203307 [12:22:59<218:56:58,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10884/203307 [12:23:04<218:57:00,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10884/203307 [12:23:04<218:57:00,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10885/203307 [12:23:08<218:57:00,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10885/203307 [12:23:08<218:57:01,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10886/203307 [12:23:12<218:56:57,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10886/203307 [12:23:12<218:56:57,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10887/203307 [12:23:16<218:56:46,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10887/203307 [12:23:16<218:56:47,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10888/203307 [12:23:19<218:56:36,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10888/203307 [12:23:19<218:56:36,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10889/203307 [12:23:23<218:56:24,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10889/203307 [12:23:23<218:56:24,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10890/203307 [12:23:27<218:56:13,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10890/203307 [12:23:27<218:56:13,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10891/203307 [12:23:31<218:56:02,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10891/203307 [12:23:31<218:56:02,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10892/203307 [12:23:35<218:56:03,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10892/203307 [12:23:35<218:56:03,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10893/203307 [12:23:39<218:56:02,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10893/203307 [12:23:39<218:56:02,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10894/203307 [12:23:44<218:56:02,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10894/203307 [12:23:44<218:56:02,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10895/203307 [12:23:48<218:55:59,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10895/203307 [12:23:48<218:55:59,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10896/203307 [12:23:51<218:55:47,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10896/203307 [12:23:51<218:55:48,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10897/203307 [12:23:55<218:55:36,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10897/203307 [12:23:55<218:55:36,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10898/203307 [12:23:59<218:55:24,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10898/203307 [12:23:59<218:55:24,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10899/203307 [12:24:02<218:55:13,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10899/203307 [12:24:02<218:55:13,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10900/203307 [12:24:06<218:55:02,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10900/203307 [12:24:06<218:55:03,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10901/203307 [12:24:10<218:55:03,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   5%|▌         | 10901/203307 [12:24:11<218:55:03,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10902/203307 [12:24:15<218:55:02,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10902/203307 [12:24:15<218:55:02,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10903/203307 [12:24:19<218:55:03,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10903/203307 [12:24:19<218:55:03,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10904/203307 [12:24:23<218:54:59,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10904/203307 [12:24:23<218:54:59,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10905/203307 [12:24:27<218:54:47,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10905/203307 [12:24:27<218:54:47,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10906/203307 [12:24:31<218:54:36,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10906/203307 [12:24:31<218:54:36,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10907/203307 [12:24:34<218:54:24,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10907/203307 [12:24:34<218:54:24,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10908/203307 [12:24:38<218:54:13,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10908/203307 [12:24:38<218:54:13,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10909/203307 [12:24:42<218:54:03,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10909/203307 [12:24:42<218:54:03,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10910/203307 [12:24:46<218:54:05,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10910/203307 [12:24:46<218:54:05,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10911/203307 [12:24:51<218:54:06,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10911/203307 [12:24:51<218:54:06,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10912/203307 [12:24:54<218:53:55,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10912/203307 [12:24:54<218:53:55,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10913/203307 [12:24:58<218:53:52,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10913/203307 [12:24:58<218:53:53,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10914/203307 [12:25:02<218:53:42,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10914/203307 [12:25:02<218:53:42,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10915/203307 [12:25:06<218:53:31,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10915/203307 [12:25:06<218:53:31,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10916/203307 [12:25:10<218:53:19,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10916/203307 [12:25:10<218:53:19,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10917/203307 [12:25:13<218:53:09,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10917/203307 [12:25:13<218:53:09,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10918/203307 [12:25:18<218:53:12,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10918/203307 [12:25:18<218:53:12,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10919/203307 [12:25:21<218:53:01,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10919/203307 [12:25:21<218:53:01,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10920/203307 [12:25:26<218:53:02,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10920/203307 [12:25:26<218:53:02,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10921/203307 [12:25:30<218:52:50,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   5%|▌         | 10921/203307 [12:25:30<218:52:51,  0.24it/s, v_num=t5e6, training/loss=0.092] Epoch 0:   5%|▌         | 10922/203307 [12:25:34<218:52:47,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10922/203307 [12:25:34<218:52:48,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10923/203307 [12:25:37<218:52:36,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10923/203307 [12:25:37<218:52:36,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10924/203307 [12:25:41<218:52:24,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10924/203307 [12:25:41<218:52:25,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10925/203307 [12:25:45<218:52:13,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10925/203307 [12:25:45<218:52:13,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10926/203307 [12:25:48<218:52:03,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10926/203307 [12:25:48<218:52:03,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10927/203307 [12:25:53<218:52:05,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10927/203307 [12:25:53<218:52:05,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10928/203307 [12:25:57<218:51:54,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10928/203307 [12:25:57<218:51:54,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10929/203307 [12:26:01<218:51:54,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10929/203307 [12:26:01<218:51:54,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10930/203307 [12:26:05<218:51:43,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10930/203307 [12:26:05<218:51:43,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10931/203307 [12:26:09<218:51:38,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10931/203307 [12:26:09<218:51:38,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10932/203307 [12:26:12<218:51:27,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10932/203307 [12:26:12<218:51:27,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10933/203307 [12:26:16<218:51:17,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10933/203307 [12:26:16<218:51:17,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10934/203307 [12:26:20<218:51:08,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10934/203307 [12:26:20<218:51:08,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10935/203307 [12:26:24<218:51:08,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10935/203307 [12:26:24<218:51:08,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10936/203307 [12:26:29<218:51:10,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10936/203307 [12:26:29<218:51:10,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10937/203307 [12:26:33<218:51:10,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10937/203307 [12:26:33<218:51:10,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10938/203307 [12:26:37<218:51:00,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10938/203307 [12:26:37<218:51:00,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10939/203307 [12:26:41<218:50:50,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10939/203307 [12:26:41<218:50:50,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10940/203307 [12:26:45<218:50:46,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10940/203307 [12:26:45<218:50:46,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10941/203307 [12:26:48<218:50:35,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:   5%|▌         | 10941/203307 [12:26:48<218:50:35,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10942/203307 [12:26:52<218:50:24,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10942/203307 [12:26:52<218:50:24,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10943/203307 [12:26:56<218:50:23,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10943/203307 [12:26:56<218:50:23,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10944/203307 [12:27:01<218:50:26,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10944/203307 [12:27:01<218:50:26,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10945/203307 [12:27:05<218:50:16,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10945/203307 [12:27:05<218:50:16,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10946/203307 [12:27:09<218:50:16,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10946/203307 [12:27:09<218:50:16,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10947/203307 [12:27:13<218:50:04,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10947/203307 [12:27:13<218:50:04,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10948/203307 [12:27:16<218:49:53,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10948/203307 [12:27:16<218:49:53,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10949/203307 [12:27:20<218:49:50,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10949/203307 [12:27:20<218:49:50,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10950/203307 [12:27:24<218:49:39,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10950/203307 [12:27:24<218:49:40,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10951/203307 [12:27:28<218:49:27,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10951/203307 [12:27:28<218:49:27,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10952/203307 [12:27:32<218:49:27,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10952/203307 [12:27:32<218:49:28,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10953/203307 [12:27:37<218:49:29,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10953/203307 [12:27:37<218:49:29,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10954/203307 [12:27:40<218:49:17,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10954/203307 [12:27:40<218:49:17,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10955/203307 [12:27:45<218:49:18,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10955/203307 [12:27:45<218:49:18,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10956/203307 [12:27:48<218:49:06,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10956/203307 [12:27:48<218:49:07,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10957/203307 [12:27:52<218:48:55,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10957/203307 [12:27:52<218:48:55,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10958/203307 [12:27:56<218:48:56,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10958/203307 [12:27:56<218:48:56,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10959/203307 [12:28:00<218:48:44,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10959/203307 [12:28:00<218:48:44,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10960/203307 [12:28:04<218:48:43,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10960/203307 [12:28:04<218:48:43,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10961/203307 [12:28:08<218:48:34,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   5%|▌         | 10961/203307 [12:28:08<218:48:34,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10962/203307 [12:28:12<218:48:35,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10962/203307 [12:28:12<218:48:35,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10963/203307 [12:28:17<218:48:36,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10963/203307 [12:28:17<218:48:36,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10964/203307 [12:28:21<218:48:24,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10964/203307 [12:28:21<218:48:24,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10965/203307 [12:28:24<218:48:14,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10965/203307 [12:28:24<218:48:14,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10966/203307 [12:28:28<218:48:04,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10966/203307 [12:28:28<218:48:04,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10967/203307 [12:28:32<218:48:03,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10967/203307 [12:28:32<218:48:03,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10968/203307 [12:28:37<218:48:03,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10968/203307 [12:28:37<218:48:04,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10969/203307 [12:28:40<218:47:53,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10969/203307 [12:28:40<218:47:53,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10970/203307 [12:28:45<218:47:54,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10970/203307 [12:28:45<218:47:54,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10971/203307 [12:28:49<218:47:44,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10971/203307 [12:28:49<218:47:44,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10972/203307 [12:28:53<218:47:46,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10972/203307 [12:28:53<218:47:46,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10973/203307 [12:28:57<218:47:37,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10973/203307 [12:28:57<218:47:37,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10974/203307 [12:29:00<218:47:26,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10974/203307 [12:29:00<218:47:26,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10975/203307 [12:29:04<218:47:16,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10975/203307 [12:29:04<218:47:16,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10976/203307 [12:29:08<218:47:15,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10976/203307 [12:29:08<218:47:15,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10977/203307 [12:29:13<218:47:16,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10977/203307 [12:29:13<218:47:16,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10978/203307 [12:29:17<218:47:05,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10978/203307 [12:29:17<218:47:05,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10979/203307 [12:29:21<218:47:10,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10979/203307 [12:29:21<218:47:10,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10980/203307 [12:29:25<218:47:01,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10980/203307 [12:29:25<218:47:01,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10981/203307 [12:29:29<218:47:03,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   5%|▌         | 10981/203307 [12:29:29<218:47:03,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10982/203307 [12:29:33<218:46:53,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10982/203307 [12:29:33<218:46:54,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10983/203307 [12:29:37<218:46:44,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10983/203307 [12:29:37<218:46:44,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10984/203307 [12:29:41<218:46:34,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10984/203307 [12:29:41<218:46:34,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10985/203307 [12:29:45<218:46:37,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10985/203307 [12:29:45<218:46:37,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10986/203307 [12:29:49<218:46:28,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10986/203307 [12:29:49<218:46:28,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10987/203307 [12:29:53<218:46:19,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10987/203307 [12:29:53<218:46:19,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10988/203307 [12:29:57<218:46:23,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10988/203307 [12:29:57<218:46:23,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10989/203307 [12:30:02<218:46:25,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10989/203307 [12:30:02<218:46:25,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10990/203307 [12:30:06<218:46:15,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10990/203307 [12:30:06<218:46:16,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10991/203307 [12:30:09<218:46:06,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10991/203307 [12:30:09<218:46:06,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10992/203307 [12:30:13<218:45:57,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10992/203307 [12:30:13<218:45:57,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10993/203307 [12:30:18<218:45:57,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10993/203307 [12:30:18<218:45:57,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10994/203307 [12:30:22<218:45:54,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10994/203307 [12:30:22<218:45:54,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10995/203307 [12:30:25<218:45:42,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10995/203307 [12:30:25<218:45:42,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10996/203307 [12:30:30<218:45:43,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10996/203307 [12:30:30<218:45:43,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10997/203307 [12:30:34<218:45:32,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10997/203307 [12:30:34<218:45:33,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10998/203307 [12:30:38<218:45:33,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10998/203307 [12:30:38<218:45:34,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10999/203307 [12:30:42<218:45:23,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 10999/203307 [12:30:42<218:45:23,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 11000/203307 [12:30:45<218:45:11,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 11000/203307 [12:30:45<218:45:11,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 11001/203307 [12:30:49<218:45:00,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   5%|▌         | 11001/203307 [12:30:49<218:45:00,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11002/203307 [12:30:53<218:44:59,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11002/203307 [12:30:53<218:45:00,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11003/203307 [12:30:58<218:44:58,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11003/203307 [12:30:58<218:44:58,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11004/203307 [12:31:01<218:44:46,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11004/203307 [12:31:01<218:44:46,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11005/203307 [12:31:06<218:44:48,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11005/203307 [12:31:06<218:44:48,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11006/203307 [12:31:09<218:44:37,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11006/203307 [12:31:09<218:44:37,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11007/203307 [12:31:14<218:44:37,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11007/203307 [12:31:14<218:44:37,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11008/203307 [12:31:17<218:44:27,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11008/203307 [12:31:17<218:44:27,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11009/203307 [12:31:21<218:44:17,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11009/203307 [12:31:21<218:44:18,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11010/203307 [12:31:26<218:44:18,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11010/203307 [12:31:26<218:44:18,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11011/203307 [12:31:29<218:44:07,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11011/203307 [12:31:29<218:44:08,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11012/203307 [12:31:34<218:44:06,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11012/203307 [12:31:34<218:44:06,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11013/203307 [12:31:37<218:43:55,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11013/203307 [12:31:37<218:43:55,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11014/203307 [12:31:42<218:43:58,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11014/203307 [12:31:42<218:43:58,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11015/203307 [12:31:46<218:43:59,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11015/203307 [12:31:46<218:43:59,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11016/203307 [12:31:50<218:43:49,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11016/203307 [12:31:50<218:43:49,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11017/203307 [12:31:54<218:43:38,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11017/203307 [12:31:54<218:43:38,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11018/203307 [12:31:58<218:43:39,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11018/203307 [12:31:58<218:43:39,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11019/203307 [12:32:02<218:43:30,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11019/203307 [12:32:02<218:43:30,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11020/203307 [12:32:06<218:43:19,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11020/203307 [12:32:06<218:43:19,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11021/203307 [12:32:10<218:43:19,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   5%|▌         | 11021/203307 [12:32:10<218:43:19,  0.24it/s, v_num=t5e6, training/loss=0.089] Epoch 0:   5%|▌         | 11022/203307 [12:32:14<218:43:21,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11022/203307 [12:32:14<218:43:21,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11023/203307 [12:32:18<218:43:11,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11023/203307 [12:32:18<218:43:11,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11024/203307 [12:32:22<218:43:13,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11024/203307 [12:32:22<218:43:13,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11025/203307 [12:32:26<218:43:03,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11025/203307 [12:32:26<218:43:03,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11026/203307 [12:32:30<218:42:54,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11026/203307 [12:32:30<218:42:54,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11027/203307 [12:32:34<218:42:56,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11027/203307 [12:32:34<218:42:56,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11028/203307 [12:32:38<218:42:46,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11028/203307 [12:32:38<218:42:46,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11029/203307 [12:32:42<218:42:35,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11029/203307 [12:32:42<218:42:35,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11030/203307 [12:32:46<218:42:33,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11030/203307 [12:32:46<218:42:33,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11031/203307 [12:32:51<218:42:34,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11031/203307 [12:32:51<218:42:34,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11032/203307 [12:32:54<218:42:23,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11032/203307 [12:32:54<218:42:23,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11033/203307 [12:32:59<218:42:24,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11033/203307 [12:32:59<218:42:24,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11034/203307 [12:33:02<218:42:13,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11034/203307 [12:33:02<218:42:13,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11035/203307 [12:33:07<218:42:12,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11035/203307 [12:33:07<218:42:12,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11036/203307 [12:33:10<218:42:01,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11036/203307 [12:33:10<218:42:02,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11037/203307 [12:33:14<218:41:50,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11037/203307 [12:33:14<218:41:51,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11038/203307 [12:33:18<218:41:41,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11038/203307 [12:33:18<218:41:41,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11039/203307 [12:33:22<218:41:38,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11039/203307 [12:33:22<218:41:38,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11040/203307 [12:33:26<218:41:40,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11040/203307 [12:33:26<218:41:41,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11041/203307 [12:33:31<218:41:41,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   5%|▌         | 11041/203307 [12:33:31<218:41:41,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11042/203307 [12:33:35<218:41:32,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11042/203307 [12:33:35<218:41:32,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11043/203307 [12:33:39<218:41:32,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11043/203307 [12:33:39<218:41:32,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11044/203307 [12:33:43<218:41:22,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11044/203307 [12:33:43<218:41:22,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11045/203307 [12:33:46<218:41:11,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11045/203307 [12:33:46<218:41:11,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11046/203307 [12:33:50<218:41:01,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11046/203307 [12:33:50<218:41:01,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11047/203307 [12:33:54<218:40:50,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11047/203307 [12:33:54<218:40:50,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11048/203307 [12:33:58<218:40:54,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11048/203307 [12:33:58<218:40:54,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11049/203307 [12:34:02<218:40:44,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11049/203307 [12:34:02<218:40:44,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11050/203307 [12:34:07<218:40:46,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11050/203307 [12:34:07<218:40:46,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11051/203307 [12:34:10<218:40:35,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11051/203307 [12:34:10<218:40:36,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11052/203307 [12:34:15<218:40:35,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11052/203307 [12:34:15<218:40:35,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11053/203307 [12:34:19<218:40:27,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11053/203307 [12:34:19<218:40:27,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11054/203307 [12:34:22<218:40:17,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11054/203307 [12:34:22<218:40:17,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11055/203307 [12:34:26<218:40:06,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11055/203307 [12:34:26<218:40:06,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11056/203307 [12:34:30<218:39:56,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11056/203307 [12:34:30<218:39:57,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11057/203307 [12:34:34<218:39:58,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11057/203307 [12:34:34<218:39:58,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11058/203307 [12:34:38<218:39:47,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11058/203307 [12:34:38<218:39:48,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11059/203307 [12:34:42<218:39:48,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11059/203307 [12:34:42<218:39:48,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11060/203307 [12:34:46<218:39:46,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11060/203307 [12:34:46<218:39:46,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11061/203307 [12:34:50<218:39:36,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   5%|▌         | 11061/203307 [12:34:50<218:39:36,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11062/203307 [12:34:54<218:39:25,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11062/203307 [12:34:54<218:39:26,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11063/203307 [12:34:58<218:39:15,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11063/203307 [12:34:58<218:39:15,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11064/203307 [12:35:01<218:39:04,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11064/203307 [12:35:01<218:39:04,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11065/203307 [12:35:05<218:38:53,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11065/203307 [12:35:05<218:38:53,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11066/203307 [12:35:09<218:38:55,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11066/203307 [12:35:09<218:38:55,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11067/203307 [12:35:14<218:38:56,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11067/203307 [12:35:14<218:38:56,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11068/203307 [12:35:18<218:38:56,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11068/203307 [12:35:18<218:38:56,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11069/203307 [12:35:22<218:38:45,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11069/203307 [12:35:22<218:38:45,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11070/203307 [12:35:26<218:38:34,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11070/203307 [12:35:26<218:38:34,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11071/203307 [12:35:29<218:38:24,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11071/203307 [12:35:29<218:38:24,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11072/203307 [12:35:33<218:38:13,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11072/203307 [12:35:33<218:38:13,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11073/203307 [12:35:37<218:38:02,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11073/203307 [12:35:37<218:38:02,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11074/203307 [12:35:41<218:38:03,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11074/203307 [12:35:41<218:38:04,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11075/203307 [12:35:45<218:38:03,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11075/203307 [12:35:45<218:38:03,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11076/203307 [12:35:50<218:38:04,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11076/203307 [12:35:50<218:38:04,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11077/203307 [12:35:54<218:38:04,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11077/203307 [12:35:54<218:38:04,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11078/203307 [12:35:58<218:37:52,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11078/203307 [12:35:58<218:37:52,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11079/203307 [12:36:02<218:37:42,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11079/203307 [12:36:02<218:37:42,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11080/203307 [12:36:05<218:37:32,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11080/203307 [12:36:05<218:37:32,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11081/203307 [12:36:09<218:37:21,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   5%|▌         | 11081/203307 [12:36:09<218:37:21,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11082/203307 [12:36:13<218:37:11,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11082/203307 [12:36:13<218:37:11,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11083/203307 [12:36:17<218:37:14,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11083/203307 [12:36:17<218:37:14,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11084/203307 [12:36:21<218:37:10,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11084/203307 [12:36:21<218:37:11,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11085/203307 [12:36:26<218:37:11,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11085/203307 [12:36:26<218:37:12,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11086/203307 [12:36:30<218:37:01,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11086/203307 [12:36:30<218:37:01,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11087/203307 [12:36:33<218:36:50,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11087/203307 [12:36:33<218:36:50,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11088/203307 [12:36:37<218:36:39,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11088/203307 [12:36:37<218:36:40,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11089/203307 [12:36:41<218:36:30,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11089/203307 [12:36:41<218:36:30,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11090/203307 [12:36:45<218:36:20,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11090/203307 [12:36:45<218:36:20,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11091/203307 [12:36:48<218:36:10,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11091/203307 [12:36:48<218:36:10,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11092/203307 [12:36:53<218:36:14,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11092/203307 [12:36:53<218:36:14,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11093/203307 [12:36:57<218:36:16,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11093/203307 [12:36:57<218:36:16,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11094/203307 [12:37:01<218:36:06,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11094/203307 [12:37:01<218:36:06,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11095/203307 [12:37:05<218:35:58,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11095/203307 [12:37:05<218:35:58,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11096/203307 [12:37:09<218:35:49,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11096/203307 [12:37:09<218:35:49,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11097/203307 [12:37:12<218:35:39,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11097/203307 [12:37:12<218:35:39,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11098/203307 [12:37:16<218:35:29,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11098/203307 [12:37:16<218:35:30,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11099/203307 [12:37:20<218:35:19,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11099/203307 [12:37:20<218:35:19,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11100/203307 [12:37:24<218:35:21,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11100/203307 [12:37:24<218:35:21,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11101/203307 [12:37:28<218:35:11,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   5%|▌         | 11101/203307 [12:37:28<218:35:11,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11102/203307 [12:37:33<218:35:12,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11102/203307 [12:37:33<218:35:12,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11103/203307 [12:37:36<218:35:01,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11103/203307 [12:37:36<218:35:01,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11104/203307 [12:37:40<218:34:50,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11104/203307 [12:37:40<218:34:50,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11105/203307 [12:37:44<218:34:39,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11105/203307 [12:37:44<218:34:39,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11106/203307 [12:37:47<218:34:28,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11106/203307 [12:37:47<218:34:28,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11107/203307 [12:37:51<218:34:18,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11107/203307 [12:37:51<218:34:18,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11108/203307 [12:37:55<218:34:08,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11108/203307 [12:37:55<218:34:08,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11109/203307 [12:37:59<218:34:12,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11109/203307 [12:37:59<218:34:12,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11110/203307 [12:38:04<218:34:11,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11110/203307 [12:38:04<218:34:11,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11111/203307 [12:38:08<218:34:12,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11111/203307 [12:38:08<218:34:12,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11112/203307 [12:38:12<218:34:00,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11112/203307 [12:38:12<218:34:00,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11113/203307 [12:38:15<218:33:49,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11113/203307 [12:38:15<218:33:49,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11114/203307 [12:38:19<218:33:39,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11114/203307 [12:38:19<218:33:39,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11115/203307 [12:38:23<218:33:30,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11115/203307 [12:38:23<218:33:30,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11116/203307 [12:38:27<218:33:20,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11116/203307 [12:38:27<218:33:20,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11117/203307 [12:38:30<218:33:09,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11117/203307 [12:38:30<218:33:10,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11118/203307 [12:38:35<218:33:12,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11118/203307 [12:38:35<218:33:12,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11119/203307 [12:38:39<218:33:14,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11119/203307 [12:38:39<218:33:14,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11120/203307 [12:38:44<218:33:11,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11120/203307 [12:38:44<218:33:11,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11121/203307 [12:38:47<218:33:00,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   5%|▌         | 11121/203307 [12:38:47<218:33:00,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11122/203307 [12:38:51<218:32:50,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11122/203307 [12:38:51<218:32:50,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11123/203307 [12:38:55<218:32:40,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11123/203307 [12:38:55<218:32:40,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11124/203307 [12:38:58<218:32:30,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11124/203307 [12:38:58<218:32:30,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11125/203307 [12:39:02<218:32:21,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11125/203307 [12:39:02<218:32:21,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11126/203307 [12:39:07<218:32:23,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11126/203307 [12:39:07<218:32:23,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11127/203307 [12:39:11<218:32:23,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11127/203307 [12:39:11<218:32:23,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11128/203307 [12:39:16<218:32:26,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11128/203307 [12:39:16<218:32:26,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11129/203307 [12:39:20<218:32:25,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11129/203307 [12:39:20<218:32:25,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11130/203307 [12:39:24<218:32:14,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11130/203307 [12:39:24<218:32:14,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11131/203307 [12:39:27<218:32:04,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11131/203307 [12:39:27<218:32:04,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11132/203307 [12:39:31<218:31:53,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11132/203307 [12:39:31<218:31:53,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11133/203307 [12:39:35<218:31:43,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11133/203307 [12:39:35<218:31:43,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11134/203307 [12:39:38<218:31:33,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11134/203307 [12:39:38<218:31:33,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11135/203307 [12:39:43<218:31:36,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11135/203307 [12:39:43<218:31:36,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11136/203307 [12:39:47<218:31:26,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11136/203307 [12:39:47<218:31:26,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11137/203307 [12:39:51<218:31:28,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11137/203307 [12:39:51<218:31:28,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11138/203307 [12:39:55<218:31:26,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11138/203307 [12:39:55<218:31:26,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11139/203307 [12:39:59<218:31:15,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11139/203307 [12:39:59<218:31:15,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11140/203307 [12:40:03<218:31:05,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11140/203307 [12:40:03<218:31:05,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11141/203307 [12:40:07<218:30:55,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   5%|▌         | 11141/203307 [12:40:07<218:30:56,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11142/203307 [12:40:10<218:30:45,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11142/203307 [12:40:10<218:30:45,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11143/203307 [12:40:15<218:30:46,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11143/203307 [12:40:15<218:30:46,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11144/203307 [12:40:19<218:30:47,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11144/203307 [12:40:19<218:30:47,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11145/203307 [12:40:24<218:30:49,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11145/203307 [12:40:24<218:30:49,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11146/203307 [12:40:27<218:30:39,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11146/203307 [12:40:27<218:30:39,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11147/203307 [12:40:31<218:30:36,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11147/203307 [12:40:31<218:30:36,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11148/203307 [12:40:35<218:30:27,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11148/203307 [12:40:35<218:30:27,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11149/203307 [12:40:39<218:30:17,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11149/203307 [12:40:39<218:30:17,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11150/203307 [12:40:43<218:30:07,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11150/203307 [12:40:43<218:30:07,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11151/203307 [12:40:46<218:29:56,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11151/203307 [12:40:46<218:29:57,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11152/203307 [12:40:51<218:29:58,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11152/203307 [12:40:51<218:29:59,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11153/203307 [12:40:55<218:29:49,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11153/203307 [12:40:55<218:29:50,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11154/203307 [12:40:59<218:29:51,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11154/203307 [12:40:59<218:29:51,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11155/203307 [12:41:03<218:29:42,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11155/203307 [12:41:03<218:29:42,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11156/203307 [12:41:07<218:29:38,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11156/203307 [12:41:07<218:29:39,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11157/203307 [12:41:11<218:29:27,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11157/203307 [12:41:11<218:29:27,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11158/203307 [12:41:14<218:29:16,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11158/203307 [12:41:14<218:29:16,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11159/203307 [12:41:18<218:29:07,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11159/203307 [12:41:18<218:29:07,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11160/203307 [12:41:23<218:29:08,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11160/203307 [12:41:23<218:29:08,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11161/203307 [12:41:27<218:29:09,  0.24it/s, v_num=t5e6, training/loss=0.0956]Epoch 0:   5%|▌         | 11161/203307 [12:41:27<218:29:09,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11162/203307 [12:41:31<218:28:59,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11162/203307 [12:41:31<218:28:59,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11163/203307 [12:41:35<218:29:00,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11163/203307 [12:41:35<218:29:00,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11164/203307 [12:41:39<218:28:48,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11164/203307 [12:41:39<218:28:48,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11165/203307 [12:41:43<218:28:46,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11165/203307 [12:41:43<218:28:46,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11166/203307 [12:41:47<218:28:35,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11166/203307 [12:41:47<218:28:36,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11167/203307 [12:41:50<218:28:25,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11167/203307 [12:41:50<218:28:25,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11168/203307 [12:41:55<218:28:24,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11168/203307 [12:41:55<218:28:24,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11169/203307 [12:41:59<218:28:15,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11169/203307 [12:41:59<218:28:15,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11170/203307 [12:42:03<218:28:16,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11170/203307 [12:42:03<218:28:17,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11171/203307 [12:42:07<218:28:17,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11171/203307 [12:42:07<218:28:17,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11172/203307 [12:42:11<218:28:06,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11172/203307 [12:42:11<218:28:06,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11173/203307 [12:42:15<218:27:55,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11173/203307 [12:42:15<218:27:55,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11174/203307 [12:42:19<218:27:52,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11174/203307 [12:42:19<218:27:52,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11175/203307 [12:42:23<218:27:42,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11175/203307 [12:42:23<218:27:42,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11176/203307 [12:42:26<218:27:31,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11176/203307 [12:42:26<218:27:31,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11177/203307 [12:42:31<218:27:30,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11177/203307 [12:42:31<218:27:30,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11178/203307 [12:42:35<218:27:31,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11178/203307 [12:42:35<218:27:31,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11179/203307 [12:42:39<218:27:20,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11179/203307 [12:42:39<218:27:20,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11180/203307 [12:42:43<218:27:20,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11180/203307 [12:42:43<218:27:20,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11181/203307 [12:42:47<218:27:09,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   5%|▌         | 11181/203307 [12:42:47<218:27:09,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11182/203307 [12:42:50<218:26:58,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11182/203307 [12:42:50<218:26:58,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11183/203307 [12:42:55<218:26:56,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11183/203307 [12:42:55<218:26:56,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11184/203307 [12:42:58<218:26:45,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11184/203307 [12:42:58<218:26:46,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11185/203307 [12:43:03<218:26:44,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11185/203307 [12:43:03<218:26:44,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11186/203307 [12:43:06<218:26:32,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11186/203307 [12:43:06<218:26:33,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11187/203307 [12:43:11<218:26:34,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11187/203307 [12:43:11<218:26:34,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11188/203307 [12:43:14<218:26:22,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11188/203307 [12:43:14<218:26:22,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11189/203307 [12:43:19<218:26:24,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11189/203307 [12:43:19<218:26:24,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11190/203307 [12:43:22<218:26:12,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11190/203307 [12:43:22<218:26:12,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11191/203307 [12:43:26<218:26:01,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11191/203307 [12:43:26<218:26:02,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11192/203307 [12:43:30<218:26:01,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11192/203307 [12:43:30<218:26:01,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11193/203307 [12:43:35<218:26:01,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11193/203307 [12:43:35<218:26:01,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11194/203307 [12:43:38<218:25:49,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11194/203307 [12:43:38<218:25:49,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11195/203307 [12:43:42<218:25:38,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11195/203307 [12:43:42<218:25:39,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11196/203307 [12:43:46<218:25:40,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11196/203307 [12:43:47<218:25:40,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11197/203307 [12:43:51<218:25:41,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11197/203307 [12:43:51<218:25:41,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11198/203307 [12:43:55<218:25:29,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11198/203307 [12:43:55<218:25:29,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11199/203307 [12:43:58<218:25:17,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11199/203307 [12:43:58<218:25:18,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11200/203307 [12:44:02<218:25:08,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11200/203307 [12:44:02<218:25:08,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11201/203307 [12:44:06<218:25:08,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▌         | 11201/203307 [12:44:06<218:25:08,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11202/203307 [12:44:11<218:25:07,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11202/203307 [12:44:11<218:25:07,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11203/203307 [12:44:14<218:24:55,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11203/203307 [12:44:14<218:24:55,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11204/203307 [12:44:19<218:24:56,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11204/203307 [12:44:19<218:24:57,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11205/203307 [12:44:22<218:24:48,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11205/203307 [12:44:22<218:24:48,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11206/203307 [12:44:27<218:24:49,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11206/203307 [12:44:27<218:24:49,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11207/203307 [12:44:31<218:24:39,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11207/203307 [12:44:31<218:24:39,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11208/203307 [12:44:34<218:24:28,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11208/203307 [12:44:34<218:24:28,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11209/203307 [12:44:38<218:24:18,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11209/203307 [12:44:38<218:24:18,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11210/203307 [12:44:42<218:24:19,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11210/203307 [12:44:42<218:24:19,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11211/203307 [12:44:46<218:24:09,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11211/203307 [12:44:46<218:24:09,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11212/203307 [12:44:50<218:24:00,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11212/203307 [12:44:50<218:24:00,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11213/203307 [12:44:54<218:24:03,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11213/203307 [12:44:54<218:24:03,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11214/203307 [12:44:58<218:23:53,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11214/203307 [12:44:58<218:23:53,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11215/203307 [12:45:03<218:23:54,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11215/203307 [12:45:03<218:23:54,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11216/203307 [12:45:06<218:23:45,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11216/203307 [12:45:06<218:23:45,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11217/203307 [12:45:10<218:23:35,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11217/203307 [12:45:10<218:23:35,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11218/203307 [12:45:14<218:23:35,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11218/203307 [12:45:14<218:23:35,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11219/203307 [12:45:19<218:23:34,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11219/203307 [12:45:19<218:23:34,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11220/203307 [12:45:22<218:23:24,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11220/203307 [12:45:23<218:23:24,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11221/203307 [12:45:26<218:23:13,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 11221/203307 [12:45:26<218:23:13,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11222/203307 [12:45:31<218:23:16,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11222/203307 [12:45:31<218:23:16,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11223/203307 [12:45:35<218:23:16,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11223/203307 [12:45:35<218:23:16,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11224/203307 [12:45:39<218:23:05,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11224/203307 [12:45:39<218:23:05,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11225/203307 [12:45:43<218:22:56,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11225/203307 [12:45:43<218:22:56,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11226/203307 [12:45:46<218:22:45,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11226/203307 [12:45:46<218:22:45,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11227/203307 [12:45:51<218:22:45,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11227/203307 [12:45:51<218:22:45,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11228/203307 [12:45:55<218:22:44,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11228/203307 [12:45:55<218:22:44,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11229/203307 [12:45:58<218:22:32,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11229/203307 [12:45:59<218:22:33,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11230/203307 [12:46:03<218:22:33,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11230/203307 [12:46:03<218:22:33,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11231/203307 [12:46:07<218:22:23,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11231/203307 [12:46:07<218:22:23,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11232/203307 [12:46:11<218:22:25,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11232/203307 [12:46:11<218:22:25,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11233/203307 [12:46:15<218:22:15,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11233/203307 [12:46:15<218:22:16,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11234/203307 [12:46:19<218:22:05,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11234/203307 [12:46:19<218:22:05,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11235/203307 [12:46:23<218:22:05,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11235/203307 [12:46:23<218:22:06,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11236/203307 [12:46:27<218:21:56,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11236/203307 [12:46:27<218:21:56,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11237/203307 [12:46:31<218:21:53,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11237/203307 [12:46:31<218:21:53,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11238/203307 [12:46:35<218:21:43,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11238/203307 [12:46:35<218:21:43,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11239/203307 [12:46:39<218:21:45,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11239/203307 [12:46:39<218:21:45,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11240/203307 [12:46:43<218:21:34,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11240/203307 [12:46:43<218:21:34,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11241/203307 [12:46:47<218:21:36,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11241/203307 [12:46:47<218:21:36,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11242/203307 [12:46:51<218:21:25,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11242/203307 [12:46:51<218:21:25,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11243/203307 [12:46:55<218:21:25,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11243/203307 [12:46:55<218:21:25,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11244/203307 [12:46:59<218:21:15,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11244/203307 [12:46:59<218:21:15,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11245/203307 [12:47:03<218:21:05,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11245/203307 [12:47:03<218:21:05,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11246/203307 [12:47:07<218:21:02,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11246/203307 [12:47:07<218:21:02,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11247/203307 [12:47:11<218:20:53,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11247/203307 [12:47:11<218:20:53,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11248/203307 [12:47:15<218:20:55,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11248/203307 [12:47:15<218:20:55,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11249/203307 [12:47:19<218:20:56,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11249/203307 [12:47:19<218:20:56,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11250/203307 [12:47:23<218:20:46,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11250/203307 [12:47:23<218:20:46,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11251/203307 [12:47:27<218:20:35,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11251/203307 [12:47:27<218:20:35,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11252/203307 [12:47:31<218:20:35,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11252/203307 [12:47:31<218:20:36,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11253/203307 [12:47:35<218:20:24,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11253/203307 [12:47:35<218:20:24,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11254/203307 [12:47:39<218:20:13,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11254/203307 [12:47:39<218:20:14,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11255/203307 [12:47:43<218:20:11,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11255/203307 [12:47:43<218:20:11,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11256/203307 [12:47:47<218:20:11,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11256/203307 [12:47:47<218:20:11,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11257/203307 [12:47:51<218:20:01,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11257/203307 [12:47:51<218:20:01,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11258/203307 [12:47:55<218:20:02,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11258/203307 [12:47:55<218:20:02,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11259/203307 [12:47:59<218:19:50,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11259/203307 [12:47:59<218:19:50,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11260/203307 [12:48:03<218:19:49,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11260/203307 [12:48:03<218:19:49,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11261/203307 [12:48:07<218:19:39,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   6%|▌         | 11261/203307 [12:48:07<218:19:39,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11262/203307 [12:48:11<218:19:27,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11262/203307 [12:48:11<218:19:27,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11263/203307 [12:48:14<218:19:16,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11263/203307 [12:48:14<218:19:16,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11264/203307 [12:48:19<218:19:16,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11264/203307 [12:48:19<218:19:16,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11265/203307 [12:48:23<218:19:18,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11265/203307 [12:48:23<218:19:18,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11266/203307 [12:48:27<218:19:07,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11266/203307 [12:48:27<218:19:07,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11267/203307 [12:48:31<218:19:07,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11267/203307 [12:48:31<218:19:07,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11268/203307 [12:48:35<218:19:05,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11268/203307 [12:48:35<218:19:06,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11269/203307 [12:48:39<218:18:54,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11269/203307 [12:48:39<218:18:54,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11270/203307 [12:48:43<218:18:43,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11270/203307 [12:48:43<218:18:43,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11271/203307 [12:48:46<218:18:33,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11271/203307 [12:48:46<218:18:33,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11272/203307 [12:48:50<218:18:22,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11272/203307 [12:48:50<218:18:22,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11273/203307 [12:48:54<218:18:20,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11273/203307 [12:48:54<218:18:20,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11274/203307 [12:48:59<218:18:21,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11274/203307 [12:48:59<218:18:21,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11275/203307 [12:49:03<218:18:21,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11275/203307 [12:49:03<218:18:21,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11276/203307 [12:49:07<218:18:10,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11276/203307 [12:49:07<218:18:10,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11277/203307 [12:49:11<218:18:09,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11277/203307 [12:49:11<218:18:09,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11278/203307 [12:49:15<218:18:00,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11278/203307 [12:49:15<218:18:00,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11279/203307 [12:49:19<218:17:49,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11279/203307 [12:49:19<218:17:49,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11280/203307 [12:49:22<218:17:39,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11280/203307 [12:49:22<218:17:39,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11281/203307 [12:49:26<218:17:28,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 11281/203307 [12:49:26<218:17:28,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11282/203307 [12:49:30<218:17:30,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11282/203307 [12:49:30<218:17:30,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11283/203307 [12:49:34<218:17:20,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11283/203307 [12:49:34<218:17:20,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11284/203307 [12:49:39<218:17:21,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11284/203307 [12:49:39<218:17:21,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11285/203307 [12:49:43<218:17:20,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11285/203307 [12:49:43<218:17:20,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11286/203307 [12:49:47<218:17:10,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11286/203307 [12:49:47<218:17:10,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11287/203307 [12:49:50<218:16:59,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11287/203307 [12:49:50<218:16:59,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11288/203307 [12:49:54<218:16:49,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11288/203307 [12:49:54<218:16:49,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11289/203307 [12:49:58<218:16:39,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11289/203307 [12:49:58<218:16:39,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11290/203307 [12:50:01<218:16:29,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11290/203307 [12:50:01<218:16:29,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11291/203307 [12:50:06<218:16:31,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11291/203307 [12:50:06<218:16:31,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11292/203307 [12:50:10<218:16:20,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11292/203307 [12:50:10<218:16:20,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11293/203307 [12:50:14<218:16:21,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11293/203307 [12:50:14<218:16:21,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11294/203307 [12:50:18<218:16:11,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11294/203307 [12:50:18<218:16:12,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11295/203307 [12:50:22<218:16:02,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11295/203307 [12:50:22<218:16:02,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11296/203307 [12:50:25<218:15:53,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11296/203307 [12:50:25<218:15:53,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11297/203307 [12:50:29<218:15:43,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11297/203307 [12:50:29<218:15:43,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11298/203307 [12:50:33<218:15:35,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11298/203307 [12:50:33<218:15:35,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11299/203307 [12:50:37<218:15:25,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11299/203307 [12:50:37<218:15:25,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11300/203307 [12:50:41<218:15:26,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11300/203307 [12:50:41<218:15:26,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11301/203307 [12:50:46<218:15:28,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   6%|▌         | 11301/203307 [12:50:46<218:15:28,  0.24it/s, v_num=t5e6, training/loss=0.094] Epoch 0:   6%|▌         | 11302/203307 [12:50:50<218:15:27,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11302/203307 [12:50:50<218:15:27,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11303/203307 [12:50:54<218:15:16,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11303/203307 [12:50:54<218:15:16,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11304/203307 [12:50:57<218:15:06,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11304/203307 [12:50:57<218:15:06,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11305/203307 [12:51:01<218:14:56,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11305/203307 [12:51:01<218:14:56,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11306/203307 [12:51:05<218:14:46,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11306/203307 [12:51:05<218:14:46,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11307/203307 [12:51:08<218:14:36,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11307/203307 [12:51:08<218:14:36,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11308/203307 [12:51:13<218:14:36,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11308/203307 [12:51:13<218:14:36,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11309/203307 [12:51:17<218:14:35,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11309/203307 [12:51:17<218:14:35,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11310/203307 [12:51:22<218:14:38,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11310/203307 [12:51:22<218:14:38,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11311/203307 [12:51:25<218:14:29,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11311/203307 [12:51:25<218:14:29,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11312/203307 [12:51:29<218:14:19,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11312/203307 [12:51:29<218:14:19,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11313/203307 [12:51:33<218:14:09,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11313/203307 [12:51:33<218:14:09,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11314/203307 [12:51:37<218:13:59,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11314/203307 [12:51:37<218:13:59,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11315/203307 [12:51:40<218:13:48,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11315/203307 [12:51:40<218:13:48,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11316/203307 [12:51:44<218:13:37,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11316/203307 [12:51:44<218:13:37,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11317/203307 [12:51:48<218:13:39,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11317/203307 [12:51:48<218:13:39,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11318/203307 [12:51:53<218:13:39,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11318/203307 [12:51:53<218:13:39,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11319/203307 [12:51:57<218:13:39,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11319/203307 [12:51:57<218:13:39,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11320/203307 [12:52:01<218:13:28,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11320/203307 [12:52:01<218:13:28,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11321/203307 [12:52:04<218:13:17,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   6%|▌         | 11321/203307 [12:52:04<218:13:17,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11322/203307 [12:52:08<218:13:05,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11322/203307 [12:52:08<218:13:05,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11323/203307 [12:52:12<218:12:55,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11323/203307 [12:52:12<218:12:55,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11324/203307 [12:52:16<218:12:45,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11324/203307 [12:52:16<218:12:45,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11325/203307 [12:52:19<218:12:35,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11325/203307 [12:52:19<218:12:35,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11326/203307 [12:52:24<218:12:38,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11326/203307 [12:52:24<218:12:38,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11327/203307 [12:52:28<218:12:40,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11327/203307 [12:52:28<218:12:40,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11328/203307 [12:52:32<218:12:28,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11328/203307 [12:52:32<218:12:28,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11329/203307 [12:52:36<218:12:17,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11329/203307 [12:52:36<218:12:17,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11330/203307 [12:52:39<218:12:07,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11330/203307 [12:52:39<218:12:07,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11331/203307 [12:52:43<218:11:56,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11331/203307 [12:52:43<218:11:56,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11332/203307 [12:52:47<218:11:47,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11332/203307 [12:52:47<218:11:48,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11333/203307 [12:52:51<218:11:37,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11333/203307 [12:52:51<218:11:37,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11334/203307 [12:52:55<218:11:39,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11334/203307 [12:52:55<218:11:39,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11335/203307 [12:52:59<218:11:38,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11335/203307 [12:52:59<218:11:38,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11336/203307 [12:53:04<218:11:39,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11336/203307 [12:53:04<218:11:39,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11337/203307 [12:53:07<218:11:28,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11337/203307 [12:53:07<218:11:28,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11338/203307 [12:53:11<218:11:19,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11338/203307 [12:53:11<218:11:19,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11339/203307 [12:53:15<218:11:09,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11339/203307 [12:53:15<218:11:10,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11340/203307 [12:53:19<218:11:00,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11340/203307 [12:53:19<218:11:00,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11341/203307 [12:53:23<218:10:52,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   6%|▌         | 11341/203307 [12:53:23<218:10:53,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11342/203307 [12:53:26<218:10:43,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11342/203307 [12:53:26<218:10:43,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11343/203307 [12:53:31<218:10:44,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11343/203307 [12:53:31<218:10:45,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11344/203307 [12:53:35<218:10:35,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11344/203307 [12:53:35<218:10:35,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11345/203307 [12:53:39<218:10:38,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11345/203307 [12:53:39<218:10:38,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11346/203307 [12:53:43<218:10:29,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11346/203307 [12:53:43<218:10:29,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11347/203307 [12:53:47<218:10:18,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11347/203307 [12:53:47<218:10:18,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11348/203307 [12:53:50<218:10:10,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11348/203307 [12:53:50<218:10:10,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11349/203307 [12:53:54<218:10:01,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11349/203307 [12:53:54<218:10:01,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11350/203307 [12:53:58<218:09:51,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11350/203307 [12:53:58<218:09:51,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11351/203307 [12:54:02<218:09:43,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11351/203307 [12:54:02<218:09:43,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11352/203307 [12:54:06<218:09:46,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11352/203307 [12:54:06<218:09:46,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11353/203307 [12:54:11<218:09:48,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11353/203307 [12:54:11<218:09:48,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11354/203307 [12:54:15<218:09:47,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11354/203307 [12:54:15<218:09:47,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11355/203307 [12:54:19<218:09:38,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11355/203307 [12:54:19<218:09:38,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11356/203307 [12:54:23<218:09:28,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11356/203307 [12:54:23<218:09:28,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11357/203307 [12:54:26<218:09:19,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11357/203307 [12:54:26<218:09:19,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11358/203307 [12:54:30<218:09:10,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11358/203307 [12:54:30<218:09:10,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11359/203307 [12:54:34<218:09:00,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11359/203307 [12:54:34<218:09:00,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11360/203307 [12:54:38<218:09:03,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11360/203307 [12:54:38<218:09:03,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11361/203307 [12:54:42<218:08:52,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   6%|▌         | 11361/203307 [12:54:42<218:08:52,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11362/203307 [12:54:47<218:08:54,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11362/203307 [12:54:47<218:08:54,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11363/203307 [12:54:51<218:08:52,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11363/203307 [12:54:51<218:08:52,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11364/203307 [12:54:54<218:08:41,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11364/203307 [12:54:55<218:08:41,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11365/203307 [12:54:58<218:08:30,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11365/203307 [12:54:58<218:08:30,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11366/203307 [12:55:02<218:08:21,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11366/203307 [12:55:02<218:08:21,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11367/203307 [12:55:06<218:08:10,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11367/203307 [12:55:06<218:08:11,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11368/203307 [12:55:10<218:08:11,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11368/203307 [12:55:10<218:08:11,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11369/203307 [12:55:15<218:08:13,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11369/203307 [12:55:15<218:08:13,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11370/203307 [12:55:18<218:08:02,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11370/203307 [12:55:18<218:08:03,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11371/203307 [12:55:23<218:08:04,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11371/203307 [12:55:23<218:08:04,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11372/203307 [12:55:27<218:08:01,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11372/203307 [12:55:27<218:08:01,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11373/203307 [12:55:31<218:07:51,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11373/203307 [12:55:31<218:07:51,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11374/203307 [12:55:34<218:07:41,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11374/203307 [12:55:34<218:07:41,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11375/203307 [12:55:38<218:07:31,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11375/203307 [12:55:38<218:07:31,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11376/203307 [12:55:42<218:07:20,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11376/203307 [12:55:42<218:07:20,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11377/203307 [12:55:46<218:07:22,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11377/203307 [12:55:46<218:07:22,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11378/203307 [12:55:51<218:07:24,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11378/203307 [12:55:51<218:07:24,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11379/203307 [12:55:55<218:07:25,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11379/203307 [12:55:55<218:07:25,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11380/203307 [12:55:59<218:07:15,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11380/203307 [12:55:59<218:07:16,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11381/203307 [12:56:03<218:07:14,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   6%|▌         | 11381/203307 [12:56:03<218:07:14,  0.24it/s, v_num=t5e6, training/loss=0.089] Epoch 0:   6%|▌         | 11382/203307 [12:56:07<218:07:03,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11382/203307 [12:56:07<218:07:04,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11383/203307 [12:56:11<218:06:55,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11383/203307 [12:56:11<218:06:55,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11384/203307 [12:56:14<218:06:46,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11384/203307 [12:56:14<218:06:46,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11385/203307 [12:56:19<218:06:46,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11385/203307 [12:56:19<218:06:46,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11386/203307 [12:56:23<218:06:49,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11386/203307 [12:56:23<218:06:49,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11387/203307 [12:56:27<218:06:40,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11387/203307 [12:56:27<218:06:41,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11388/203307 [12:56:32<218:06:43,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11388/203307 [12:56:32<218:06:43,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11389/203307 [12:56:35<218:06:33,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11389/203307 [12:56:35<218:06:33,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11390/203307 [12:56:39<218:06:31,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11390/203307 [12:56:40<218:06:31,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11391/203307 [12:56:43<218:06:21,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11391/203307 [12:56:43<218:06:21,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11392/203307 [12:56:47<218:06:11,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11392/203307 [12:56:47<218:06:11,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11393/203307 [12:56:51<218:06:11,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11393/203307 [12:56:51<218:06:11,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11394/203307 [12:56:55<218:06:02,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11394/203307 [12:56:55<218:06:02,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11395/203307 [12:57:00<218:06:05,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11395/203307 [12:57:00<218:06:05,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11396/203307 [12:57:03<218:05:55,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11396/203307 [12:57:03<218:05:56,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11397/203307 [12:57:08<218:05:57,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11397/203307 [12:57:08<218:05:57,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11398/203307 [12:57:12<218:05:47,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11398/203307 [12:57:12<218:05:47,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11399/203307 [12:57:16<218:05:46,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11399/203307 [12:57:16<218:05:47,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11400/203307 [12:57:20<218:05:37,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11400/203307 [12:57:20<218:05:37,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11401/203307 [12:57:23<218:05:29,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11401/203307 [12:57:23<218:05:29,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11402/203307 [12:57:28<218:05:30,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11402/203307 [12:57:28<218:05:30,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11403/203307 [12:57:32<218:05:19,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11403/203307 [12:57:32<218:05:19,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11404/203307 [12:57:36<218:05:22,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11404/203307 [12:57:36<218:05:22,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11405/203307 [12:57:40<218:05:22,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11405/203307 [12:57:40<218:05:22,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11406/203307 [12:57:44<218:05:12,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11406/203307 [12:57:44<218:05:12,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11407/203307 [12:57:48<218:05:02,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11407/203307 [12:57:48<218:05:02,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11408/203307 [12:57:52<218:05:02,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11408/203307 [12:57:52<218:05:02,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11409/203307 [12:57:56<218:04:52,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11409/203307 [12:57:56<218:04:52,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11410/203307 [12:58:00<218:04:51,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11410/203307 [12:58:00<218:04:51,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11411/203307 [12:58:04<218:04:40,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11411/203307 [12:58:04<218:04:41,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11412/203307 [12:58:08<218:04:41,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11412/203307 [12:58:08<218:04:41,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11413/203307 [12:58:12<218:04:33,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11413/203307 [12:58:12<218:04:33,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11414/203307 [12:58:17<218:04:35,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11414/203307 [12:58:17<218:04:35,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11415/203307 [12:58:20<218:04:25,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11415/203307 [12:58:20<218:04:26,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11416/203307 [12:58:24<218:04:15,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11416/203307 [12:58:24<218:04:15,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11417/203307 [12:58:28<218:04:14,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11417/203307 [12:58:28<218:04:14,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11418/203307 [12:58:33<218:04:15,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11418/203307 [12:58:33<218:04:15,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11419/203307 [12:58:37<218:04:05,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11419/203307 [12:58:37<218:04:05,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11420/203307 [12:58:40<218:03:56,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11420/203307 [12:58:40<218:03:56,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11421/203307 [12:58:45<218:03:58,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   6%|▌         | 11421/203307 [12:58:45<218:03:59,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11422/203307 [12:58:49<218:03:48,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11422/203307 [12:58:49<218:03:48,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11423/203307 [12:58:53<218:03:49,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11423/203307 [12:58:53<218:03:49,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11424/203307 [12:58:57<218:03:40,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11424/203307 [12:58:57<218:03:40,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11425/203307 [12:59:00<218:03:30,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11425/203307 [12:59:00<218:03:30,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11426/203307 [12:59:05<218:03:29,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11426/203307 [12:59:05<218:03:29,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11427/203307 [12:59:09<218:03:29,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11427/203307 [12:59:09<218:03:29,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11428/203307 [12:59:13<218:03:19,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11428/203307 [12:59:13<218:03:19,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11429/203307 [12:59:16<218:03:08,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11429/203307 [12:59:16<218:03:08,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11430/203307 [12:59:21<218:03:10,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11430/203307 [12:59:21<218:03:10,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11431/203307 [12:59:25<218:03:10,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11431/203307 [12:59:25<218:03:10,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11432/203307 [12:59:29<218:03:00,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11432/203307 [12:59:29<218:03:00,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11433/203307 [12:59:33<218:02:48,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11433/203307 [12:59:33<218:02:48,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11434/203307 [12:59:36<218:02:37,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11434/203307 [12:59:36<218:02:37,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11435/203307 [12:59:41<218:02:37,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11435/203307 [12:59:41<218:02:37,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11436/203307 [12:59:44<218:02:27,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11436/203307 [12:59:44<218:02:27,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11437/203307 [12:59:48<218:02:15,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11437/203307 [12:59:48<218:02:15,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11438/203307 [12:59:52<218:02:16,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11438/203307 [12:59:52<218:02:16,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11439/203307 [12:59:56<218:02:06,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11439/203307 [12:59:56<218:02:06,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11440/203307 [13:00:00<218:02:06,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11440/203307 [13:00:00<218:02:07,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11441/203307 [13:00:04<218:01:56,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11441/203307 [13:00:04<218:01:56,  0.24it/s, v_num=t5e6, training/loss=0.087] Epoch 0:   6%|▌         | 11442/203307 [13:00:08<218:01:46,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11442/203307 [13:00:08<218:01:46,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11443/203307 [13:00:12<218:01:45,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11443/203307 [13:00:12<218:01:45,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11444/203307 [13:00:16<218:01:44,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11444/203307 [13:00:16<218:01:44,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11445/203307 [13:00:20<218:01:33,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11445/203307 [13:00:20<218:01:33,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11446/203307 [13:00:24<218:01:23,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11446/203307 [13:00:24<218:01:23,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11447/203307 [13:00:28<218:01:26,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11447/203307 [13:00:28<218:01:27,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11448/203307 [13:00:32<218:01:16,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11448/203307 [13:00:32<218:01:16,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11449/203307 [13:00:37<218:01:17,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11449/203307 [13:00:37<218:01:17,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11450/203307 [13:00:40<218:01:07,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11450/203307 [13:00:40<218:01:07,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11451/203307 [13:00:44<218:00:56,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11451/203307 [13:00:44<218:00:56,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11452/203307 [13:00:48<218:00:56,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11452/203307 [13:00:48<218:00:57,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11453/203307 [13:00:53<218:00:54,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11453/203307 [13:00:53<218:00:54,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11454/203307 [13:00:56<218:00:43,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11454/203307 [13:00:56<218:00:43,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11455/203307 [13:01:00<218:00:31,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11455/203307 [13:01:00<218:00:32,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11456/203307 [13:01:04<218:00:33,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11456/203307 [13:01:04<218:00:33,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11457/203307 [13:01:09<218:00:33,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11457/203307 [13:01:09<218:00:33,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11458/203307 [13:01:12<218:00:22,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11458/203307 [13:01:12<218:00:22,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11459/203307 [13:01:16<218:00:11,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11459/203307 [13:01:16<218:00:11,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11460/203307 [13:01:20<218:00:10,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11460/203307 [13:01:20<218:00:10,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11461/203307 [13:01:24<218:00:01,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11461/203307 [13:01:24<218:00:01,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11462/203307 [13:01:28<217:59:59,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11462/203307 [13:01:28<217:59:59,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11463/203307 [13:01:32<217:59:48,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11463/203307 [13:01:32<217:59:48,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11464/203307 [13:01:36<217:59:48,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11464/203307 [13:01:36<217:59:48,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11465/203307 [13:01:40<217:59:39,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11465/203307 [13:01:40<217:59:39,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11466/203307 [13:01:44<217:59:39,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11466/203307 [13:01:44<217:59:39,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11467/203307 [13:01:48<217:59:29,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11467/203307 [13:01:48<217:59:29,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11468/203307 [13:01:52<217:59:28,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11468/203307 [13:01:52<217:59:28,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11469/203307 [13:01:56<217:59:17,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11469/203307 [13:01:56<217:59:17,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11470/203307 [13:02:00<217:59:05,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11470/203307 [13:02:00<217:59:05,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11471/203307 [13:02:04<217:59:02,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11471/203307 [13:02:04<217:59:03,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11472/203307 [13:02:08<217:58:53,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11472/203307 [13:02:08<217:58:53,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11473/203307 [13:02:12<217:58:54,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11473/203307 [13:02:12<217:58:54,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11474/203307 [13:02:16<217:58:43,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11474/203307 [13:02:16<217:58:43,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11475/203307 [13:02:20<217:58:45,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11475/203307 [13:02:20<217:58:45,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11476/203307 [13:02:24<217:58:34,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11476/203307 [13:02:24<217:58:34,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11477/203307 [13:02:28<217:58:33,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11477/203307 [13:02:28<217:58:33,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11478/203307 [13:02:32<217:58:21,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11478/203307 [13:02:32<217:58:21,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11479/203307 [13:02:35<217:58:11,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11479/203307 [13:02:35<217:58:11,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11480/203307 [13:02:40<217:58:08,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11480/203307 [13:02:40<217:58:08,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11481/203307 [13:02:43<217:57:57,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   6%|▌         | 11481/203307 [13:02:43<217:57:57,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11482/203307 [13:02:48<217:57:58,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11482/203307 [13:02:48<217:57:58,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11483/203307 [13:02:52<217:57:58,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11483/203307 [13:02:52<217:57:58,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11484/203307 [13:02:56<217:57:46,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11484/203307 [13:02:56<217:57:46,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11485/203307 [13:03:00<217:57:46,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11485/203307 [13:03:00<217:57:46,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11486/203307 [13:03:04<217:57:35,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11486/203307 [13:03:04<217:57:35,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11487/203307 [13:03:07<217:57:23,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11487/203307 [13:03:07<217:57:24,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11488/203307 [13:03:11<217:57:12,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11488/203307 [13:03:11<217:57:12,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11489/203307 [13:03:15<217:57:11,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11489/203307 [13:03:15<217:57:11,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11490/203307 [13:03:20<217:57:11,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11490/203307 [13:03:20<217:57:12,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11491/203307 [13:03:23<217:57:01,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11491/203307 [13:03:23<217:57:01,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11492/203307 [13:03:28<217:57:02,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11492/203307 [13:03:28<217:57:02,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11493/203307 [13:03:32<217:57:01,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11493/203307 [13:03:32<217:57:01,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11494/203307 [13:03:36<217:56:51,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11494/203307 [13:03:36<217:56:51,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11495/203307 [13:03:39<217:56:40,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11495/203307 [13:03:39<217:56:40,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11496/203307 [13:03:43<217:56:30,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11496/203307 [13:03:43<217:56:30,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11497/203307 [13:03:47<217:56:19,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11497/203307 [13:03:47<217:56:19,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11498/203307 [13:03:51<217:56:18,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11498/203307 [13:03:51<217:56:18,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11499/203307 [13:03:55<217:56:19,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11499/203307 [13:03:56<217:56:19,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11500/203307 [13:03:59<217:56:07,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11500/203307 [13:03:59<217:56:07,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11501/203307 [13:04:03<217:56:08,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11501/203307 [13:04:03<217:56:08,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11502/203307 [13:04:08<217:56:06,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11502/203307 [13:04:08<217:56:06,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11503/203307 [13:04:11<217:55:56,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11503/203307 [13:04:11<217:55:56,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11504/203307 [13:04:15<217:55:45,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11504/203307 [13:04:15<217:55:45,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11505/203307 [13:04:19<217:55:36,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11505/203307 [13:04:19<217:55:36,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11506/203307 [13:04:23<217:55:25,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11506/203307 [13:04:23<217:55:25,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11507/203307 [13:04:27<217:55:24,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11507/203307 [13:04:27<217:55:24,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11508/203307 [13:04:31<217:55:28,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11508/203307 [13:04:31<217:55:28,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11509/203307 [13:04:36<217:55:28,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11509/203307 [13:04:36<217:55:28,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11510/203307 [13:04:40<217:55:28,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11510/203307 [13:04:40<217:55:28,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11511/203307 [13:04:44<217:55:19,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11511/203307 [13:04:44<217:55:19,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11512/203307 [13:04:48<217:55:09,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11512/203307 [13:04:48<217:55:09,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11513/203307 [13:04:52<217:55:02,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11513/203307 [13:04:52<217:55:02,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11514/203307 [13:04:55<217:54:54,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11514/203307 [13:04:55<217:54:54,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11515/203307 [13:04:59<217:54:43,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11515/203307 [13:04:59<217:54:43,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11516/203307 [13:05:04<217:54:45,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11516/203307 [13:05:04<217:54:45,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11517/203307 [13:05:07<217:54:36,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11517/203307 [13:05:07<217:54:36,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11518/203307 [13:05:12<217:54:37,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11518/203307 [13:05:12<217:54:37,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11519/203307 [13:05:15<217:54:27,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11519/203307 [13:05:16<217:54:27,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11520/203307 [13:05:19<217:54:16,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11520/203307 [13:05:19<217:54:16,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11521/203307 [13:05:23<217:54:06,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   6%|▌         | 11521/203307 [13:05:23<217:54:06,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11522/203307 [13:05:27<217:53:55,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11522/203307 [13:05:27<217:53:56,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11523/203307 [13:05:30<217:53:46,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11523/203307 [13:05:30<217:53:46,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11524/203307 [13:05:34<217:53:38,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11524/203307 [13:05:34<217:53:38,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11525/203307 [13:05:39<217:53:41,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11525/203307 [13:05:39<217:53:41,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11526/203307 [13:05:42<217:53:31,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11526/203307 [13:05:42<217:53:31,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11527/203307 [13:05:47<217:53:31,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11527/203307 [13:05:47<217:53:31,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11528/203307 [13:05:51<217:53:20,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11528/203307 [13:05:51<217:53:20,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11529/203307 [13:05:54<217:53:08,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11529/203307 [13:05:54<217:53:08,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11530/203307 [13:05:58<217:52:58,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11530/203307 [13:05:58<217:52:58,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11531/203307 [13:06:02<217:52:49,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11531/203307 [13:06:02<217:52:49,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11532/203307 [13:06:05<217:52:38,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11532/203307 [13:06:05<217:52:38,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11533/203307 [13:06:09<217:52:29,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11533/203307 [13:06:09<217:52:29,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11534/203307 [13:06:14<217:52:31,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11534/203307 [13:06:14<217:52:31,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11535/203307 [13:06:18<217:52:32,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11535/203307 [13:06:18<217:52:33,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11536/203307 [13:06:22<217:52:23,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11536/203307 [13:06:22<217:52:23,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11537/203307 [13:06:26<217:52:14,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11537/203307 [13:06:26<217:52:14,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11538/203307 [13:06:29<217:52:03,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11538/203307 [13:06:29<217:52:03,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11539/203307 [13:06:33<217:51:54,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11539/203307 [13:06:33<217:51:54,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11540/203307 [13:06:37<217:51:44,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11540/203307 [13:06:37<217:51:44,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11541/203307 [13:06:40<217:51:34,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11541/203307 [13:06:40<217:51:34,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11542/203307 [13:06:45<217:51:36,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11542/203307 [13:06:45<217:51:36,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11543/203307 [13:06:49<217:51:37,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11543/203307 [13:06:49<217:51:37,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11544/203307 [13:06:54<217:51:37,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11544/203307 [13:06:54<217:51:37,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11545/203307 [13:06:57<217:51:27,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11545/203307 [13:06:57<217:51:27,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11546/203307 [13:07:01<217:51:16,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11546/203307 [13:07:01<217:51:16,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11547/203307 [13:07:05<217:51:07,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11547/203307 [13:07:05<217:51:07,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11548/203307 [13:07:09<217:50:58,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11548/203307 [13:07:09<217:50:58,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11549/203307 [13:07:12<217:50:48,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11549/203307 [13:07:12<217:50:48,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11550/203307 [13:07:16<217:50:38,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11550/203307 [13:07:16<217:50:38,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11551/203307 [13:07:21<217:50:41,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11551/203307 [13:07:21<217:50:41,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11552/203307 [13:07:25<217:50:43,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11552/203307 [13:07:25<217:50:43,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11553/203307 [13:07:30<217:50:45,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11553/203307 [13:07:30<217:50:45,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11554/203307 [13:07:33<217:50:34,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11554/203307 [13:07:33<217:50:34,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11555/203307 [13:07:37<217:50:23,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11555/203307 [13:07:37<217:50:23,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11556/203307 [13:07:41<217:50:13,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11556/203307 [13:07:41<217:50:13,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11557/203307 [13:07:44<217:50:03,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11557/203307 [13:07:44<217:50:04,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11558/203307 [13:07:48<217:49:54,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11558/203307 [13:07:48<217:49:54,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11559/203307 [13:07:52<217:49:43,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11559/203307 [13:07:52<217:49:43,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11560/203307 [13:07:56<217:49:46,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11560/203307 [13:07:56<217:49:47,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11561/203307 [13:08:01<217:49:49,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   6%|▌         | 11561/203307 [13:08:01<217:49:49,  0.24it/s, v_num=t5e6, training/loss=0.085] Epoch 0:   6%|▌         | 11562/203307 [13:08:05<217:49:40,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11562/203307 [13:08:05<217:49:40,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11563/203307 [13:08:08<217:49:29,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11563/203307 [13:08:08<217:49:29,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11564/203307 [13:08:12<217:49:20,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11564/203307 [13:08:12<217:49:20,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11565/203307 [13:08:16<217:49:11,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11565/203307 [13:08:16<217:49:11,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11566/203307 [13:08:20<217:49:06,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11566/203307 [13:08:20<217:49:06,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11567/203307 [13:08:24<217:48:56,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11567/203307 [13:08:24<217:48:56,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11568/203307 [13:08:28<217:48:57,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11568/203307 [13:08:28<217:48:57,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11569/203307 [13:08:32<217:48:48,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11569/203307 [13:08:32<217:48:48,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11570/203307 [13:08:36<217:48:50,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11570/203307 [13:08:36<217:48:50,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11571/203307 [13:08:40<217:48:41,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11571/203307 [13:08:40<217:48:41,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11572/203307 [13:08:44<217:48:30,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11572/203307 [13:08:44<217:48:30,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11573/203307 [13:08:48<217:48:20,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11573/203307 [13:08:48<217:48:20,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11574/203307 [13:08:51<217:48:09,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11574/203307 [13:08:51<217:48:10,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11575/203307 [13:08:55<217:48:00,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11575/203307 [13:08:55<217:48:00,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11576/203307 [13:08:59<217:47:50,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11576/203307 [13:08:59<217:47:50,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11577/203307 [13:09:03<217:47:53,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11577/203307 [13:09:03<217:47:53,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11578/203307 [13:09:07<217:47:42,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11578/203307 [13:09:07<217:47:42,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11579/203307 [13:09:11<217:47:43,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11579/203307 [13:09:11<217:47:43,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11580/203307 [13:09:15<217:47:33,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11580/203307 [13:09:15<217:47:33,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11581/203307 [13:09:19<217:47:24,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11581/203307 [13:09:19<217:47:24,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11582/203307 [13:09:23<217:47:15,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11582/203307 [13:09:23<217:47:15,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11583/203307 [13:09:26<217:47:06,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11583/203307 [13:09:26<217:47:06,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11584/203307 [13:09:30<217:46:56,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11584/203307 [13:09:30<217:46:56,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11585/203307 [13:09:35<217:46:58,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11585/203307 [13:09:35<217:46:58,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11586/203307 [13:09:39<217:47:00,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11586/203307 [13:09:39<217:47:00,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11587/203307 [13:09:44<217:47:02,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11587/203307 [13:09:44<217:47:02,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11588/203307 [13:09:48<217:47:00,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11588/203307 [13:09:48<217:47:00,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11589/203307 [13:09:52<217:46:51,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11589/203307 [13:09:52<217:46:51,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11590/203307 [13:09:55<217:46:42,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11590/203307 [13:09:55<217:46:42,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11591/203307 [13:09:59<217:46:34,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11591/203307 [13:09:59<217:46:34,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11592/203307 [13:10:03<217:46:24,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11592/203307 [13:10:03<217:46:24,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11593/203307 [13:10:07<217:46:23,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11593/203307 [13:10:07<217:46:23,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11594/203307 [13:10:12<217:46:25,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11594/203307 [13:10:12<217:46:25,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11595/203307 [13:10:15<217:46:16,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11595/203307 [13:10:15<217:46:16,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11596/203307 [13:10:20<217:46:18,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11596/203307 [13:10:20<217:46:18,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11597/203307 [13:10:24<217:46:16,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11597/203307 [13:10:24<217:46:16,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11598/203307 [13:10:28<217:46:05,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11598/203307 [13:10:28<217:46:05,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11599/203307 [13:10:32<217:45:55,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11599/203307 [13:10:32<217:45:55,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11600/203307 [13:10:35<217:45:45,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11600/203307 [13:10:35<217:45:45,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11601/203307 [13:10:39<217:45:35,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   6%|▌         | 11601/203307 [13:10:39<217:45:35,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11602/203307 [13:10:43<217:45:35,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11602/203307 [13:10:43<217:45:35,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11603/203307 [13:10:48<217:45:37,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11603/203307 [13:10:48<217:45:37,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11604/203307 [13:10:51<217:45:26,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11604/203307 [13:10:51<217:45:26,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11605/203307 [13:10:56<217:45:27,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11605/203307 [13:10:56<217:45:27,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11606/203307 [13:11:00<217:45:24,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11606/203307 [13:11:00<217:45:24,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11607/203307 [13:11:04<217:45:14,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11607/203307 [13:11:04<217:45:14,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11608/203307 [13:11:07<217:45:03,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11608/203307 [13:11:07<217:45:03,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11609/203307 [13:11:11<217:44:53,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11609/203307 [13:11:11<217:44:53,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11610/203307 [13:11:16<217:44:54,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11610/203307 [13:11:16<217:44:54,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11611/203307 [13:11:19<217:44:45,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11611/203307 [13:11:19<217:44:45,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11612/203307 [13:11:24<217:44:48,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11612/203307 [13:11:24<217:44:48,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11613/203307 [13:11:28<217:44:48,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11613/203307 [13:11:28<217:44:48,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11614/203307 [13:11:32<217:44:38,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11614/203307 [13:11:32<217:44:38,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11615/203307 [13:11:36<217:44:37,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11615/203307 [13:11:36<217:44:37,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11616/203307 [13:11:40<217:44:27,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11616/203307 [13:11:40<217:44:27,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11617/203307 [13:11:44<217:44:17,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11617/203307 [13:11:44<217:44:17,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11618/203307 [13:11:48<217:44:17,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11618/203307 [13:11:48<217:44:17,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11619/203307 [13:11:52<217:44:07,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11619/203307 [13:11:52<217:44:07,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11620/203307 [13:11:56<217:44:08,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11620/203307 [13:11:56<217:44:08,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11621/203307 [13:12:00<217:43:59,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   6%|▌         | 11621/203307 [13:12:00<217:43:59,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11622/203307 [13:12:04<217:44:00,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11622/203307 [13:12:04<217:44:00,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11623/203307 [13:12:08<217:43:50,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11623/203307 [13:12:08<217:43:50,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11624/203307 [13:12:12<217:43:47,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11624/203307 [13:12:12<217:43:47,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11625/203307 [13:12:16<217:43:37,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11625/203307 [13:12:16<217:43:37,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11626/203307 [13:12:20<217:43:28,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11626/203307 [13:12:20<217:43:28,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11627/203307 [13:12:24<217:43:28,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11627/203307 [13:12:24<217:43:28,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11628/203307 [13:12:28<217:43:19,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11628/203307 [13:12:28<217:43:19,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11629/203307 [13:12:32<217:43:20,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11629/203307 [13:12:32<217:43:20,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11630/203307 [13:12:36<217:43:09,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11630/203307 [13:12:36<217:43:09,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11631/203307 [13:12:40<217:43:09,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11631/203307 [13:12:40<217:43:09,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11632/203307 [13:12:44<217:42:58,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11632/203307 [13:12:44<217:42:58,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11633/203307 [13:12:48<217:42:56,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11633/203307 [13:12:48<217:42:56,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11634/203307 [13:12:52<217:42:46,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11634/203307 [13:12:52<217:42:46,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11635/203307 [13:12:56<217:42:45,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11635/203307 [13:12:56<217:42:45,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11636/203307 [13:13:00<217:42:35,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11636/203307 [13:13:00<217:42:35,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11637/203307 [13:13:04<217:42:23,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11637/203307 [13:13:04<217:42:24,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11638/203307 [13:13:08<217:42:25,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11638/203307 [13:13:08<217:42:25,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11639/203307 [13:13:12<217:42:26,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11639/203307 [13:13:12<217:42:26,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11640/203307 [13:13:16<217:42:15,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11640/203307 [13:13:16<217:42:15,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11641/203307 [13:13:20<217:42:05,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 11641/203307 [13:13:20<217:42:05,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11642/203307 [13:13:24<217:42:06,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11642/203307 [13:13:24<217:42:06,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11643/203307 [13:13:28<217:42:05,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11643/203307 [13:13:28<217:42:05,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11644/203307 [13:13:32<217:41:55,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11644/203307 [13:13:32<217:41:55,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11645/203307 [13:13:36<217:41:45,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11645/203307 [13:13:36<217:41:45,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11646/203307 [13:13:40<217:41:46,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11646/203307 [13:13:40<217:41:46,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11647/203307 [13:13:44<217:41:37,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11647/203307 [13:13:44<217:41:37,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11648/203307 [13:13:48<217:41:38,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11648/203307 [13:13:48<217:41:38,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11649/203307 [13:13:52<217:41:28,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11649/203307 [13:13:52<217:41:28,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11650/203307 [13:13:56<217:41:17,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11650/203307 [13:13:56<217:41:17,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11651/203307 [13:14:00<217:41:16,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11651/203307 [13:14:00<217:41:17,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11652/203307 [13:14:05<217:41:17,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11652/203307 [13:14:05<217:41:17,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11653/203307 [13:14:08<217:41:07,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11653/203307 [13:14:08<217:41:07,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11654/203307 [13:14:12<217:40:56,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11654/203307 [13:14:12<217:40:56,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11655/203307 [13:14:17<217:41:01,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11655/203307 [13:14:17<217:41:01,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11656/203307 [13:14:20<217:40:51,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11656/203307 [13:14:20<217:40:51,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11657/203307 [13:14:25<217:40:52,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11657/203307 [13:14:25<217:40:52,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11658/203307 [13:14:28<217:40:42,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11658/203307 [13:14:28<217:40:42,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11659/203307 [13:14:32<217:40:31,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11659/203307 [13:14:32<217:40:31,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11660/203307 [13:14:37<217:40:33,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11660/203307 [13:14:37<217:40:33,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11661/203307 [13:14:40<217:40:24,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   6%|▌         | 11661/203307 [13:14:40<217:40:24,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11662/203307 [13:14:44<217:40:12,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11662/203307 [13:14:44<217:40:12,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11663/203307 [13:14:48<217:40:03,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11663/203307 [13:14:48<217:40:03,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11664/203307 [13:14:52<217:40:05,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11664/203307 [13:14:52<217:40:05,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11665/203307 [13:14:57<217:40:06,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11665/203307 [13:14:57<217:40:06,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11666/203307 [13:15:00<217:39:56,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11666/203307 [13:15:00<217:39:56,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11667/203307 [13:15:04<217:39:46,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11667/203307 [13:15:04<217:39:46,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11668/203307 [13:15:08<217:39:46,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11668/203307 [13:15:08<217:39:46,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11669/203307 [13:15:13<217:39:46,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11669/203307 [13:15:13<217:39:46,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11670/203307 [13:15:16<217:39:35,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11670/203307 [13:15:16<217:39:35,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11671/203307 [13:15:20<217:39:25,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11671/203307 [13:15:20<217:39:25,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11672/203307 [13:15:24<217:39:25,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11672/203307 [13:15:25<217:39:25,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11673/203307 [13:15:28<217:39:17,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11673/203307 [13:15:28<217:39:17,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11674/203307 [13:15:33<217:39:17,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11674/203307 [13:15:33<217:39:17,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11675/203307 [13:15:36<217:39:07,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11675/203307 [13:15:36<217:39:07,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11676/203307 [13:15:40<217:38:56,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11676/203307 [13:15:40<217:38:56,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11677/203307 [13:15:44<217:38:56,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11677/203307 [13:15:44<217:38:56,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11678/203307 [13:15:49<217:38:53,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11678/203307 [13:15:49<217:38:54,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11679/203307 [13:15:52<217:38:44,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11679/203307 [13:15:52<217:38:44,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11680/203307 [13:15:56<217:38:34,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11680/203307 [13:15:56<217:38:34,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11681/203307 [13:16:00<217:38:35,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   6%|▌         | 11681/203307 [13:16:00<217:38:35,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11682/203307 [13:16:04<217:38:24,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11682/203307 [13:16:04<217:38:24,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11683/203307 [13:16:08<217:38:23,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11683/203307 [13:16:08<217:38:23,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11684/203307 [13:16:12<217:38:12,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11684/203307 [13:16:12<217:38:12,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11685/203307 [13:16:16<217:38:12,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11685/203307 [13:16:16<217:38:12,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11686/203307 [13:16:20<217:38:03,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11686/203307 [13:16:20<217:38:03,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11687/203307 [13:16:24<217:38:00,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11687/203307 [13:16:24<217:38:00,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11688/203307 [13:16:28<217:37:50,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11688/203307 [13:16:28<217:37:50,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11689/203307 [13:16:32<217:37:39,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11689/203307 [13:16:32<217:37:39,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11690/203307 [13:16:36<217:37:40,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11690/203307 [13:16:36<217:37:40,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11691/203307 [13:16:40<217:37:39,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11691/203307 [13:16:40<217:37:40,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11692/203307 [13:16:44<217:37:29,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11692/203307 [13:16:44<217:37:29,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11693/203307 [13:16:48<217:37:28,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11693/203307 [13:16:48<217:37:28,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11694/203307 [13:16:52<217:37:17,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11694/203307 [13:16:52<217:37:17,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11695/203307 [13:16:56<217:37:05,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11695/203307 [13:16:56<217:37:06,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11696/203307 [13:17:00<217:37:03,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11696/203307 [13:17:00<217:37:03,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11697/203307 [13:17:04<217:36:52,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11697/203307 [13:17:04<217:36:52,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11698/203307 [13:17:08<217:36:53,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11698/203307 [13:17:08<217:36:53,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11699/203307 [13:17:12<217:36:42,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11699/203307 [13:17:12<217:36:43,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11700/203307 [13:17:16<217:36:44,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11700/203307 [13:17:16<217:36:44,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11701/203307 [13:17:20<217:36:34,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:   6%|▌         | 11701/203307 [13:17:20<217:36:34,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11702/203307 [13:17:24<217:36:33,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11702/203307 [13:17:24<217:36:33,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11703/203307 [13:17:28<217:36:23,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11703/203307 [13:17:28<217:36:23,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11704/203307 [13:17:31<217:36:11,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11704/203307 [13:17:31<217:36:12,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11705/203307 [13:17:36<217:36:09,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11705/203307 [13:17:36<217:36:09,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11706/203307 [13:17:39<217:35:58,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11706/203307 [13:17:39<217:35:59,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11707/203307 [13:17:44<217:36:01,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11707/203307 [13:17:44<217:36:01,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11708/203307 [13:17:48<217:35:50,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11708/203307 [13:17:48<217:35:50,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11709/203307 [13:17:52<217:35:49,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11709/203307 [13:17:52<217:35:49,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11710/203307 [13:17:56<217:35:47,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11710/203307 [13:17:56<217:35:47,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11711/203307 [13:18:00<217:35:36,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11711/203307 [13:18:00<217:35:36,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11712/203307 [13:18:03<217:35:25,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11712/203307 [13:18:03<217:35:25,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11713/203307 [13:18:07<217:35:16,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11713/203307 [13:18:07<217:35:16,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11714/203307 [13:18:11<217:35:12,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11714/203307 [13:18:11<217:35:12,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11715/203307 [13:18:15<217:35:01,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11715/203307 [13:18:15<217:35:01,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11716/203307 [13:18:19<217:35:04,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11716/203307 [13:18:19<217:35:04,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11717/203307 [13:18:24<217:35:04,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11717/203307 [13:18:24<217:35:04,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11718/203307 [13:18:28<217:35:03,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11718/203307 [13:18:28<217:35:04,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11719/203307 [13:18:32<217:34:53,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11719/203307 [13:18:32<217:34:53,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11720/203307 [13:18:36<217:34:43,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11720/203307 [13:18:36<217:34:44,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11721/203307 [13:18:39<217:34:33,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   6%|▌         | 11721/203307 [13:18:39<217:34:33,  0.24it/s, v_num=t5e6, training/loss=0.090] Epoch 0:   6%|▌         | 11722/203307 [13:18:43<217:34:24,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11722/203307 [13:18:43<217:34:24,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11723/203307 [13:18:47<217:34:23,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11723/203307 [13:18:47<217:34:23,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11724/203307 [13:18:52<217:34:22,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11724/203307 [13:18:52<217:34:22,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11725/203307 [13:18:55<217:34:12,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11725/203307 [13:18:55<217:34:12,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11726/203307 [13:19:00<217:34:12,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11726/203307 [13:19:00<217:34:12,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11727/203307 [13:19:04<217:34:11,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11727/203307 [13:19:04<217:34:11,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11728/203307 [13:19:08<217:34:00,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11728/203307 [13:19:08<217:34:00,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11729/203307 [13:19:11<217:33:49,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11729/203307 [13:19:11<217:33:50,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11730/203307 [13:19:15<217:33:38,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11730/203307 [13:19:15<217:33:38,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11731/203307 [13:19:19<217:33:28,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11731/203307 [13:19:19<217:33:28,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11732/203307 [13:19:23<217:33:27,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11732/203307 [13:19:23<217:33:27,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11733/203307 [13:19:27<217:33:28,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11733/203307 [13:19:27<217:33:28,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11734/203307 [13:19:31<217:33:16,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11734/203307 [13:19:31<217:33:16,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11735/203307 [13:19:35<217:33:18,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11735/203307 [13:19:35<217:33:18,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11736/203307 [13:19:39<217:33:08,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11736/203307 [13:19:39<217:33:08,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11737/203307 [13:19:43<217:32:57,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11737/203307 [13:19:43<217:32:57,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11738/203307 [13:19:47<217:32:48,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11738/203307 [13:19:47<217:32:48,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11739/203307 [13:19:50<217:32:38,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11739/203307 [13:19:50<217:32:38,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11740/203307 [13:19:54<217:32:28,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11740/203307 [13:19:54<217:32:28,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11741/203307 [13:19:58<217:32:28,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:   6%|▌         | 11741/203307 [13:19:58<217:32:28,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11742/203307 [13:20:03<217:32:29,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11742/203307 [13:20:03<217:32:29,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11743/203307 [13:20:07<217:32:30,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11743/203307 [13:20:07<217:32:30,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11744/203307 [13:20:11<217:32:19,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11744/203307 [13:20:11<217:32:19,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11745/203307 [13:20:14<217:32:08,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11745/203307 [13:20:14<217:32:08,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11746/203307 [13:20:18<217:31:58,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11746/203307 [13:20:18<217:31:58,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11747/203307 [13:20:22<217:31:48,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11747/203307 [13:20:22<217:31:48,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11748/203307 [13:20:26<217:31:39,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11748/203307 [13:20:26<217:31:39,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11749/203307 [13:20:29<217:31:28,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11749/203307 [13:20:29<217:31:28,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11750/203307 [13:20:34<217:31:30,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11750/203307 [13:20:34<217:31:30,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11751/203307 [13:20:38<217:31:20,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11751/203307 [13:20:38<217:31:21,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11752/203307 [13:20:42<217:31:21,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11752/203307 [13:20:42<217:31:21,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11753/203307 [13:20:46<217:31:11,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11753/203307 [13:20:46<217:31:11,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11754/203307 [13:20:49<217:31:00,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11754/203307 [13:20:49<217:31:00,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11755/203307 [13:20:53<217:30:49,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11755/203307 [13:20:53<217:30:50,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11756/203307 [13:20:57<217:30:40,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11756/203307 [13:20:57<217:30:40,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11757/203307 [13:21:01<217:30:30,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11757/203307 [13:21:01<217:30:30,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11758/203307 [13:21:04<217:30:20,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11758/203307 [13:21:04<217:30:20,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11759/203307 [13:21:09<217:30:21,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11759/203307 [13:21:09<217:30:21,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11760/203307 [13:21:13<217:30:19,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11760/203307 [13:21:13<217:30:19,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11761/203307 [13:21:17<217:30:19,  0.24it/s, v_num=t5e6, training/loss=0.0944]Epoch 0:   6%|▌         | 11761/203307 [13:21:17<217:30:19,  0.24it/s, v_num=t5e6, training/loss=0.085] Epoch 0:   6%|▌         | 11762/203307 [13:21:21<217:30:09,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11762/203307 [13:21:21<217:30:09,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11763/203307 [13:21:25<217:30:00,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11763/203307 [13:21:25<217:30:00,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11764/203307 [13:21:28<217:29:50,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11764/203307 [13:21:28<217:29:50,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11765/203307 [13:21:32<217:29:41,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11765/203307 [13:21:32<217:29:41,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11766/203307 [13:21:36<217:29:32,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11766/203307 [13:21:36<217:29:32,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11767/203307 [13:21:40<217:29:21,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11767/203307 [13:21:40<217:29:21,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11768/203307 [13:21:44<217:29:22,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11768/203307 [13:21:44<217:29:23,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11769/203307 [13:21:48<217:29:23,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11769/203307 [13:21:48<217:29:23,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11770/203307 [13:21:52<217:29:12,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11770/203307 [13:21:52<217:29:12,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11771/203307 [13:21:56<217:29:02,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11771/203307 [13:21:56<217:29:02,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11772/203307 [13:22:00<217:28:51,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11772/203307 [13:22:00<217:28:51,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11773/203307 [13:22:03<217:28:41,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11773/203307 [13:22:03<217:28:41,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11774/203307 [13:22:07<217:28:30,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11774/203307 [13:22:07<217:28:31,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11775/203307 [13:22:11<217:28:21,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11775/203307 [13:22:11<217:28:21,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11776/203307 [13:22:15<217:28:23,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11776/203307 [13:22:15<217:28:23,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11777/203307 [13:22:19<217:28:22,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11777/203307 [13:22:19<217:28:22,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11778/203307 [13:22:24<217:28:22,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11778/203307 [13:22:24<217:28:22,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11779/203307 [13:22:27<217:28:12,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11779/203307 [13:22:28<217:28:12,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11780/203307 [13:22:31<217:28:02,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11780/203307 [13:22:31<217:28:02,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11781/203307 [13:22:35<217:27:52,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:   6%|▌         | 11781/203307 [13:22:35<217:27:52,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11782/203307 [13:22:39<217:27:42,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11782/203307 [13:22:39<217:27:42,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11783/203307 [13:22:42<217:27:32,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11783/203307 [13:22:42<217:27:32,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11784/203307 [13:22:46<217:27:23,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11784/203307 [13:22:46<217:27:23,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11785/203307 [13:22:51<217:27:24,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11785/203307 [13:22:51<217:27:24,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11786/203307 [13:22:55<217:27:22,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11786/203307 [13:22:55<217:27:23,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11787/203307 [13:22:59<217:27:24,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11787/203307 [13:22:59<217:27:24,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11788/203307 [13:23:03<217:27:13,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11788/203307 [13:23:03<217:27:13,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11789/203307 [13:23:07<217:27:03,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11789/203307 [13:23:07<217:27:03,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11790/203307 [13:23:10<217:26:53,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11790/203307 [13:23:10<217:26:53,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11791/203307 [13:23:14<217:26:44,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11791/203307 [13:23:14<217:26:44,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11792/203307 [13:23:18<217:26:34,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11792/203307 [13:23:18<217:26:34,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11793/203307 [13:23:22<217:26:35,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11793/203307 [13:23:22<217:26:35,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11794/203307 [13:23:27<217:26:36,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11794/203307 [13:23:27<217:26:36,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11795/203307 [13:23:31<217:26:38,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11795/203307 [13:23:31<217:26:38,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11796/203307 [13:23:35<217:26:27,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11796/203307 [13:23:35<217:26:27,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11797/203307 [13:23:39<217:26:17,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11797/203307 [13:23:39<217:26:18,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11798/203307 [13:23:42<217:26:07,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11798/203307 [13:23:42<217:26:07,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11799/203307 [13:23:46<217:25:58,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11799/203307 [13:23:46<217:25:58,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11800/203307 [13:23:50<217:25:48,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11800/203307 [13:23:50<217:25:48,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11801/203307 [13:23:54<217:25:39,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▌         | 11801/203307 [13:23:54<217:25:39,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11802/203307 [13:23:58<217:25:40,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11802/203307 [13:23:58<217:25:40,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11803/203307 [13:24:02<217:25:30,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11803/203307 [13:24:02<217:25:30,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11804/203307 [13:24:06<217:25:30,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11804/203307 [13:24:06<217:25:30,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11805/203307 [13:24:10<217:25:20,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11805/203307 [13:24:10<217:25:20,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11806/203307 [13:24:13<217:25:09,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11806/203307 [13:24:13<217:25:09,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11807/203307 [13:24:17<217:25:01,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11807/203307 [13:24:17<217:25:01,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11808/203307 [13:24:21<217:24:51,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11808/203307 [13:24:21<217:24:51,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11809/203307 [13:24:25<217:24:42,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11809/203307 [13:24:25<217:24:42,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11810/203307 [13:24:29<217:24:42,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11810/203307 [13:24:29<217:24:43,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11811/203307 [13:24:34<217:24:44,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11811/203307 [13:24:34<217:24:44,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11812/203307 [13:24:37<217:24:34,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11812/203307 [13:24:37<217:24:34,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11813/203307 [13:24:42<217:24:35,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11813/203307 [13:24:42<217:24:35,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11814/203307 [13:24:45<217:24:24,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11814/203307 [13:24:45<217:24:24,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11815/203307 [13:24:49<217:24:14,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11815/203307 [13:24:49<217:24:14,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11816/203307 [13:24:53<217:24:04,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11816/203307 [13:24:53<217:24:04,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11817/203307 [13:24:57<217:23:54,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11817/203307 [13:24:57<217:23:54,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11818/203307 [13:25:01<217:23:53,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11818/203307 [13:25:01<217:23:53,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11819/203307 [13:25:05<217:23:44,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11819/203307 [13:25:05<217:23:44,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11820/203307 [13:25:09<217:23:46,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11820/203307 [13:25:09<217:23:46,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11821/203307 [13:25:13<217:23:47,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▌         | 11821/203307 [13:25:13<217:23:47,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11822/203307 [13:25:18<217:23:44,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11822/203307 [13:25:18<217:23:44,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11823/203307 [13:25:21<217:23:35,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11823/203307 [13:25:21<217:23:35,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11824/203307 [13:25:25<217:23:25,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11824/203307 [13:25:25<217:23:25,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11825/203307 [13:25:29<217:23:17,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11825/203307 [13:25:29<217:23:17,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11826/203307 [13:25:33<217:23:07,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11826/203307 [13:25:33<217:23:07,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11827/203307 [13:25:37<217:23:07,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11827/203307 [13:25:37<217:23:07,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11828/203307 [13:25:41<217:23:08,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11828/203307 [13:25:41<217:23:08,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11829/203307 [13:25:45<217:22:57,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11829/203307 [13:25:45<217:22:57,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11830/203307 [13:25:49<217:22:58,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11830/203307 [13:25:49<217:22:58,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11831/203307 [13:25:54<217:22:56,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11831/203307 [13:25:54<217:22:56,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11832/203307 [13:25:57<217:22:45,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11832/203307 [13:25:57<217:22:45,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11833/203307 [13:26:01<217:22:35,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11833/203307 [13:26:01<217:22:35,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11834/203307 [13:26:05<217:22:25,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11834/203307 [13:26:05<217:22:25,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11835/203307 [13:26:09<217:22:24,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11835/203307 [13:26:09<217:22:24,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11836/203307 [13:26:13<217:22:15,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11836/203307 [13:26:13<217:22:15,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11837/203307 [13:26:17<217:22:17,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11837/203307 [13:26:17<217:22:17,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11838/203307 [13:26:21<217:22:06,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11838/203307 [13:26:21<217:22:06,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11839/203307 [13:26:25<217:22:07,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11839/203307 [13:26:25<217:22:07,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11840/203307 [13:26:29<217:22:04,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11840/203307 [13:26:29<217:22:04,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11841/203307 [13:26:33<217:21:53,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 11841/203307 [13:26:33<217:21:53,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11842/203307 [13:26:37<217:21:43,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11842/203307 [13:26:37<217:21:43,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11843/203307 [13:26:41<217:21:42,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11843/203307 [13:26:41<217:21:42,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11844/203307 [13:26:45<217:21:31,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11844/203307 [13:26:45<217:21:31,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11845/203307 [13:26:49<217:21:20,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11845/203307 [13:26:49<217:21:20,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11846/203307 [13:26:53<217:21:22,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11846/203307 [13:26:53<217:21:22,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11847/203307 [13:26:57<217:21:21,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11847/203307 [13:26:57<217:21:21,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11848/203307 [13:27:01<217:21:10,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11848/203307 [13:27:01<217:21:10,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11849/203307 [13:27:05<217:21:07,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11849/203307 [13:27:05<217:21:07,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11850/203307 [13:27:09<217:20:57,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11850/203307 [13:27:09<217:20:57,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11851/203307 [13:27:12<217:20:46,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11851/203307 [13:27:12<217:20:46,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11852/203307 [13:27:17<217:20:46,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11852/203307 [13:27:17<217:20:46,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11853/203307 [13:27:21<217:20:36,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11853/203307 [13:27:21<217:20:37,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11854/203307 [13:27:25<217:20:37,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11854/203307 [13:27:25<217:20:37,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11855/203307 [13:27:29<217:20:28,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11855/203307 [13:27:29<217:20:28,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11856/203307 [13:27:33<217:20:28,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11856/203307 [13:27:33<217:20:29,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11857/203307 [13:27:37<217:20:17,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11857/203307 [13:27:37<217:20:18,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11858/203307 [13:27:41<217:20:15,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11858/203307 [13:27:41<217:20:15,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11859/203307 [13:27:45<217:20:04,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11859/203307 [13:27:45<217:20:04,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11860/203307 [13:27:49<217:20:03,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11860/203307 [13:27:49<217:20:03,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11861/203307 [13:27:53<217:19:55,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   6%|▌         | 11861/203307 [13:27:53<217:19:55,  0.24it/s, v_num=t5e6, training/loss=0.087] Epoch 0:   6%|▌         | 11862/203307 [13:27:56<217:19:45,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11862/203307 [13:27:56<217:19:45,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11863/203307 [13:28:01<217:19:47,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11863/203307 [13:28:01<217:19:47,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11864/203307 [13:28:05<217:19:37,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11864/203307 [13:28:05<217:19:37,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11865/203307 [13:28:09<217:19:38,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11865/203307 [13:28:09<217:19:38,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11866/203307 [13:28:13<217:19:28,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11866/203307 [13:28:13<217:19:28,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11867/203307 [13:28:17<217:19:26,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11867/203307 [13:28:17<217:19:26,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11868/203307 [13:28:21<217:19:26,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11868/203307 [13:28:21<217:19:26,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11869/203307 [13:28:25<217:19:16,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11869/203307 [13:28:25<217:19:16,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11870/203307 [13:28:29<217:19:05,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11870/203307 [13:28:29<217:19:05,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11871/203307 [13:28:32<217:18:55,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11871/203307 [13:28:32<217:18:56,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11872/203307 [13:28:37<217:18:57,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11872/203307 [13:28:37<217:18:57,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11873/203307 [13:28:41<217:18:57,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11873/203307 [13:28:41<217:18:57,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11874/203307 [13:28:45<217:18:46,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11874/203307 [13:28:45<217:18:46,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11875/203307 [13:28:48<217:18:34,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11875/203307 [13:28:48<217:18:34,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11876/203307 [13:28:53<217:18:34,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11876/203307 [13:28:53<217:18:34,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11877/203307 [13:28:57<217:18:35,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11877/203307 [13:28:57<217:18:35,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11878/203307 [13:29:01<217:18:24,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11878/203307 [13:29:01<217:18:24,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11879/203307 [13:29:04<217:18:13,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11879/203307 [13:29:04<217:18:13,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11880/203307 [13:29:09<217:18:14,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11880/203307 [13:29:09<217:18:14,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11881/203307 [13:29:13<217:18:04,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▌         | 11881/203307 [13:29:13<217:18:04,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11882/203307 [13:29:17<217:18:04,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11882/203307 [13:29:17<217:18:04,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11883/203307 [13:29:21<217:17:54,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11883/203307 [13:29:21<217:17:54,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11884/203307 [13:29:24<217:17:43,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11884/203307 [13:29:24<217:17:43,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11885/203307 [13:29:29<217:17:44,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11885/203307 [13:29:29<217:17:44,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11886/203307 [13:29:32<217:17:34,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11886/203307 [13:29:32<217:17:34,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11887/203307 [13:29:36<217:17:24,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11887/203307 [13:29:36<217:17:24,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11888/203307 [13:29:40<217:17:14,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11888/203307 [13:29:40<217:17:14,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11889/203307 [13:29:44<217:17:16,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11889/203307 [13:29:44<217:17:16,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11890/203307 [13:29:48<217:17:06,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11890/203307 [13:29:48<217:17:06,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11891/203307 [13:29:52<217:17:07,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11891/203307 [13:29:52<217:17:08,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11892/203307 [13:29:56<217:16:58,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11892/203307 [13:29:56<217:16:58,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11893/203307 [13:30:01<217:16:57,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11893/203307 [13:30:01<217:16:57,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11894/203307 [13:30:05<217:16:54,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11894/203307 [13:30:05<217:16:55,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11895/203307 [13:30:08<217:16:43,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11895/203307 [13:30:08<217:16:44,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11896/203307 [13:30:12<217:16:33,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11896/203307 [13:30:12<217:16:33,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11897/203307 [13:30:16<217:16:23,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11897/203307 [13:30:16<217:16:23,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11898/203307 [13:30:20<217:16:25,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11898/203307 [13:30:20<217:16:25,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11899/203307 [13:30:24<217:16:24,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11899/203307 [13:30:24<217:16:24,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11900/203307 [13:30:28<217:16:13,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11900/203307 [13:30:28<217:16:14,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11901/203307 [13:30:32<217:16:03,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   6%|▌         | 11901/203307 [13:30:32<217:16:03,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11902/203307 [13:30:36<217:16:02,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11902/203307 [13:30:36<217:16:02,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11903/203307 [13:30:40<217:15:59,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11903/203307 [13:30:40<217:15:59,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11904/203307 [13:30:44<217:15:48,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11904/203307 [13:30:44<217:15:48,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11905/203307 [13:30:48<217:15:36,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11905/203307 [13:30:48<217:15:36,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11906/203307 [13:30:52<217:15:37,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11906/203307 [13:30:52<217:15:37,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11907/203307 [13:30:56<217:15:29,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11907/203307 [13:30:56<217:15:29,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11908/203307 [13:31:00<217:15:28,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11908/203307 [13:31:00<217:15:28,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11909/203307 [13:31:04<217:15:17,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11909/203307 [13:31:04<217:15:17,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11910/203307 [13:31:08<217:15:15,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11910/203307 [13:31:08<217:15:15,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11911/203307 [13:31:12<217:15:05,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11911/203307 [13:31:12<217:15:05,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11912/203307 [13:31:16<217:15:01,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11912/203307 [13:31:16<217:15:01,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11913/203307 [13:31:19<217:14:50,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11913/203307 [13:31:19<217:14:50,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11914/203307 [13:31:23<217:14:40,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11914/203307 [13:31:23<217:14:40,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11915/203307 [13:31:28<217:14:42,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11915/203307 [13:31:28<217:14:42,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11916/203307 [13:31:31<217:14:31,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11916/203307 [13:31:31<217:14:31,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11917/203307 [13:31:36<217:14:32,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11917/203307 [13:31:36<217:14:32,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11918/203307 [13:31:40<217:14:31,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11918/203307 [13:31:40<217:14:31,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11919/203307 [13:31:44<217:14:20,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11919/203307 [13:31:44<217:14:20,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11920/203307 [13:31:47<217:14:10,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11920/203307 [13:31:47<217:14:10,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11921/203307 [13:31:52<217:14:10,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   6%|▌         | 11921/203307 [13:31:52<217:14:10,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11922/203307 [13:31:55<217:14:00,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11922/203307 [13:31:55<217:14:00,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11923/203307 [13:31:59<217:13:50,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11923/203307 [13:31:59<217:13:50,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11924/203307 [13:32:04<217:13:52,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11924/203307 [13:32:04<217:13:52,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11925/203307 [13:32:08<217:13:53,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11925/203307 [13:32:08<217:13:53,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11926/203307 [13:32:12<217:13:43,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11926/203307 [13:32:12<217:13:43,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11927/203307 [13:32:16<217:13:42,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11927/203307 [13:32:16<217:13:42,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11928/203307 [13:32:20<217:13:32,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11928/203307 [13:32:20<217:13:32,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11929/203307 [13:32:23<217:13:22,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11929/203307 [13:32:23<217:13:22,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11930/203307 [13:32:28<217:13:20,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11930/203307 [13:32:28<217:13:20,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11931/203307 [13:32:31<217:13:09,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11931/203307 [13:32:31<217:13:09,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11932/203307 [13:32:36<217:13:10,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11932/203307 [13:32:36<217:13:10,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11933/203307 [13:32:39<217:13:01,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11933/203307 [13:32:39<217:13:01,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11934/203307 [13:32:44<217:13:01,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11934/203307 [13:32:44<217:13:01,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11935/203307 [13:32:48<217:13:03,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11935/203307 [13:32:48<217:13:03,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11936/203307 [13:32:52<217:12:52,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11936/203307 [13:32:52<217:12:52,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11937/203307 [13:32:56<217:12:42,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11937/203307 [13:32:56<217:12:42,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11938/203307 [13:32:59<217:12:31,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11938/203307 [13:32:59<217:12:31,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11939/203307 [13:33:04<217:12:31,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11939/203307 [13:33:04<217:12:31,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11940/203307 [13:33:07<217:12:20,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11940/203307 [13:33:07<217:12:20,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11941/203307 [13:33:12<217:12:21,  0.24it/s, v_num=t5e6, training/loss=0.0982]Epoch 0:   6%|▌         | 11941/203307 [13:33:12<217:12:21,  0.24it/s, v_num=t5e6, training/loss=0.101] Epoch 0:   6%|▌         | 11942/203307 [13:33:16<217:12:15,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11942/203307 [13:33:16<217:12:15,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11943/203307 [13:33:20<217:12:16,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11943/203307 [13:33:20<217:12:16,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11944/203307 [13:33:24<217:12:06,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11944/203307 [13:33:24<217:12:06,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11945/203307 [13:33:27<217:11:56,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11945/203307 [13:33:27<217:11:56,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11946/203307 [13:33:31<217:11:45,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11946/203307 [13:33:31<217:11:45,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11947/203307 [13:33:35<217:11:34,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11947/203307 [13:33:35<217:11:34,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11948/203307 [13:33:39<217:11:31,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11948/203307 [13:33:39<217:11:31,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11949/203307 [13:33:43<217:11:21,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11949/203307 [13:33:43<217:11:22,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11950/203307 [13:33:47<217:11:23,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11950/203307 [13:33:47<217:11:23,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11951/203307 [13:33:51<217:11:22,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11951/203307 [13:33:51<217:11:22,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11952/203307 [13:33:56<217:11:19,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11952/203307 [13:33:56<217:11:20,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11953/203307 [13:33:59<217:11:09,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11953/203307 [13:33:59<217:11:09,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11954/203307 [13:34:03<217:10:58,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11954/203307 [13:34:03<217:10:58,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11955/203307 [13:34:07<217:10:47,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11955/203307 [13:34:07<217:10:47,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11956/203307 [13:34:10<217:10:37,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11956/203307 [13:34:10<217:10:37,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11957/203307 [13:34:15<217:10:35,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11957/203307 [13:34:15<217:10:36,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11958/203307 [13:34:19<217:10:37,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11958/203307 [13:34:19<217:10:37,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11959/203307 [13:34:23<217:10:26,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11959/203307 [13:34:23<217:10:26,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11960/203307 [13:34:27<217:10:29,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11960/203307 [13:34:27<217:10:29,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11961/203307 [13:34:31<217:10:19,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   6%|▌         | 11961/203307 [13:34:31<217:10:19,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11962/203307 [13:34:35<217:10:09,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11962/203307 [13:34:35<217:10:09,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11963/203307 [13:34:38<217:09:59,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11963/203307 [13:34:38<217:09:59,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11964/203307 [13:34:42<217:09:50,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11964/203307 [13:34:42<217:09:50,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11965/203307 [13:34:46<217:09:41,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11965/203307 [13:34:46<217:09:41,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11966/203307 [13:34:50<217:09:39,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11966/203307 [13:34:50<217:09:39,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11967/203307 [13:34:55<217:09:41,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11967/203307 [13:34:55<217:09:41,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11968/203307 [13:34:59<217:09:39,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11968/203307 [13:34:59<217:09:40,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11969/203307 [13:35:03<217:09:41,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11969/203307 [13:35:03<217:09:41,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11970/203307 [13:35:07<217:09:30,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11970/203307 [13:35:07<217:09:30,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11971/203307 [13:35:11<217:09:20,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11971/203307 [13:35:11<217:09:20,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11972/203307 [13:35:14<217:09:11,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11972/203307 [13:35:14<217:09:11,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11973/203307 [13:35:18<217:09:04,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11973/203307 [13:35:18<217:09:04,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11974/203307 [13:35:22<217:08:53,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11974/203307 [13:35:22<217:08:54,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11975/203307 [13:35:26<217:08:51,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11975/203307 [13:35:26<217:08:51,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11976/203307 [13:35:31<217:08:51,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11976/203307 [13:35:31<217:08:51,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11977/203307 [13:35:35<217:08:52,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11977/203307 [13:35:35<217:08:52,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11978/203307 [13:35:39<217:08:43,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11978/203307 [13:35:39<217:08:43,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11979/203307 [13:35:42<217:08:32,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11979/203307 [13:35:42<217:08:33,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11980/203307 [13:35:46<217:08:23,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11980/203307 [13:35:46<217:08:23,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11981/203307 [13:35:50<217:08:14,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▌         | 11981/203307 [13:35:50<217:08:14,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11982/203307 [13:35:54<217:08:04,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11982/203307 [13:35:54<217:08:04,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11983/203307 [13:35:57<217:07:53,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11983/203307 [13:35:57<217:07:54,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11984/203307 [13:36:02<217:07:55,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11984/203307 [13:36:02<217:07:55,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11985/203307 [13:36:06<217:07:55,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11985/203307 [13:36:06<217:07:55,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11986/203307 [13:36:10<217:07:56,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11986/203307 [13:36:10<217:07:56,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11987/203307 [13:36:14<217:07:45,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11987/203307 [13:36:14<217:07:45,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11988/203307 [13:36:18<217:07:36,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11988/203307 [13:36:18<217:07:36,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11989/203307 [13:36:22<217:07:26,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11989/203307 [13:36:22<217:07:26,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11990/203307 [13:36:25<217:07:16,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11990/203307 [13:36:25<217:07:17,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11991/203307 [13:36:29<217:07:07,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11991/203307 [13:36:29<217:07:07,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11992/203307 [13:36:33<217:06:58,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11992/203307 [13:36:33<217:06:58,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11993/203307 [13:36:37<217:07:01,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11993/203307 [13:36:37<217:07:01,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11994/203307 [13:36:41<217:06:51,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11994/203307 [13:36:41<217:06:51,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11995/203307 [13:36:46<217:06:54,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11995/203307 [13:36:46<217:06:54,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11996/203307 [13:36:49<217:06:44,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11996/203307 [13:36:49<217:06:44,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11997/203307 [13:36:53<217:06:35,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11997/203307 [13:36:53<217:06:35,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11998/203307 [13:36:57<217:06:26,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11998/203307 [13:36:57<217:06:26,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11999/203307 [13:37:01<217:06:16,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 11999/203307 [13:37:01<217:06:17,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 12000/203307 [13:37:04<217:06:07,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 12000/203307 [13:37:04<217:06:07,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 12001/203307 [13:37:08<217:05:59,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   6%|▌         | 12001/203307 [13:37:08<217:05:59,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12002/203307 [13:37:13<217:06:01,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12002/203307 [13:37:13<217:06:01,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12003/203307 [13:37:17<217:06:01,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12003/203307 [13:37:17<217:06:01,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12004/203307 [13:37:21<217:05:51,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12004/203307 [13:37:21<217:05:51,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12005/203307 [13:37:24<217:05:41,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12005/203307 [13:37:24<217:05:41,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12006/203307 [13:37:28<217:05:34,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12006/203307 [13:37:28<217:05:34,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12007/203307 [13:37:32<217:05:24,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12007/203307 [13:37:32<217:05:24,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12008/203307 [13:37:36<217:05:15,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12008/203307 [13:37:36<217:05:15,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12009/203307 [13:37:40<217:05:05,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12009/203307 [13:37:40<217:05:05,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12010/203307 [13:37:44<217:05:06,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12010/203307 [13:37:44<217:05:06,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12011/203307 [13:37:48<217:05:03,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12011/203307 [13:37:48<217:05:03,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12012/203307 [13:37:53<217:05:04,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12012/203307 [13:37:53<217:05:04,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12013/203307 [13:37:56<217:04:55,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12013/203307 [13:37:56<217:04:55,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12014/203307 [13:38:00<217:04:44,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12014/203307 [13:38:00<217:04:45,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12015/203307 [13:38:04<217:04:34,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12015/203307 [13:38:04<217:04:34,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12016/203307 [13:38:07<217:04:24,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12016/203307 [13:38:07<217:04:24,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12017/203307 [13:38:11<217:04:14,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12017/203307 [13:38:11<217:04:14,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12018/203307 [13:38:15<217:04:14,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12018/203307 [13:38:15<217:04:14,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12019/203307 [13:38:20<217:04:16,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12019/203307 [13:38:20<217:04:16,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12020/203307 [13:38:24<217:04:11,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12020/203307 [13:38:24<217:04:11,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12021/203307 [13:38:28<217:04:13,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   6%|▌         | 12021/203307 [13:38:28<217:04:13,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12022/203307 [13:38:32<217:04:03,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12022/203307 [13:38:32<217:04:03,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12023/203307 [13:38:36<217:03:52,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12023/203307 [13:38:36<217:03:52,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12024/203307 [13:38:40<217:03:42,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12024/203307 [13:38:40<217:03:42,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12025/203307 [13:38:43<217:03:32,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12025/203307 [13:38:43<217:03:32,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12026/203307 [13:38:47<217:03:21,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12026/203307 [13:38:47<217:03:21,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12027/203307 [13:38:51<217:03:22,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12027/203307 [13:38:51<217:03:22,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12028/203307 [13:38:56<217:03:23,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12028/203307 [13:38:56<217:03:23,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12029/203307 [13:39:00<217:03:26,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12029/203307 [13:39:00<217:03:26,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12030/203307 [13:39:04<217:03:17,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12030/203307 [13:39:04<217:03:17,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12031/203307 [13:39:08<217:03:06,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12031/203307 [13:39:08<217:03:06,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12032/203307 [13:39:11<217:02:54,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12032/203307 [13:39:11<217:02:54,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12033/203307 [13:39:15<217:02:45,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12033/203307 [13:39:15<217:02:45,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12034/203307 [13:39:19<217:02:35,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12034/203307 [13:39:19<217:02:35,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12035/203307 [13:39:23<217:02:34,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12035/203307 [13:39:23<217:02:34,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12036/203307 [13:39:27<217:02:36,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12036/203307 [13:39:27<217:02:36,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12037/203307 [13:39:31<217:02:26,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12037/203307 [13:39:31<217:02:26,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12038/203307 [13:39:36<217:02:27,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12038/203307 [13:39:36<217:02:27,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12039/203307 [13:39:39<217:02:17,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12039/203307 [13:39:39<217:02:17,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12040/203307 [13:39:43<217:02:06,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12040/203307 [13:39:43<217:02:06,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12041/203307 [13:39:47<217:01:56,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   6%|▌         | 12041/203307 [13:39:47<217:01:56,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12042/203307 [13:39:50<217:01:46,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12042/203307 [13:39:50<217:01:46,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12043/203307 [13:39:55<217:01:45,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12043/203307 [13:39:55<217:01:46,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12044/203307 [13:39:58<217:01:36,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12044/203307 [13:39:58<217:01:36,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12045/203307 [13:40:03<217:01:37,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12045/203307 [13:40:03<217:01:37,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12046/203307 [13:40:07<217:01:27,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12046/203307 [13:40:07<217:01:27,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12047/203307 [13:40:11<217:01:28,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12047/203307 [13:40:11<217:01:28,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12048/203307 [13:40:15<217:01:17,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12048/203307 [13:40:15<217:01:17,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12049/203307 [13:40:18<217:01:07,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12049/203307 [13:40:18<217:01:07,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12050/203307 [13:40:22<217:00:58,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12050/203307 [13:40:22<217:00:58,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12051/203307 [13:40:26<217:00:49,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12051/203307 [13:40:26<217:00:49,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12052/203307 [13:40:30<217:00:51,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12052/203307 [13:40:30<217:00:51,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12053/203307 [13:40:34<217:00:41,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12053/203307 [13:40:34<217:00:41,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12054/203307 [13:40:38<217:00:42,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12054/203307 [13:40:38<217:00:42,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12055/203307 [13:40:43<217:00:42,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12055/203307 [13:40:43<217:00:43,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12056/203307 [13:40:47<217:00:43,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12056/203307 [13:40:47<217:00:43,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12057/203307 [13:40:51<217:00:32,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12057/203307 [13:40:51<217:00:32,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12058/203307 [13:40:55<217:00:22,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12058/203307 [13:40:55<217:00:23,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12059/203307 [13:40:58<217:00:13,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12059/203307 [13:40:58<217:00:13,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12060/203307 [13:41:03<217:00:14,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12060/203307 [13:41:03<217:00:14,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12061/203307 [13:41:07<217:00:05,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   6%|▌         | 12061/203307 [13:41:07<217:00:05,  0.24it/s, v_num=t5e6, training/loss=0.084] Epoch 0:   6%|▌         | 12062/203307 [13:41:11<217:00:06,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12062/203307 [13:41:11<217:00:06,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12063/203307 [13:41:15<216:59:55,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12063/203307 [13:41:15<216:59:55,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12064/203307 [13:41:19<216:59:58,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12064/203307 [13:41:19<216:59:58,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12065/203307 [13:41:23<216:59:55,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12065/203307 [13:41:23<216:59:55,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12066/203307 [13:41:27<216:59:45,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12066/203307 [13:41:27<216:59:45,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12067/203307 [13:41:31<216:59:36,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12067/203307 [13:41:31<216:59:36,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12068/203307 [13:41:35<216:59:38,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12068/203307 [13:41:35<216:59:38,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12069/203307 [13:41:39<216:59:28,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12069/203307 [13:41:39<216:59:28,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12070/203307 [13:41:43<216:59:19,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12070/203307 [13:41:43<216:59:19,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12071/203307 [13:41:47<216:59:22,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12071/203307 [13:41:47<216:59:22,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12072/203307 [13:41:51<216:59:12,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12072/203307 [13:41:51<216:59:12,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12073/203307 [13:41:55<216:59:14,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12073/203307 [13:41:55<216:59:14,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12074/203307 [13:42:00<216:59:13,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12074/203307 [13:42:00<216:59:13,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12075/203307 [13:42:03<216:59:04,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12075/203307 [13:42:03<216:59:04,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12076/203307 [13:42:07<216:58:54,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12076/203307 [13:42:07<216:58:54,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12077/203307 [13:42:12<216:58:56,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12077/203307 [13:42:12<216:58:56,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12078/203307 [13:42:15<216:58:46,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12078/203307 [13:42:15<216:58:46,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12079/203307 [13:42:19<216:58:38,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12079/203307 [13:42:19<216:58:38,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12080/203307 [13:42:24<216:58:41,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12080/203307 [13:42:24<216:58:41,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12081/203307 [13:42:28<216:58:41,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▌         | 12081/203307 [13:42:28<216:58:41,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12082/203307 [13:42:32<216:58:32,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12082/203307 [13:42:32<216:58:32,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12083/203307 [13:42:36<216:58:29,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12083/203307 [13:42:36<216:58:30,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12084/203307 [13:42:40<216:58:19,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12084/203307 [13:42:40<216:58:19,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12085/203307 [13:42:44<216:58:20,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12085/203307 [13:42:44<216:58:20,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12086/203307 [13:42:48<216:58:12,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12086/203307 [13:42:48<216:58:12,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12087/203307 [13:42:52<216:58:02,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12087/203307 [13:42:52<216:58:02,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12088/203307 [13:42:56<216:58:03,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12088/203307 [13:42:56<216:58:03,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12089/203307 [13:43:00<216:57:56,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12089/203307 [13:43:00<216:57:56,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12090/203307 [13:43:04<216:57:57,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12090/203307 [13:43:04<216:57:57,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12091/203307 [13:43:08<216:57:48,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12091/203307 [13:43:08<216:57:48,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12092/203307 [13:43:12<216:57:45,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12092/203307 [13:43:12<216:57:45,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12093/203307 [13:43:17<216:57:46,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12093/203307 [13:43:17<216:57:46,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12094/203307 [13:43:20<216:57:36,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12094/203307 [13:43:20<216:57:36,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12095/203307 [13:43:24<216:57:27,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12095/203307 [13:43:24<216:57:27,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12096/203307 [13:43:28<216:57:18,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12096/203307 [13:43:28<216:57:18,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12097/203307 [13:43:32<216:57:21,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12097/203307 [13:43:32<216:57:21,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12098/203307 [13:43:36<216:57:11,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12098/203307 [13:43:36<216:57:11,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12099/203307 [13:43:41<216:57:12,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12099/203307 [13:43:41<216:57:12,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12100/203307 [13:43:44<216:57:01,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12100/203307 [13:43:44<216:57:01,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12101/203307 [13:43:48<216:56:58,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   6%|▌         | 12101/203307 [13:43:48<216:56:58,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12102/203307 [13:43:53<216:56:58,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12102/203307 [13:43:53<216:56:58,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12103/203307 [13:43:56<216:56:47,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12103/203307 [13:43:56<216:56:47,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12104/203307 [13:44:00<216:56:38,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12104/203307 [13:44:00<216:56:38,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12105/203307 [13:44:04<216:56:28,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12105/203307 [13:44:04<216:56:28,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12106/203307 [13:44:08<216:56:29,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12106/203307 [13:44:08<216:56:29,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12107/203307 [13:44:13<216:56:30,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12107/203307 [13:44:13<216:56:30,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12108/203307 [13:44:16<216:56:20,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12108/203307 [13:44:16<216:56:20,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12109/203307 [13:44:20<216:56:09,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12109/203307 [13:44:20<216:56:09,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12110/203307 [13:44:24<216:56:09,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12110/203307 [13:44:24<216:56:10,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12111/203307 [13:44:28<216:56:00,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12111/203307 [13:44:28<216:56:00,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12112/203307 [13:44:32<216:55:50,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12112/203307 [13:44:32<216:55:50,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12113/203307 [13:44:36<216:55:40,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12113/203307 [13:44:36<216:55:40,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12114/203307 [13:44:40<216:55:41,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12114/203307 [13:44:40<216:55:41,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12115/203307 [13:44:44<216:55:31,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12115/203307 [13:44:44<216:55:31,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12116/203307 [13:44:48<216:55:33,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12116/203307 [13:44:48<216:55:33,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12117/203307 [13:44:52<216:55:22,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12117/203307 [13:44:52<216:55:22,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12118/203307 [13:44:56<216:55:22,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12118/203307 [13:44:56<216:55:22,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12119/203307 [13:45:00<216:55:20,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12119/203307 [13:45:00<216:55:20,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12120/203307 [13:45:04<216:55:09,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12120/203307 [13:45:04<216:55:09,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12121/203307 [13:45:08<216:54:59,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   6%|▌         | 12121/203307 [13:45:08<216:54:59,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12122/203307 [13:45:12<216:54:50,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12122/203307 [13:45:12<216:54:50,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12123/203307 [13:45:16<216:54:53,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12123/203307 [13:45:16<216:54:53,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12124/203307 [13:45:20<216:54:43,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12124/203307 [13:45:20<216:54:43,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12125/203307 [13:45:24<216:54:45,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12125/203307 [13:45:24<216:54:45,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12126/203307 [13:45:28<216:54:34,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12126/203307 [13:45:28<216:54:34,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12127/203307 [13:45:32<216:54:33,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12127/203307 [13:45:32<216:54:33,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12128/203307 [13:45:36<216:54:31,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12128/203307 [13:45:36<216:54:31,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12129/203307 [13:45:40<216:54:21,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12129/203307 [13:45:40<216:54:21,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12130/203307 [13:45:44<216:54:09,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12130/203307 [13:45:44<216:54:09,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12131/203307 [13:45:47<216:53:59,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12131/203307 [13:45:47<216:53:59,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12132/203307 [13:45:52<216:54:02,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12132/203307 [13:45:52<216:54:02,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12133/203307 [13:45:56<216:54:01,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12133/203307 [13:45:56<216:54:01,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12134/203307 [13:46:00<216:53:51,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12134/203307 [13:46:00<216:53:51,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12135/203307 [13:46:04<216:53:49,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12135/203307 [13:46:04<216:53:49,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12136/203307 [13:46:08<216:53:38,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12136/203307 [13:46:08<216:53:38,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12137/203307 [13:46:12<216:53:36,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12137/203307 [13:46:12<216:53:36,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12138/203307 [13:46:16<216:53:27,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12138/203307 [13:46:16<216:53:27,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12139/203307 [13:46:19<216:53:17,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12139/203307 [13:46:19<216:53:18,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12140/203307 [13:46:24<216:53:19,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12140/203307 [13:46:24<216:53:19,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12141/203307 [13:46:28<216:53:10,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▌         | 12141/203307 [13:46:28<216:53:11,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12142/203307 [13:46:32<216:53:11,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12142/203307 [13:46:32<216:53:12,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12143/203307 [13:46:36<216:53:11,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12143/203307 [13:46:36<216:53:11,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12144/203307 [13:46:40<216:53:02,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12144/203307 [13:46:40<216:53:02,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12145/203307 [13:46:44<216:52:52,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12145/203307 [13:46:44<216:52:52,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12146/203307 [13:46:48<216:52:49,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12146/203307 [13:46:48<216:52:50,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12147/203307 [13:46:52<216:52:39,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12147/203307 [13:46:52<216:52:39,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12148/203307 [13:46:56<216:52:30,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12148/203307 [13:46:56<216:52:30,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12149/203307 [13:47:00<216:52:32,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12149/203307 [13:47:00<216:52:33,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12150/203307 [13:47:04<216:52:23,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12150/203307 [13:47:04<216:52:23,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12151/203307 [13:47:08<216:52:24,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12151/203307 [13:47:08<216:52:24,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12152/203307 [13:47:12<216:52:23,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12152/203307 [13:47:13<216:52:23,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12153/203307 [13:47:16<216:52:13,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12153/203307 [13:47:16<216:52:13,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12154/203307 [13:47:20<216:52:02,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12154/203307 [13:47:20<216:52:03,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12155/203307 [13:47:24<216:52:01,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12155/203307 [13:47:24<216:52:01,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12156/203307 [13:47:28<216:51:50,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12156/203307 [13:47:28<216:51:50,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12157/203307 [13:47:31<216:51:39,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12157/203307 [13:47:31<216:51:39,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12158/203307 [13:47:36<216:51:40,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12158/203307 [13:47:36<216:51:40,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12159/203307 [13:47:40<216:51:39,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12159/203307 [13:47:40<216:51:39,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12160/203307 [13:47:44<216:51:38,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12160/203307 [13:47:44<216:51:38,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12161/203307 [13:47:48<216:51:28,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   6%|▌         | 12161/203307 [13:47:48<216:51:28,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12162/203307 [13:47:52<216:51:16,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12162/203307 [13:47:52<216:51:17,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12163/203307 [13:47:55<216:51:06,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12163/203307 [13:47:55<216:51:06,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12164/203307 [13:48:00<216:51:03,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12164/203307 [13:48:00<216:51:04,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12165/203307 [13:48:03<216:50:52,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12165/203307 [13:48:03<216:50:53,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12166/203307 [13:48:08<216:50:53,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12166/203307 [13:48:08<216:50:54,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12167/203307 [13:48:11<216:50:43,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12167/203307 [13:48:11<216:50:43,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12168/203307 [13:48:16<216:50:43,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12168/203307 [13:48:16<216:50:43,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12169/203307 [13:48:19<216:50:35,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12169/203307 [13:48:19<216:50:35,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12170/203307 [13:48:23<216:50:25,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12170/203307 [13:48:23<216:50:25,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12171/203307 [13:48:27<216:50:15,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12171/203307 [13:48:27<216:50:15,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12172/203307 [13:48:31<216:50:05,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12172/203307 [13:48:31<216:50:05,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12173/203307 [13:48:35<216:50:03,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12173/203307 [13:48:35<216:50:04,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12174/203307 [13:48:39<216:49:54,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12174/203307 [13:48:39<216:49:55,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12175/203307 [13:48:43<216:49:57,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12175/203307 [13:48:43<216:49:57,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12176/203307 [13:48:47<216:49:47,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12176/203307 [13:48:47<216:49:47,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12177/203307 [13:48:51<216:49:48,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12177/203307 [13:48:51<216:49:48,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12178/203307 [13:48:55<216:49:37,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12178/203307 [13:48:55<216:49:37,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12179/203307 [13:48:59<216:49:26,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12179/203307 [13:48:59<216:49:27,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12180/203307 [13:49:02<216:49:16,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12180/203307 [13:49:02<216:49:17,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12181/203307 [13:49:06<216:49:07,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:   6%|▌         | 12181/203307 [13:49:06<216:49:07,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12182/203307 [13:49:10<216:49:06,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12182/203307 [13:49:10<216:49:06,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12183/203307 [13:49:14<216:48:56,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12183/203307 [13:49:14<216:48:56,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12184/203307 [13:49:18<216:48:58,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12184/203307 [13:49:18<216:48:58,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12185/203307 [13:49:23<216:48:58,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12185/203307 [13:49:23<216:48:58,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12186/203307 [13:49:26<216:48:48,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12186/203307 [13:49:26<216:48:48,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12187/203307 [13:49:30<216:48:38,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12187/203307 [13:49:30<216:48:38,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12188/203307 [13:49:34<216:48:28,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12188/203307 [13:49:34<216:48:28,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12189/203307 [13:49:38<216:48:18,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12189/203307 [13:49:38<216:48:18,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12190/203307 [13:49:41<216:48:08,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12190/203307 [13:49:41<216:48:08,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12191/203307 [13:49:46<216:48:06,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12191/203307 [13:49:46<216:48:06,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12192/203307 [13:49:50<216:48:07,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12192/203307 [13:49:50<216:48:07,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12193/203307 [13:49:54<216:48:05,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12193/203307 [13:49:54<216:48:05,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12194/203307 [13:49:59<216:48:05,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12194/203307 [13:49:59<216:48:05,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12195/203307 [13:50:02<216:47:56,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12195/203307 [13:50:02<216:47:56,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12196/203307 [13:50:06<216:47:45,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12196/203307 [13:50:06<216:47:45,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12197/203307 [13:50:10<216:47:35,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12197/203307 [13:50:10<216:47:35,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12198/203307 [13:50:13<216:47:25,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12198/203307 [13:50:13<216:47:25,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12199/203307 [13:50:17<216:47:15,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12199/203307 [13:50:17<216:47:15,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12200/203307 [13:50:21<216:47:14,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12200/203307 [13:50:21<216:47:14,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12201/203307 [13:50:26<216:47:16,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   6%|▌         | 12201/203307 [13:50:26<216:47:16,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12202/203307 [13:50:30<216:47:15,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12202/203307 [13:50:30<216:47:15,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12203/203307 [13:50:34<216:47:15,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12203/203307 [13:50:34<216:47:15,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12204/203307 [13:50:38<216:47:06,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12204/203307 [13:50:38<216:47:06,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12205/203307 [13:50:42<216:46:55,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12205/203307 [13:50:42<216:46:55,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12206/203307 [13:50:46<216:46:46,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12206/203307 [13:50:46<216:46:46,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12207/203307 [13:50:49<216:46:37,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12207/203307 [13:50:49<216:46:37,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12208/203307 [13:50:53<216:46:27,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12208/203307 [13:50:53<216:46:27,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12209/203307 [13:50:57<216:46:25,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12209/203307 [13:50:57<216:46:25,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12210/203307 [13:51:02<216:46:28,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12210/203307 [13:51:02<216:46:28,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12211/203307 [13:51:06<216:46:28,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12211/203307 [13:51:06<216:46:28,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12212/203307 [13:51:10<216:46:17,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12212/203307 [13:51:10<216:46:17,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12213/203307 [13:51:14<216:46:07,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12213/203307 [13:51:14<216:46:07,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12214/203307 [13:51:17<216:45:58,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12214/203307 [13:51:17<216:45:58,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12215/203307 [13:51:21<216:45:50,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12215/203307 [13:51:21<216:45:50,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12216/203307 [13:51:25<216:45:40,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12216/203307 [13:51:25<216:45:40,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12217/203307 [13:51:29<216:45:30,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12217/203307 [13:51:29<216:45:30,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12218/203307 [13:51:33<216:45:32,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12218/203307 [13:51:33<216:45:32,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12219/203307 [13:51:37<216:45:23,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12219/203307 [13:51:37<216:45:23,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12220/203307 [13:51:41<216:45:24,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12220/203307 [13:51:41<216:45:24,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12221/203307 [13:51:45<216:45:18,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   6%|▌         | 12221/203307 [13:51:45<216:45:18,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12222/203307 [13:51:49<216:45:07,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12222/203307 [13:51:49<216:45:07,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12223/203307 [13:51:53<216:44:57,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12223/203307 [13:51:53<216:44:57,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12224/203307 [13:51:56<216:44:48,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12224/203307 [13:51:56<216:44:49,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12225/203307 [13:52:00<216:44:41,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12225/203307 [13:52:00<216:44:41,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12226/203307 [13:52:04<216:44:32,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12226/203307 [13:52:04<216:44:32,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12227/203307 [13:52:08<216:44:33,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12227/203307 [13:52:08<216:44:33,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12228/203307 [13:52:12<216:44:23,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12228/203307 [13:52:12<216:44:23,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12229/203307 [13:52:16<216:44:24,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12229/203307 [13:52:16<216:44:24,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12230/203307 [13:52:20<216:44:14,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12230/203307 [13:52:20<216:44:15,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12231/203307 [13:52:24<216:44:04,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12231/203307 [13:52:24<216:44:04,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12232/203307 [13:52:28<216:43:53,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12232/203307 [13:52:28<216:43:54,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12233/203307 [13:52:31<216:43:44,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12233/203307 [13:52:31<216:43:44,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12234/203307 [13:52:35<216:43:34,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12234/203307 [13:52:35<216:43:34,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12235/203307 [13:52:39<216:43:34,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12235/203307 [13:52:39<216:43:34,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12236/203307 [13:52:44<216:43:35,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12236/203307 [13:52:44<216:43:35,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12237/203307 [13:52:48<216:43:33,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12237/203307 [13:52:48<216:43:33,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12238/203307 [13:52:52<216:43:22,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12238/203307 [13:52:52<216:43:22,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12239/203307 [13:52:55<216:43:11,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12239/203307 [13:52:55<216:43:11,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12240/203307 [13:52:59<216:43:02,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12240/203307 [13:52:59<216:43:02,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12241/203307 [13:53:03<216:42:53,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:   6%|▌         | 12241/203307 [13:53:03<216:42:53,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12242/203307 [13:53:07<216:42:45,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12242/203307 [13:53:07<216:42:45,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12243/203307 [13:53:11<216:42:46,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12243/203307 [13:53:11<216:42:46,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12244/203307 [13:53:15<216:42:47,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12244/203307 [13:53:15<216:42:47,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12245/203307 [13:53:20<216:42:43,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12245/203307 [13:53:20<216:42:43,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12246/203307 [13:53:24<216:42:44,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12246/203307 [13:53:24<216:42:44,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12247/203307 [13:53:28<216:42:34,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12247/203307 [13:53:28<216:42:34,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12248/203307 [13:53:31<216:42:23,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12248/203307 [13:53:31<216:42:23,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12249/203307 [13:53:35<216:42:12,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12249/203307 [13:53:35<216:42:12,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12250/203307 [13:53:39<216:42:03,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12250/203307 [13:53:39<216:42:03,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12251/203307 [13:53:42<216:41:54,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12251/203307 [13:53:42<216:41:54,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12252/203307 [13:53:47<216:41:55,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12252/203307 [13:53:47<216:41:55,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12253/203307 [13:53:51<216:41:56,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12253/203307 [13:53:51<216:41:56,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12254/203307 [13:53:55<216:41:52,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12254/203307 [13:53:55<216:41:52,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12255/203307 [13:54:00<216:41:52,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12255/203307 [13:54:00<216:41:52,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12256/203307 [13:54:03<216:41:41,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12256/203307 [13:54:03<216:41:41,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12257/203307 [13:54:07<216:41:31,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12257/203307 [13:54:07<216:41:31,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12258/203307 [13:54:11<216:41:21,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12258/203307 [13:54:11<216:41:22,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12259/203307 [13:54:14<216:41:11,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12259/203307 [13:54:14<216:41:11,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12260/203307 [13:54:19<216:41:11,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12260/203307 [13:54:19<216:41:11,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12261/203307 [13:54:23<216:41:02,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12261/203307 [13:54:23<216:41:02,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12262/203307 [13:54:27<216:41:03,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12262/203307 [13:54:27<216:41:03,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12263/203307 [13:54:31<216:41:03,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12263/203307 [13:54:31<216:41:03,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12264/203307 [13:54:35<216:40:53,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12264/203307 [13:54:35<216:40:53,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12265/203307 [13:54:39<216:40:42,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12265/203307 [13:54:39<216:40:42,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12266/203307 [13:54:42<216:40:31,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12266/203307 [13:54:42<216:40:32,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12267/203307 [13:54:46<216:40:22,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12267/203307 [13:54:46<216:40:22,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12268/203307 [13:54:50<216:40:22,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12268/203307 [13:54:50<216:40:22,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12269/203307 [13:54:54<216:40:11,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12269/203307 [13:54:54<216:40:11,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12270/203307 [13:54:58<216:40:11,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12270/203307 [13:54:58<216:40:11,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12271/203307 [13:55:02<216:40:02,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12271/203307 [13:55:02<216:40:02,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12272/203307 [13:55:06<216:40:01,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12272/203307 [13:55:06<216:40:02,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12273/203307 [13:55:10<216:39:50,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12273/203307 [13:55:10<216:39:51,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12274/203307 [13:55:14<216:39:40,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12274/203307 [13:55:14<216:39:40,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12275/203307 [13:55:18<216:39:30,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12275/203307 [13:55:18<216:39:31,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12276/203307 [13:55:21<216:39:22,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12276/203307 [13:55:21<216:39:22,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12277/203307 [13:55:26<216:39:21,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12277/203307 [13:55:26<216:39:22,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12278/203307 [13:55:29<216:39:11,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12278/203307 [13:55:29<216:39:12,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12279/203307 [13:55:34<216:39:13,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12279/203307 [13:55:34<216:39:13,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12280/203307 [13:55:37<216:39:02,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12280/203307 [13:55:37<216:39:02,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12281/203307 [13:55:42<216:39:02,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   6%|▌         | 12281/203307 [13:55:42<216:39:02,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12282/203307 [13:55:45<216:38:51,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12282/203307 [13:55:45<216:38:52,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12283/203307 [13:55:49<216:38:43,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12283/203307 [13:55:49<216:38:43,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12284/203307 [13:55:53<216:38:32,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12284/203307 [13:55:53<216:38:33,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12285/203307 [13:55:57<216:38:33,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12285/203307 [13:55:57<216:38:33,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12286/203307 [13:56:01<216:38:23,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12286/203307 [13:56:01<216:38:23,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12287/203307 [13:56:05<216:38:13,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12287/203307 [13:56:05<216:38:13,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12288/203307 [13:56:09<216:38:15,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12288/203307 [13:56:09<216:38:15,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12289/203307 [13:56:13<216:38:15,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12289/203307 [13:56:14<216:38:15,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12290/203307 [13:56:18<216:38:17,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12290/203307 [13:56:18<216:38:17,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12291/203307 [13:56:22<216:38:06,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12291/203307 [13:56:22<216:38:06,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12292/203307 [13:56:25<216:37:57,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12292/203307 [13:56:25<216:37:57,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12293/203307 [13:56:30<216:37:58,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12293/203307 [13:56:30<216:37:58,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12294/203307 [13:56:33<216:37:48,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12294/203307 [13:56:33<216:37:48,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12295/203307 [13:56:37<216:37:39,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12295/203307 [13:56:37<216:37:39,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12296/203307 [13:56:42<216:37:40,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12296/203307 [13:56:42<216:37:40,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12297/203307 [13:56:45<216:37:30,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12297/203307 [13:56:45<216:37:30,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12298/203307 [13:56:50<216:37:31,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12298/203307 [13:56:50<216:37:31,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12299/203307 [13:56:54<216:37:30,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12299/203307 [13:56:54<216:37:30,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12300/203307 [13:56:58<216:37:19,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12300/203307 [13:56:58<216:37:19,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12301/203307 [13:57:01<216:37:10,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   6%|▌         | 12301/203307 [13:57:01<216:37:10,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12302/203307 [13:57:06<216:37:10,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12302/203307 [13:57:06<216:37:10,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12303/203307 [13:57:10<216:37:01,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12303/203307 [13:57:10<216:37:01,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12304/203307 [13:57:13<216:36:51,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12304/203307 [13:57:13<216:36:51,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12305/203307 [13:57:18<216:36:54,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12305/203307 [13:57:18<216:36:54,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12306/203307 [13:57:21<216:36:43,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12306/203307 [13:57:21<216:36:43,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12307/203307 [13:57:26<216:36:44,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12307/203307 [13:57:26<216:36:45,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12308/203307 [13:57:30<216:36:43,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12308/203307 [13:57:30<216:36:43,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12309/203307 [13:57:34<216:36:32,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12309/203307 [13:57:34<216:36:32,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12310/203307 [13:57:38<216:36:31,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12310/203307 [13:57:38<216:36:32,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12311/203307 [13:57:42<216:36:23,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12311/203307 [13:57:42<216:36:23,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12312/203307 [13:57:46<216:36:13,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12312/203307 [13:57:46<216:36:14,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12313/203307 [13:57:49<216:36:06,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12313/203307 [13:57:49<216:36:06,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12314/203307 [13:57:54<216:36:08,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12314/203307 [13:57:54<216:36:08,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12315/203307 [13:57:58<216:36:09,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12315/203307 [13:57:58<216:36:09,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12316/203307 [13:58:02<216:36:00,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12316/203307 [13:58:02<216:36:00,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12317/203307 [13:58:06<216:35:57,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12317/203307 [13:58:06<216:35:57,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12318/203307 [13:58:11<216:35:57,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12318/203307 [13:58:11<216:35:57,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12319/203307 [13:58:14<216:35:47,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12319/203307 [13:58:14<216:35:47,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12320/203307 [13:58:18<216:35:37,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12320/203307 [13:58:18<216:35:37,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12321/203307 [13:58:22<216:35:33,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12321/203307 [13:58:22<216:35:33,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12322/203307 [13:58:27<216:35:34,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12322/203307 [13:58:27<216:35:34,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12323/203307 [13:58:30<216:35:24,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12323/203307 [13:58:30<216:35:24,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12324/203307 [13:58:35<216:35:24,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12324/203307 [13:58:35<216:35:24,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12325/203307 [13:58:38<216:35:14,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12325/203307 [13:58:38<216:35:14,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12326/203307 [13:58:43<216:35:13,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12326/203307 [13:58:43<216:35:13,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12327/203307 [13:58:47<216:35:12,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12327/203307 [13:58:47<216:35:12,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12328/203307 [13:58:50<216:35:01,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12328/203307 [13:58:51<216:35:01,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12329/203307 [13:58:54<216:34:51,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12329/203307 [13:58:54<216:34:51,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12330/203307 [13:58:58<216:34:43,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12330/203307 [13:58:58<216:34:43,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12331/203307 [13:59:02<216:34:45,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12331/203307 [13:59:02<216:34:45,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12332/203307 [13:59:06<216:34:34,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12332/203307 [13:59:06<216:34:35,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12333/203307 [13:59:11<216:34:36,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12333/203307 [13:59:11<216:34:36,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12334/203307 [13:59:14<216:34:25,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12334/203307 [13:59:14<216:34:25,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12335/203307 [13:59:19<216:34:26,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12335/203307 [13:59:19<216:34:26,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12336/203307 [13:59:22<216:34:17,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12336/203307 [13:59:22<216:34:17,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12337/203307 [13:59:26<216:34:08,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12337/203307 [13:59:26<216:34:08,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12338/203307 [13:59:30<216:33:59,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12338/203307 [13:59:30<216:33:59,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12339/203307 [13:59:34<216:33:53,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12339/203307 [13:59:34<216:33:53,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12340/203307 [13:59:38<216:33:54,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12340/203307 [13:59:38<216:33:54,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12341/203307 [13:59:43<216:33:55,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   6%|▌         | 12341/203307 [13:59:43<216:33:55,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12342/203307 [13:59:46<216:33:45,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12342/203307 [13:59:46<216:33:45,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12343/203307 [13:59:51<216:33:45,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12343/203307 [13:59:51<216:33:45,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12344/203307 [13:59:55<216:33:44,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12344/203307 [13:59:55<216:33:44,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12345/203307 [13:59:59<216:33:36,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12345/203307 [13:59:59<216:33:36,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12346/203307 [14:00:03<216:33:26,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12346/203307 [14:00:03<216:33:26,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12347/203307 [14:00:06<216:33:16,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12347/203307 [14:00:06<216:33:16,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12348/203307 [14:00:11<216:33:18,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12348/203307 [14:00:11<216:33:18,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12349/203307 [14:00:15<216:33:09,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12349/203307 [14:00:15<216:33:09,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12350/203307 [14:00:19<216:33:11,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12350/203307 [14:00:19<216:33:11,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12351/203307 [14:00:23<216:33:01,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12351/203307 [14:00:23<216:33:01,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12352/203307 [14:00:27<216:33:02,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12352/203307 [14:00:27<216:33:02,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12353/203307 [14:00:31<216:33:00,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12353/203307 [14:00:31<216:33:00,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12354/203307 [14:00:35<216:32:48,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12354/203307 [14:00:35<216:32:48,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12355/203307 [14:00:39<216:32:39,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12355/203307 [14:00:39<216:32:39,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12356/203307 [14:00:42<216:32:30,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12356/203307 [14:00:42<216:32:30,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12357/203307 [14:00:47<216:32:32,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12357/203307 [14:00:47<216:32:32,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12358/203307 [14:00:51<216:32:22,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12358/203307 [14:00:51<216:32:22,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12359/203307 [14:00:55<216:32:23,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12359/203307 [14:00:55<216:32:23,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12360/203307 [14:00:59<216:32:22,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12360/203307 [14:00:59<216:32:22,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12361/203307 [14:01:03<216:32:13,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12361/203307 [14:01:03<216:32:13,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12362/203307 [14:01:07<216:32:09,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12362/203307 [14:01:07<216:32:09,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12363/203307 [14:01:11<216:31:59,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12363/203307 [14:01:11<216:31:59,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12364/203307 [14:01:15<216:31:49,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12364/203307 [14:01:15<216:31:49,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12365/203307 [14:01:18<216:31:41,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12365/203307 [14:01:18<216:31:41,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12366/203307 [14:01:23<216:31:44,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12366/203307 [14:01:23<216:31:44,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12367/203307 [14:01:27<216:31:45,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12367/203307 [14:01:27<216:31:45,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12368/203307 [14:01:32<216:31:46,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12368/203307 [14:01:32<216:31:46,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12369/203307 [14:01:35<216:31:37,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12369/203307 [14:01:35<216:31:37,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12370/203307 [14:01:39<216:31:27,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12370/203307 [14:01:39<216:31:27,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12371/203307 [14:01:43<216:31:26,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12371/203307 [14:01:43<216:31:26,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12372/203307 [14:01:47<216:31:16,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12372/203307 [14:01:47<216:31:16,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12373/203307 [14:01:51<216:31:07,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12373/203307 [14:01:51<216:31:07,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12374/203307 [14:01:55<216:31:08,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12374/203307 [14:01:55<216:31:08,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12375/203307 [14:01:59<216:30:59,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12375/203307 [14:01:59<216:30:59,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12376/203307 [14:02:03<216:30:59,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12376/203307 [14:02:04<216:31:00,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12377/203307 [14:02:08<216:30:59,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12377/203307 [14:02:08<216:31:00,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12378/203307 [14:02:12<216:30:49,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12378/203307 [14:02:12<216:30:49,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12379/203307 [14:02:15<216:30:41,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12379/203307 [14:02:15<216:30:41,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12380/203307 [14:02:20<216:30:39,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12380/203307 [14:02:20<216:30:39,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12381/203307 [14:02:23<216:30:30,  0.24it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   6%|▌         | 12381/203307 [14:02:23<216:30:30,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12382/203307 [14:02:27<216:30:21,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12382/203307 [14:02:27<216:30:21,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12383/203307 [14:02:32<216:30:23,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12383/203307 [14:02:32<216:30:23,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12384/203307 [14:02:35<216:30:13,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12384/203307 [14:02:35<216:30:13,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12385/203307 [14:02:40<216:30:14,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12385/203307 [14:02:40<216:30:14,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12386/203307 [14:02:43<216:30:03,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12386/203307 [14:02:43<216:30:03,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12387/203307 [14:02:47<216:29:52,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12387/203307 [14:02:47<216:29:52,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12388/203307 [14:02:51<216:29:43,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12388/203307 [14:02:51<216:29:43,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12389/203307 [14:02:55<216:29:41,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12389/203307 [14:02:55<216:29:41,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12390/203307 [14:02:59<216:29:32,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12390/203307 [14:02:59<216:29:32,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12391/203307 [14:03:02<216:29:21,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12391/203307 [14:03:02<216:29:22,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12392/203307 [14:03:07<216:29:23,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12392/203307 [14:03:07<216:29:23,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12393/203307 [14:03:11<216:29:27,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12393/203307 [14:03:11<216:29:27,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12394/203307 [14:03:15<216:29:20,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12394/203307 [14:03:15<216:29:20,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12395/203307 [14:03:19<216:29:11,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12395/203307 [14:03:19<216:29:11,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12396/203307 [14:03:23<216:29:02,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12396/203307 [14:03:23<216:29:02,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12397/203307 [14:03:27<216:28:53,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12397/203307 [14:03:27<216:28:53,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12398/203307 [14:03:31<216:28:50,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12398/203307 [14:03:31<216:28:50,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12399/203307 [14:03:35<216:28:41,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12399/203307 [14:03:35<216:28:41,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12400/203307 [14:03:39<216:28:42,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12400/203307 [14:03:39<216:28:42,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12401/203307 [14:03:43<216:28:34,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   6%|▌         | 12401/203307 [14:03:43<216:28:34,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12402/203307 [14:03:47<216:28:35,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12402/203307 [14:03:47<216:28:35,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12403/203307 [14:03:51<216:28:26,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12403/203307 [14:03:51<216:28:26,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12404/203307 [14:03:55<216:28:16,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12404/203307 [14:03:55<216:28:16,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12405/203307 [14:03:58<216:28:06,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12405/203307 [14:03:58<216:28:06,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12406/203307 [14:04:02<216:27:57,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12406/203307 [14:04:02<216:27:57,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12407/203307 [14:04:06<216:27:55,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12407/203307 [14:04:06<216:27:55,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12408/203307 [14:04:10<216:27:45,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12408/203307 [14:04:10<216:27:45,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12409/203307 [14:04:15<216:27:51,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12409/203307 [14:04:15<216:27:51,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12410/203307 [14:04:19<216:27:51,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12410/203307 [14:04:19<216:27:51,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12411/203307 [14:04:23<216:27:52,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12411/203307 [14:04:23<216:27:52,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12412/203307 [14:04:27<216:27:43,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12412/203307 [14:04:27<216:27:43,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12413/203307 [14:04:31<216:27:33,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12413/203307 [14:04:31<216:27:33,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12414/203307 [14:04:35<216:27:25,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12414/203307 [14:04:35<216:27:25,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12415/203307 [14:04:39<216:27:17,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12415/203307 [14:04:39<216:27:17,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12416/203307 [14:04:43<216:27:12,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12416/203307 [14:04:43<216:27:12,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12417/203307 [14:04:46<216:27:02,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12417/203307 [14:04:46<216:27:02,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12418/203307 [14:04:51<216:27:03,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12418/203307 [14:04:51<216:27:03,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12419/203307 [14:04:55<216:27:05,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12419/203307 [14:04:55<216:27:05,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12420/203307 [14:04:59<216:26:55,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12420/203307 [14:04:59<216:26:55,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12421/203307 [14:05:03<216:26:45,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   6%|▌         | 12421/203307 [14:05:03<216:26:46,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12422/203307 [14:05:06<216:26:38,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12422/203307 [14:05:06<216:26:38,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12423/203307 [14:05:10<216:26:28,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12423/203307 [14:05:10<216:26:28,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12424/203307 [14:05:14<216:26:18,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12424/203307 [14:05:14<216:26:18,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12425/203307 [14:05:18<216:26:15,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12425/203307 [14:05:18<216:26:16,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12426/203307 [14:05:22<216:26:16,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12426/203307 [14:05:22<216:26:16,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12427/203307 [14:05:27<216:26:15,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12427/203307 [14:05:27<216:26:15,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12428/203307 [14:05:31<216:26:16,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12428/203307 [14:05:31<216:26:16,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12429/203307 [14:05:35<216:26:05,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12429/203307 [14:05:35<216:26:05,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12430/203307 [14:05:39<216:25:56,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12430/203307 [14:05:39<216:25:56,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12431/203307 [14:05:42<216:25:47,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12431/203307 [14:05:42<216:25:47,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12432/203307 [14:05:46<216:25:36,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12432/203307 [14:05:46<216:25:36,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12433/203307 [14:05:50<216:25:25,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12433/203307 [14:05:50<216:25:25,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12434/203307 [14:05:54<216:25:23,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12434/203307 [14:05:54<216:25:23,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12435/203307 [14:05:58<216:25:25,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12435/203307 [14:05:58<216:25:25,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12436/203307 [14:06:02<216:25:14,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12436/203307 [14:06:02<216:25:14,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12437/203307 [14:06:06<216:25:14,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12437/203307 [14:06:06<216:25:14,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12438/203307 [14:06:10<216:25:03,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12438/203307 [14:06:10<216:25:03,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12439/203307 [14:06:14<216:24:55,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12439/203307 [14:06:14<216:24:55,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12440/203307 [14:06:17<216:24:46,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12440/203307 [14:06:17<216:24:46,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12441/203307 [14:06:21<216:24:37,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   6%|▌         | 12441/203307 [14:06:21<216:24:37,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12442/203307 [14:06:25<216:24:27,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12442/203307 [14:06:25<216:24:27,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12443/203307 [14:06:29<216:24:28,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12443/203307 [14:06:29<216:24:28,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12444/203307 [14:06:34<216:24:28,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12444/203307 [14:06:34<216:24:29,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12445/203307 [14:06:38<216:24:28,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12445/203307 [14:06:38<216:24:28,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12446/203307 [14:06:42<216:24:18,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12446/203307 [14:06:42<216:24:19,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12447/203307 [14:06:45<216:24:09,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12447/203307 [14:06:45<216:24:09,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12448/203307 [14:06:49<216:23:59,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12448/203307 [14:06:49<216:23:59,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12449/203307 [14:06:53<216:23:50,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12449/203307 [14:06:53<216:23:50,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12450/203307 [14:06:57<216:23:41,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12450/203307 [14:06:57<216:23:41,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12451/203307 [14:07:00<216:23:31,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12451/203307 [14:07:00<216:23:31,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12452/203307 [14:07:05<216:23:31,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12452/203307 [14:07:05<216:23:31,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12453/203307 [14:07:08<216:23:21,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12453/203307 [14:07:08<216:23:22,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12454/203307 [14:07:13<216:23:22,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12454/203307 [14:07:13<216:23:22,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12455/203307 [14:07:17<216:23:12,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12455/203307 [14:07:17<216:23:12,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12456/203307 [14:07:20<216:23:02,  0.25it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12456/203307 [14:07:20<216:23:02,  0.25it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12457/203307 [14:07:24<216:22:53,  0.25it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12457/203307 [14:07:24<216:22:53,  0.25it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12458/203307 [14:07:28<216:22:44,  0.25it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12458/203307 [14:07:28<216:22:44,  0.25it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12459/203307 [14:07:32<216:22:35,  0.25it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12459/203307 [14:07:32<216:22:35,  0.25it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12460/203307 [14:07:36<216:22:34,  0.25it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12460/203307 [14:07:36<216:22:34,  0.25it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12461/203307 [14:07:40<216:22:34,  0.25it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:   6%|▌         | 12461/203307 [14:07:40<216:22:34,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12462/203307 [14:07:44<216:22:23,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12462/203307 [14:07:44<216:22:24,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12463/203307 [14:07:48<216:22:24,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12463/203307 [14:07:48<216:22:24,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12464/203307 [14:07:52<216:22:14,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12464/203307 [14:07:52<216:22:14,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12465/203307 [14:07:55<216:22:03,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12465/203307 [14:07:55<216:22:03,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12466/203307 [14:07:59<216:21:52,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12466/203307 [14:07:59<216:21:52,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12467/203307 [14:08:03<216:21:43,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12467/203307 [14:08:03<216:21:43,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12468/203307 [14:08:07<216:21:43,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12468/203307 [14:08:07<216:21:43,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12469/203307 [14:08:11<216:21:33,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12469/203307 [14:08:11<216:21:33,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12470/203307 [14:08:15<216:21:33,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12470/203307 [14:08:15<216:21:33,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12471/203307 [14:08:20<216:21:33,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12471/203307 [14:08:20<216:21:33,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12472/203307 [14:08:23<216:21:24,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12472/203307 [14:08:23<216:21:24,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12473/203307 [14:08:27<216:21:14,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12473/203307 [14:08:27<216:21:14,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12474/203307 [14:08:31<216:21:05,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12474/203307 [14:08:31<216:21:05,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12475/203307 [14:08:35<216:20:55,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12475/203307 [14:08:35<216:20:55,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12476/203307 [14:08:38<216:20:46,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12476/203307 [14:08:38<216:20:46,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12477/203307 [14:08:43<216:20:46,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12477/203307 [14:08:43<216:20:46,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12478/203307 [14:08:47<216:20:46,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12478/203307 [14:08:47<216:20:47,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12479/203307 [14:08:51<216:20:44,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12479/203307 [14:08:51<216:20:44,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12480/203307 [14:08:56<216:20:44,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12480/203307 [14:08:56<216:20:44,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12481/203307 [14:08:59<216:20:35,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   6%|▌         | 12481/203307 [14:08:59<216:20:35,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12482/203307 [14:09:03<216:20:25,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12482/203307 [14:09:03<216:20:25,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12483/203307 [14:09:07<216:20:16,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12483/203307 [14:09:07<216:20:16,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12484/203307 [14:09:10<216:20:05,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12484/203307 [14:09:10<216:20:05,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12485/203307 [14:09:15<216:20:04,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12485/203307 [14:09:15<216:20:04,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12486/203307 [14:09:18<216:19:55,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12486/203307 [14:09:18<216:19:55,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12487/203307 [14:09:23<216:19:56,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12487/203307 [14:09:23<216:19:56,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12488/203307 [14:09:27<216:19:55,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12488/203307 [14:09:27<216:19:55,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12489/203307 [14:09:32<216:19:56,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12489/203307 [14:09:32<216:19:56,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12490/203307 [14:09:35<216:19:45,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12490/203307 [14:09:35<216:19:45,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12491/203307 [14:09:39<216:19:34,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12491/203307 [14:09:39<216:19:34,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12492/203307 [14:09:43<216:19:25,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12492/203307 [14:09:43<216:19:26,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12493/203307 [14:09:47<216:19:25,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12493/203307 [14:09:47<216:19:25,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12494/203307 [14:09:51<216:19:15,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12494/203307 [14:09:51<216:19:15,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12495/203307 [14:09:54<216:19:05,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12495/203307 [14:09:54<216:19:05,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12496/203307 [14:09:59<216:19:07,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12496/203307 [14:09:59<216:19:07,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12497/203307 [14:10:03<216:19:07,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12497/203307 [14:10:03<216:19:07,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12498/203307 [14:10:07<216:18:56,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12498/203307 [14:10:07<216:18:56,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12499/203307 [14:10:10<216:18:46,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12499/203307 [14:10:10<216:18:46,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12500/203307 [14:10:14<216:18:36,  0.25it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12500/203307 [14:10:14<216:18:36,  0.25it/s, v_num=t5e6, training/loss=0.0831]
Validation: |          | 0/? [00:00<?, ?it/s][A
Validation:   0%|          | 0/1 [00:00<?, ?it/s][A


Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s][A[A

Sampling (mamba memory):  50%|█████     | 101/200 [00:01<01:39,  1.00s/it][A[A

Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:35,  1.02it/s][A[A

Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:33,  1.03it/s][A[A

Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:28,  1.09it/s][A[A

Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:24,  1.13it/s][A[A

Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:21,  1.15it/s][A[A

Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:19,  1.17it/s][A[A

Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:18,  1.17it/s][A[A

Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:17,  1.18it/s][A[A

Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:26,  1.14it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:25,  1.15it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:24,  1.15it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:23,  1.15it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:22,  1.15it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:21,  1.15it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:20,  1.15it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:06<01:20,  1.15it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:19,  1.14it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:18,  1.14it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:17,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:25,  1.15it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:24,  1.16it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:24,  1.15it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:23,  1.15it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:22,  1.15it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:21,  1.15it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:20,  1.15it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:06<01:20,  1.15it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:19,  1.15it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:18,  1.14it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:17,  1.1Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:16,  1.18it/s][A[A

Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:30,  1.09it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:27,  1.13it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:25,  1.14it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:24,  1.14it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:23,  1.14it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:22,  1.14it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:21,  1.14it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:21,  1.13it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:20,  1.13it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:19,  1.13it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:18,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:28,  1.12it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:26,  1.13it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:26,  1.13it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:25,  1.13it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:24,  1.12it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:23,  1.12it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:22,  1.12it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:21,  1.12it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:21,  1.12it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:20,  1.12it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:20,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:28,  1.11it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:27,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:26,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:25,  1.12it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:24,  1.12it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:23,  1.12it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:23,  1.12it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:22,  1.12it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:21,  1.11it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:20,  1.12it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:19,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:29,  1.11it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:27,  1.11it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:27,  1.11it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:26,  1.11it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:25,  1.11it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:24,  1.12it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:23,  1.11it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:23,  1.11it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:22,  1.10it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:09<01:22,  1.10it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:21,  1.0Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:31,  1.09it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:29,  1.09it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:28,  1.10it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:27,  1.10it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:26,  1.10it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:25,  1.10it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:24,  1.09it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:24,  1.09it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:23,  1.09it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:09<01:22,  1.09it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:10<01:21,  1.0Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:14,  1.19it/s][A[A

Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:13,  1.19it/s][A[A

Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:13,  1.19it/s][A[A

Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:12,  1.18it/s][A[A

Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:12,  1.18it/s][A[A

Sampling (mamba memory):  58%|█████▊    | 116/200 [00:13<01:11,  1.18it/s][A[A

Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:10,  1.18it/s][A[A

Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:09,  1.17it/s][A[A

Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:09,  1.17it/s][A[A

Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:08,  1.17it/s][A[A

Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:08,  1.16it/s][A[A

Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:07,  1.16it/s][A[A

4it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:16,  1.14it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:16,  1.14it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:15,  1.14it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:14,  1.13it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:14,  1.13it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:13,  1.13it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:12,  1.13it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:12,  1.12it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:11,  1.12it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:10,  1.11it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:09,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 123/4it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:16,  1.15it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:16,  1.14it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:15,  1.14it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:14,  1.14it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:13<01:13,  1.14it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:13,  1.13it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:12,  1.13it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:12,  1.12it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:11,  1.12it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:11,  1.11it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:10,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 123/3it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:17,  1.13it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:16,  1.13it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:15,  1.13it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:15,  1.13it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:14,  1.13it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:13,  1.13it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:12,  1.13it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:12,  1.12it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:11,  1.12it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:11,  1.11it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:10,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 123/Sampling (mamba memory):  62%|██████▏   | 123/200 [00:19<01:06,  1.15it/s][A[A

2it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:18,  1.12it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:17,  1.12it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:16,  1.12it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:16,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:15,  1.11it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:14,  1.11it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:14,  1.10it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:13,  1.09it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:13,  1.09it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:12,  1.09it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:12,  1.08it/s]Sampling (mamba memory):  62%|██████▏   | 123/1it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:19,  1.11it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:18,  1.10it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:18,  1.10it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:17,  1.10it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:16,  1.10it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:15,  1.10it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:15,  1.09it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:14,  1.09it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:13,  1.09it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:19<01:12,  1.08it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:11,  1.09it/s]Sampling (mamba memory):  62%|██████▏   | 123/9it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:20,  1.09it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:19,  1.09it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:18,  1.09it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:17,  1.10it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:16,  1.10it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:15,  1.10it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:14,  1.10it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:13,  1.10it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:13,  1.09it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:19<01:12,  1.09it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:20<01:11,  1.09it/s]Sampling (mamba memory):  62%|██████▏   | 123/9it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:11<01:21,  1.08it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:20,  1.08it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:19,  1.08it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:19,  1.07it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:18,  1.07it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:17,  1.07it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:16,  1.07it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:15,  1.07it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:14,  1.07it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:19<01:13,  1.07it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:20<01:12,  1.07it/s]Sampling (mamba memory):  62%|██████▏   | 123/Sampling (mamba memory):  62%|██████▏   | 124/200 [00:20<01:06,  1.15it/s][A[A

Sampling (mamba memory):  62%|██████▎   | 125/200 [00:21<01:05,  1.15it/s][A[A

Sampling (mamba memory):  63%|██████▎   | 126/200 [00:22<01:04,  1.15it/s][A[A

Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:03,  1.15it/s][A[A

Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:02,  1.15it/s][A[A

Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:01,  1.15it/s][A[A

Sampling (mamba memory):  65%|██████▌   | 130/200 [00:25<01:00,  1.15it/s][A[A

Sampling (mamba memory):  66%|██████▌   | 131/200 [00:26<01:00,  1.15it/s][A[A

Sampling (mamba memory):  66%|██████▌   | 132/200 [00:27<00:59,  1.15it/s][A[A

Sampling (mamba memory):  66%|██████▋   | 133/200 [00:28<00:58,  1.15it/s][A[A

Sampling (mamba memory):  67%|██████▋   | 134/200 [00:29<00:57,  1.14it/s][A[A

200 [00:20<01:09,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:08,  1.11it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:07,  1.11it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:06,  1.11it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:06,  1.11it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:05,  1.11it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:04,  1.11it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:03,  1.10it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:02,  1.10it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:01,  1.10it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:00,  1.10it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:00,  1.10it/s]Sampling (mamba Sampling (mamba memory):  68%|██████▊   | 135/200 [00:30<00:57,  1.14it/s][A[A

200 [00:20<01:09,  1.10it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:09,  1.10it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:08,  1.10it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:07,  1.10it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:06,  1.10it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:05,  1.10it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:04,  1.10it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:03,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:03,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:02,  1.09it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:01,  1.09it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:00,  1.09it/s]Sampling (mamba 200 [00:20<01:09,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:08,  1.11it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:07,  1.10it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:06,  1.11it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:05,  1.11it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:04,  1.11it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:04,  1.11it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:03,  1.11it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:02,  1.10it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:02,  1.10it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:01,  1.09it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:00,  1.09it/s]Sampling (mamba 200 [00:20<01:10,  1.09it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:09,  1.09it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:08,  1.09it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:07,  1.09it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:06,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:06,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:05,  1.08it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:04,  1.08it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:04,  1.07it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:03,  1.07it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:02,  1.07it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<01:01,  1.07it/s]Sampling (mamba 200 [00:20<01:11,  1.08it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:10,  1.08it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:09,  1.08it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:08,  1.08it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:07,  1.07it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:07,  1.07it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:06,  1.07it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:05,  1.07it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:04,  1.06it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:04,  1.06it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:03,  1.06it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<01:02,  1.06it/s]Sampling (mamba Sampling (mamba memory):  68%|██████▊   | 136/200 [00:31<00:56,  1.13it/s][A[A

200 [00:20<01:10,  1.09it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:10,  1.08it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:09,  1.08it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:08,  1.07it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:08,  1.07it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:07,  1.07it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:06,  1.07it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:05,  1.07it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:05,  1.06it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:04,  1.06it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:03,  1.06it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<01:02,  1.05it/s]Sampling (mamba 200 [00:21<01:11,  1.07it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:22<01:10,  1.07it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:23<01:09,  1.07it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:24<01:08,  1.07it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:25<01:08,  1.07it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:07,  1.07it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:06,  1.07it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:05,  1.07it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:04,  1.06it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:04,  1.06it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:03,  1.06it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<01:02,  1.05it/s]Sampling (mamba Sampling (mamba memory):  68%|██████▊   | 137/200 [00:32<00:55,  1.13it/s][A[A

Sampling (mamba memory):  69%|██████▉   | 138/200 [00:33<00:55,  1.12it/s][A[A

Sampling (mamba memory):  70%|██████▉   | 139/200 [00:33<00:54,  1.12it/s][A[A

Sampling (mamba memory):  70%|███████   | 140/200 [00:34<00:53,  1.13it/s][A[A

Sampling (mamba memory):  70%|███████   | 141/200 [00:35<00:52,  1.12it/s][A[A

Sampling (mamba memory):  71%|███████   | 142/200 [00:36<00:51,  1.12it/s][A[A

Sampling (mamba memory):  72%|███████▏  | 143/200 [00:37<00:51,  1.12it/s][A[A

Sampling (mamba memory):  72%|███████▏  | 144/200 [00:38<00:50,  1.11it/s][A[A

Sampling (mamba memory):  72%|███████▎  | 145/200 [00:39<00:49,  1.11it/s][A[A

Sampling (mamba memory):  73%|███████▎  | 146/200 [00:40<00:49,  1.10it/s][A[A

memory):  68%|██████▊   | 135/200 [00:31<00:59,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:58,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:57,  1.09it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:56,  1.10it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:34<00:55,  1.10it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:35<00:54,  1.10it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:36<00:53,  1.09it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:37<00:53,  1.09it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:38<00:52,  1.09it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:51,  1.09it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:50,  1.09it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:31<00:59,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:58,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:58,  1.08it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:57,  1.08it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:34<00:56,  1.08it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:35<00:55,  1.08it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:36<00:54,  1.07it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:37<00:54,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:38<00:53,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:52,  1.07it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:51,  1.07it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:31<01:00,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:59,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:58,  1.07it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:57,  1.07it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:57,  1.07it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:56,  1.07it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:55,  1.06it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:37<00:54,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:38<00:53,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:53,  1.06it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:52,  1.05it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▎  | 147/200 [00:41<00:48,  1.10it/s][A[A

memory):  68%|██████▊   | 135/200 [00:31<01:00,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:59,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:58,  1.07it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:57,  1.08it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:56,  1.07it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:55,  1.07it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:55,  1.07it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:54,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:53,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:52,  1.07it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:51,  1.07it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:32<01:01,  1.06it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:33<01:00,  1.06it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:59,  1.06it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:58,  1.06it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:57,  1.06it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:56,  1.05it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:56,  1.05it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:55,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:54,  1.04it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:53,  1.05it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:52,  1.05it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:32<01:01,  1.05it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:33<01:00,  1.05it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:34<01:00,  1.05it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:35<00:59,  1.05it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:36<00:58,  1.04it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:37<00:57,  1.04it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:38<00:56,  1.04it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:39<00:55,  1.04it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:55,  1.04it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:54,  1.03it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:53,  1.03it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▍  | 148/200 [00:42<00:47,  1.09it/s][A[A

memory):  68%|██████▊   | 135/200 [00:32<01:01,  1.05it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:33<01:01,  1.04it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:34<01:00,  1.04it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:35<00:59,  1.04it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:36<00:59,  1.03it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:37<00:58,  1.03it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:38<00:57,  1.02it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:39<00:56,  1.02it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:40<00:56,  1.02it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:41<00:55,  1.02it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:42<00:54,  1.01it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▍  | 149/200 [00:43<00:46,  1.09it/s][A[A

Sampling (mamba memory):  75%|███████▌  | 150/200 [00:43<00:46,  1.09it/s][A[A

Sampling (mamba memory):  76%|███████▌  | 151/200 [00:44<00:45,  1.08it/s][A[A

Sampling (mamba memory):  76%|███████▌  | 152/200 [00:45<00:44,  1.08it/s][A[A

Sampling (mamba memory):  76%|███████▋  | 153/200 [00:46<00:43,  1.08it/s][A[A

Sampling (mamba memory):  77%|███████▋  | 154/200 [00:47<00:42,  1.07it/s][A[A

Sampling (mamba memory):  78%|███████▊  | 155/200 [00:48<00:42,  1.07it/s][A[A

Sampling (mamba memory):  78%|███████▊  | 156/200 [00:49<00:41,  1.07it/s][A[A

Sampling (mamba memory):  78%|███████▊  | 157/200 [00:50<00:40,  1.07it/s][A[A

 | 146/200 [00:41<00:49,  1.09it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:48,  1.09it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:47,  1.08it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:47,  1.08it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:46,  1.08it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:45,  1.08it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:46<00:44,  1.07it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:47<00:43,  1.07it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:48<00:43,  1.07it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:49<00:42,  1.07it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:50<00:41,  1.07it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:51<00:40 | 146/200 [00:41<00:50,  1.07it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:49,  1.07it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:48,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:48,  1.06it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:47,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:46,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:45,  1.05it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:44,  1.05it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:44,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:43,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:42,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:41Sampling (mamba memory):  79%|███████▉  | 158/200 [00:51<00:39,  1.07it/s][A[A

 | 146/200 [00:41<00:51,  1.05it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:50,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:49,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:48,  1.04it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:47,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:47,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:46,  1.04it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:45,  1.04it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:44,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:43,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:42,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:41 | 146/200 [00:42<00:50,  1.07it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:49,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:48,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:48,  1.06it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:47,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:46,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:48<00:46,  1.04it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:45,  1.04it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:44,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:43,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:42,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:41 | 146/200 [00:42<00:51,  1.05it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:50,  1.04it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:49,  1.04it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:49,  1.04it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:48,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:47,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:48<00:46,  1.04it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:49<00:45,  1.04it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:50<00:44,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:51<00:43,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:52<00:42,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:53<00:41Sampling (mamba memory):  80%|███████▉  | 159/200 [00:52<00:38,  1.06it/s][A[A

 | 146/200 [00:42<00:52,  1.03it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:51,  1.03it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:50,  1.03it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:49,  1.02it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:48,  1.02it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:48,  1.02it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:48<00:47,  1.02it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:49<00:46,  1.01it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:50<00:45,  1.01it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:51<00:44,  1.01it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:52<00:43,  1.01it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:53<00:42Sampling (mamba memory):  80%|████████  | 160/200 [00:53<00:37,  1.07it/s][A[A

 | 146/200 [00:43<00:53,  1.01it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:44<00:52,  1.01it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:45<00:51,  1.01it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:46<00:50,  1.01it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:47<00:49,  1.01it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:48<00:48,  1.00it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:49<00:47,  1.00it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:50<00:46,  1.00it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:51<00:45,  1.00it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:52<00:45,  1.00s/it]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:53<00:44,  1.00s/it]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:54<00:43Sampling (mamba memory):  80%|████████  | 161/200 [00:54<00:36,  1.07it/s][A[A

Sampling (mamba memory):  81%|████████  | 162/200 [00:55<00:35,  1.07it/s][A[A

Sampling (mamba memory):  82%|████████▏ | 163/200 [00:56<00:34,  1.07it/s][A[A

Sampling (mamba memory):  82%|████████▏ | 164/200 [00:57<00:33,  1.07it/s][A[A

Sampling (mamba memory):  82%|████████▎ | 165/200 [00:57<00:32,  1.07it/s][A[A

Sampling (mamba memory):  83%|████████▎ | 166/200 [00:58<00:31,  1.07it/s][A[A

Sampling (mamba memory):  84%|████████▎ | 167/200 [00:59<00:30,  1.07it/s][A[A

Sampling (mamba memory):  84%|████████▍ | 168/200 [01:00<00:30,  1.06it/s][A[A

,  1.07it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:52<00:39,  1.06it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:53<00:38,  1.06it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:54<00:37,  1.06it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:55<00:36,  1.06it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:56<00:35,  1.06it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:57<00:35,  1.06it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:58<00:34,  1.05it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [00:59<00:33,  1.05it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:00<00:32,  1.05it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:01<00:31,  1.04it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:02<00:30,  1.04it/sSampling (mamba memory):  84%|████████▍ | 169/200 [01:01<00:29,  1.06it/s][A[A

,  1.04it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:53<00:40,  1.04it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:53<00:39,  1.03it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:54<00:38,  1.03it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:55<00:37,  1.03it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:56<00:36,  1.03it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:57<00:35,  1.03it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:58<00:34,  1.03it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [00:59<00:34,  1.03it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:00<00:33,  1.02it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:01<00:32,  1.02it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:02<00:31,  1.02it/s,  1.03it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:53<00:40,  1.03it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:54<00:39,  1.03it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:55<00:38,  1.03it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:56<00:37,  1.03it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:57<00:36,  1.03it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:35,  1.03it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:35,  1.03it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:34,  1.02it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:33,  1.02it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:02<00:32,  1.02it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:03<00:31,  1.02it/s,  1.04it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:53<00:40,  1.04it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:54<00:39,  1.04it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:55<00:38,  1.04it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:56<00:37,  1.04it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:57<00:36,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:35,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:34,  1.03it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:33,  1.03it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:33,  1.02it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:02<00:32,  1.02it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:03<00:31,  1.02it/sSampling (mamba memory):  85%|████████▌ | 170/200 [01:02<00:28,  1.06it/s][A[A

,  1.03it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:54<00:40,  1.03it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:55<00:39,  1.03it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:56<00:38,  1.03it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:57<00:37,  1.03it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:58<00:36,  1.03it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:59<00:35,  1.03it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:35,  1.02it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:34,  1.02it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:33,  1.02it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:02<00:32,  1.02it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:03<00:31,  1.02it/sSampling (mamba memory):  86%|████████▌ | 171/200 [01:03<00:27,  1.06it/s][A[A

,  1.01it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:54<00:41,  1.01it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:55<00:40,  1.01it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:56<00:39,  1.00it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:57<00:38,  1.00it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:58<00:37,  1.00it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:59<00:37,  1.00s/it]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:00<00:36,  1.01s/it]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:01<00:35,  1.01s/it]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:02<00:34,  1.01s/it]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:03<00:33,  1.01s/it]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:04<00:32,  1.01s/it,  1.00s/it]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:55<00:41,  1.00it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:56<00:40,  1.00it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:57<00:40,  1.00s/it]Sampling (mamba memory):  80%|████████  | 161/200 [00:58<00:39,  1.00s/it]Sampling (mamba memory):  81%|████████  | 162/200 [00:59<00:38,  1.00s/it]Sampling (mamba memory):  82%|████████▏ | 163/200 [01:00<00:37,  1.01s/it]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:01<00:36,  1.01s/it]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:02<00:35,  1.01s/it]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:03<00:34,  1.02s/it]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:04<00:33,  1.02s/it]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:05<00:32,  1.02s/itSampling (mamba memory):  86%|████████▌ | 172/200 [01:04<00:26,  1.06it/s][A[A

Sampling (mamba memory):  86%|████████▋ | 173/200 [01:05<00:25,  1.06it/s][A[A

Sampling (mamba memory):  87%|████████▋ | 174/200 [01:06<00:24,  1.05it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 175/200 [01:07<00:23,  1.05it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 176/200 [01:08<00:22,  1.05it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 177/200 [01:09<00:21,  1.05it/s][A[A

Sampling (mamba memory):  89%|████████▉ | 178/200 [01:10<00:21,  1.05it/s][A[A

Sampling (mamba memory):  90%|████████▉ | 179/200 [01:11<00:20,  1.04it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:03<00:29,  1.03it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:04<00:29,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:05<00:28,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:06<00:27,  1.03it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:07<00:26,  1.02it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:08<00:25,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:09<00:24,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:10<00:23,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:10<00:22,  1.02it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:11<00:21,  1.02it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:12<00:20,  1.01it/s]Sampling (mamba memory):  90%|█████████ | 180/200 [01:12<00:19,  1.04it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:03<00:30,  1.02it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:04<00:29,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:05<00:28,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:06<00:27,  1.01it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:07<00:26,  1.01it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:08<00:25,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:09<00:24,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:10<00:23,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:11<00:22,  1.01it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:12<00:21,  1.00it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:13<00:20,  1.00it/s]]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:04<00:30,  1.02it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:05<00:29,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:06<00:28,  1.01it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:07<00:27,  1.01it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:08<00:26,  1.01it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:09<00:25,  1.00it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:10<00:24,  1.00it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:11<00:24,  1.00s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:12<00:23,  1.01s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:13<00:22,  1.01s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:14<00:21,  1.01s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:13<00:18,  1.04it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:04<00:30,  1.01it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:05<00:29,  1.01it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:06<00:28,  1.01it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:07<00:27,  1.00it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:08<00:26,  1.00it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:09<00:26,  1.00s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:10<00:25,  1.00s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:11<00:24,  1.00s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:12<00:23,  1.01s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:13<00:22,  1.01s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:14<00:21,  1.01s/it]]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:04<00:30,  1.02it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:05<00:29,  1.01it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:06<00:28,  1.01it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:07<00:27,  1.01it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:08<00:26,  1.00it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:09<00:25,  1.00it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:10<00:25,  1.00s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:11<00:24,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:12<00:23,  1.01s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:13<00:22,  1.01s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:14<00:21,  1.01s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:14<00:17,  1.04it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:05<00:31,  1.01s/it]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:06<00:30,  1.01s/it]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:07<00:29,  1.01s/it]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:08<00:28,  1.01s/it]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:09<00:27,  1.01s/it]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:10<00:26,  1.00s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:11<00:25,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:12<00:24,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:13<00:23,  1.01s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:14<00:22,  1.01s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:15<00:21,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:15<00:16,  1.04it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:06<00:31,  1.02s/it]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:07<00:30,  1.02s/it]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:08<00:29,  1.03s/it]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:09<00:28,  1.03s/it]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:10<00:27,  1.03s/it]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:11<00:26,  1.03s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:12<00:25,  1.04s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:13<00:24,  1.04s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:14<00:23,  1.04s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:15<00:22,  1.04s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:16<00:21,  1.04s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:16<00:15,  1.03it/s][A[A

Sampling (mamba memory):  92%|█████████▎| 185/200 [01:17<00:14,  1.03it/s][A[A

Sampling (mamba memory):  93%|█████████▎| 186/200 [01:18<00:13,  1.03it/s][A[A

Sampling (mamba memory):  94%|█████████▎| 187/200 [01:19<00:12,  1.03it/s][A[A

Sampling (mamba memory):  94%|█████████▍| 188/200 [01:20<00:11,  1.03it/s][A[A

Sampling (mamba memory):  94%|█████████▍| 189/200 [01:21<00:10,  1.03it/s][A[A

Sampling (mamba memory):  95%|█████████▌| 190/200 [01:22<00:09,  1.03it/s][A[A

Sampling (mamba memory):  96%|█████████▌| 191/200 [01:22<00:08,  1.03it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:13<00:19,  1.01it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:14<00:18,  1.01it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:15<00:17,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:16<00:16,  1.00it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:17<00:15,  1.00it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:18<00:14,  1.00it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:19<00:14,  1.00s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:20<00:12,  1.00it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:21<00:12,  1.00s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:22<00:11,  1.00s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:23<00Sampling (mamba memory):  90%|█████████ | 180/200 [01:14<00:19,  1.00it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:15<00:19,  1.00s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:16<00:18,  1.00s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:17<00:17,  1.00s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:18<00:16,  1.01s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:19<00:15,  1.01s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:20<00:14,  1.01s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:21<00:13,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:22<00:12,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:23<00:11,  1.01s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:24<00Sampling (mamba memory):  96%|█████████▌| 192/200 [01:23<00:07,  1.03it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:15<00:20,  1.01s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:16<00:19,  1.01s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:17<00:18,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:18<00:17,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:19<00:16,  1.01s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:20<00:15,  1.01s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:21<00:14,  1.01s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:22<00:13,  1.02s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:23<00:12,  1.02s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:24<00:11,  1.02s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:25<00Sampling (mamba memory):  90%|█████████ | 180/200 [01:15<00:20,  1.01s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:16<00:19,  1.02s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:17<00:18,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:18<00:17,  1.02s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:19<00:16,  1.02s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:20<00:15,  1.02s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:21<00:14,  1.02s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:22<00:13,  1.02s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:23<00:12,  1.02s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:24<00:11,  1.02s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:25<00Sampling (mamba memory):  96%|█████████▋| 193/200 [01:24<00:06,  1.03it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:15<00:20,  1.01s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:17<00:19,  1.01s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:18<00:18,  1.02s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:19<00:17,  1.02s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:20<00:16,  1.02s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:21<00:15,  1.02s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:22<00:14,  1.02s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:23<00:13,  1.02s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:24<00:12,  1.02s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:25<00:11,  1.02s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:26<00Sampling (mamba memory):  97%|█████████▋| 194/200 [01:25<00:05,  1.02it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:16<00:20,  1.02s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:18<00:19,  1.03s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:19<00:18,  1.03s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:20<00:17,  1.03s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:21<00:16,  1.03s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:22<00:15,  1.03s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:23<00:14,  1.03s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:24<00:13,  1.03s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:25<00:12,  1.03s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:26<00:11,  1.03s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:27<00Sampling (mamba memory):  98%|█████████▊| 195/200 [01:26<00:04,  1.02it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:17<00:20,  1.04s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:19<00:19,  1.04s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:20<00:18,  1.05s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:21<00:17,  1.05s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:22<00:16,  1.05s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:23<00:15,  1.05s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:24<00:14,  1.05s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:25<00:13,  1.05s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:26<00:12,  1.05s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:27<00:11,  1.06s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:28<00Sampling (mamba memory):  98%|█████████▊| 196/200 [01:27<00:03,  1.02it/s][A[A

Sampling (mamba memory):  98%|█████████▊| 197/200 [01:28<00:02,  1.02it/s][A[A

Sampling (mamba memory):  99%|█████████▉| 198/200 [01:29<00:01,  1.02it/s][A[A

Sampling (mamba memory): 100%|█████████▉| 199/200 [01:30<00:00,  1.02it/s][A[A

Sampling (mamba memory): 100%|██████████| 200/200 [01:31<00:00,  1.01it/s][A[ASampling (mamba memory): 100%|██████████| 200/200 [01:36<00:00,  1.03it/s]
Validation DataLoader 0:   0%|          | 0/1 [00:00<?, ?it/s][A
:10,  1.00s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:24<00:09,  1.00s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:25<00:08,  1.01s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:26<00:07,  1.01s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:28<00:06,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:29<00:05,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:30<00:04,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:31<00:03,  1.01s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:32<00:02,  1.01s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:33<00:01,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:34<00:00,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:38<00:00,  1.01it/s]
:10,  1.01s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:25<00:09,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:26<00:08,  1.01s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:27<00:07,  1.02s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:28<00:06,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:29<00:05,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:30<00:04,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:31<00:03,  1.01s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:32<00:02,  1.01s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:33<00:01,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:34<00:00,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:39<00:00,  1.00it/s]
:10,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:26<00:09,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:27<00:08,  1.02s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:28<00:07,  1.02s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:29<00:06,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:30<00:05,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:31<00:04,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:32<00:03,  1.03s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:33<00:02,  1.03s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:34<00:01,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:35<00:00,  1.04s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:40<00:00,  1.01s/it]
:10,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:26<00:09,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:27<00:08,  1.03s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:28<00:07,  1.03s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:29<00:06,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:30<00:05,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:32<00:04,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:33<00:03,  1.03s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:34<00:02,  1.04s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:35<00:01,  1.04s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:36<00:00,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:40<00:00,  1.01s/it]
:10,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:27<00:09,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:28<00:08,  1.02s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:29<00:07,  1.02s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:30<00:06,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:31<00:05,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:32<00:04,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:33<00:03,  1.03s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:34<00:02,  1.03s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:35<00:01,  1.04s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:36<00:00,  1.04s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:41<00:00,  1.01s/it]
:10,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:28<00:09,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:29<00:08,  1.03s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:30<00:07,  1.03s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:31<00:06,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:32<00:05,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:33<00:04,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:34<00:03,  1.04s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:35<00:02,  1.04s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:36<00:01,  1.04s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:37<00:00,  1.04s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:42<00:00,  1.02s/it]
:10,  1.06s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:29<00:09,  1.06s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:30<00:08,  1.06s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:31<00:07,  1.06s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:32<00:06,  1.06s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:33<00:05,  1.06s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:34<00:04,  1.07s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:35<00:03,  1.07s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:37<00:02,  1.07s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:38<00:01,  1.07s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:39<00:00,  1.06s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:43<00:00,  1.04s/it]
Validation DataLoader 0: 100%|██████████| 1/1 [01:36<00:00,  0.01it/s][A
                                                                      [AEpoch 0:   6%|▌         | 12500/203307 [14:12:10<216:47:58,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12501/203307 [14:12:14<216:48:01,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:   6%|▌         | 12501/203307 [14:12:14<216:48:01,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12502/203307 [14:12:18<216:47:59,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12502/203307 [14:12:18<216:47:59,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12503/203307 [14:12:22<216:47:49,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12503/203307 [14:12:22<216:47:49,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12504/203307 [14:12:26<216:47:39,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12504/203307 [14:12:26<216:47:40,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12505/203307 [14:12:30<216:47:44,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12505/203307 [14:12:30<216:47:44,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12506/203307 [14:12:34<216:47:36,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12506/203307 [14:12:34<216:47:36,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12507/203307 [14:12:38<216:47:25,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12507/203307 [14:12:38<216:47:25,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12508/203307 [14:12:42<216:47:13,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12508/203307 [14:12:42<216:47:13,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12509/203307 [14:12:45<216:47:06,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12509/203307 [14:12:45<216:47:06,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12510/203307 [14:12:49<216:46:58,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12510/203307 [14:12:49<216:46:58,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12511/203307 [14:12:54<216:47:00,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12511/203307 [14:12:54<216:47:00,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12512/203307 [14:12:58<216:46:52,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12512/203307 [14:12:58<216:46:52,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12513/203307 [14:13:03<216:47:05,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12513/203307 [14:13:03<216:47:05,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12514/203307 [14:13:07<216:47:00,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12514/203307 [14:13:07<216:47:00,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12515/203307 [14:13:11<216:46:50,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12515/203307 [14:13:11<216:46:50,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12516/203307 [14:13:14<216:46:41,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12516/203307 [14:13:14<216:46:41,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12517/203307 [14:13:18<216:46:32,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12517/203307 [14:13:18<216:46:32,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12518/203307 [14:13:22<216:46:22,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12518/203307 [14:13:22<216:46:22,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12519/203307 [14:13:26<216:46:23,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12519/203307 [14:13:26<216:46:23,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12520/203307 [14:13:30<216:46:14,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12520/203307 [14:13:30<216:46:14,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12521/203307 [14:13:34<216:46:13,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   6%|▌         | 12521/203307 [14:13:34<216:46:13,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12522/203307 [14:13:39<216:46:12,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12522/203307 [14:13:39<216:46:12,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12523/203307 [14:13:43<216:46:13,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12523/203307 [14:13:43<216:46:13,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12524/203307 [14:13:47<216:46:04,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12524/203307 [14:13:47<216:46:04,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12525/203307 [14:13:50<216:45:54,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12525/203307 [14:13:50<216:45:54,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12526/203307 [14:13:54<216:45:45,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12526/203307 [14:13:54<216:45:45,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12527/203307 [14:13:59<216:45:44,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12527/203307 [14:13:59<216:45:44,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12528/203307 [14:14:02<216:45:34,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12528/203307 [14:14:02<216:45:34,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12529/203307 [14:14:06<216:45:26,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12529/203307 [14:14:06<216:45:26,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12530/203307 [14:14:10<216:45:17,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12530/203307 [14:14:10<216:45:17,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12531/203307 [14:14:14<216:45:20,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12531/203307 [14:14:14<216:45:20,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12532/203307 [14:14:18<216:45:10,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12532/203307 [14:14:18<216:45:10,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12533/203307 [14:14:22<216:45:00,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12533/203307 [14:14:22<216:45:00,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12534/203307 [14:14:26<216:44:51,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12534/203307 [14:14:26<216:44:51,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12535/203307 [14:14:29<216:44:44,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12535/203307 [14:14:29<216:44:44,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12536/203307 [14:14:34<216:44:45,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12536/203307 [14:14:34<216:44:45,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12537/203307 [14:14:38<216:44:37,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12537/203307 [14:14:38<216:44:37,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12538/203307 [14:14:41<216:44:27,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12538/203307 [14:14:41<216:44:27,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12539/203307 [14:14:46<216:44:29,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12539/203307 [14:14:46<216:44:29,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12540/203307 [14:14:50<216:44:30,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12540/203307 [14:14:50<216:44:30,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12541/203307 [14:14:55<216:44:29,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   6%|▌         | 12541/203307 [14:14:55<216:44:29,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12542/203307 [14:14:58<216:44:19,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12542/203307 [14:14:58<216:44:19,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12543/203307 [14:15:02<216:44:09,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12543/203307 [14:15:02<216:44:09,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12544/203307 [14:15:06<216:44:09,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12544/203307 [14:15:06<216:44:09,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12545/203307 [14:15:10<216:43:59,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12545/203307 [14:15:10<216:43:59,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12546/203307 [14:15:14<216:43:49,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12546/203307 [14:15:14<216:43:49,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12547/203307 [14:15:18<216:43:51,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12547/203307 [14:15:18<216:43:51,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12548/203307 [14:15:22<216:43:43,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12548/203307 [14:15:22<216:43:44,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12549/203307 [14:15:27<216:43:46,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12549/203307 [14:15:27<216:43:46,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12550/203307 [14:15:30<216:43:37,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12550/203307 [14:15:30<216:43:37,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12551/203307 [14:15:34<216:43:33,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12551/203307 [14:15:34<216:43:33,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12552/203307 [14:15:39<216:43:34,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12552/203307 [14:15:39<216:43:34,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12553/203307 [14:15:43<216:43:26,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12553/203307 [14:15:43<216:43:26,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12554/203307 [14:15:47<216:43:20,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12554/203307 [14:15:47<216:43:20,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12555/203307 [14:15:50<216:43:10,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12555/203307 [14:15:50<216:43:10,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12556/203307 [14:15:55<216:43:14,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12556/203307 [14:15:55<216:43:14,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12557/203307 [14:15:59<216:43:14,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12557/203307 [14:15:59<216:43:14,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12558/203307 [14:16:04<216:43:12,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12558/203307 [14:16:04<216:43:12,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12559/203307 [14:16:07<216:43:03,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12559/203307 [14:16:07<216:43:03,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12560/203307 [14:16:11<216:42:53,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12560/203307 [14:16:11<216:42:53,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12561/203307 [14:16:16<216:42:55,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   6%|▌         | 12561/203307 [14:16:16<216:42:55,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12562/203307 [14:16:19<216:42:45,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12562/203307 [14:16:19<216:42:45,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12563/203307 [14:16:23<216:42:35,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12563/203307 [14:16:23<216:42:35,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12564/203307 [14:16:27<216:42:37,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12564/203307 [14:16:27<216:42:37,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12565/203307 [14:16:31<216:42:28,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12565/203307 [14:16:31<216:42:28,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12566/203307 [14:16:36<216:42:29,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12566/203307 [14:16:36<216:42:29,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12567/203307 [14:16:39<216:42:20,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12567/203307 [14:16:39<216:42:20,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12568/203307 [14:16:44<216:42:17,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12568/203307 [14:16:44<216:42:17,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12569/203307 [14:16:48<216:42:15,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12569/203307 [14:16:48<216:42:15,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12570/203307 [14:16:51<216:42:04,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12570/203307 [14:16:51<216:42:04,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12571/203307 [14:16:55<216:41:53,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12571/203307 [14:16:55<216:41:54,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12572/203307 [14:16:59<216:41:44,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12572/203307 [14:16:59<216:41:44,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12573/203307 [14:17:03<216:41:46,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12573/203307 [14:17:03<216:41:46,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12574/203307 [14:17:07<216:41:36,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12574/203307 [14:17:07<216:41:36,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12575/203307 [14:17:11<216:41:37,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12575/203307 [14:17:11<216:41:37,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12576/203307 [14:17:15<216:41:26,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12576/203307 [14:17:15<216:41:26,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12577/203307 [14:17:19<216:41:25,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12577/203307 [14:17:19<216:41:25,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12578/203307 [14:17:23<216:41:16,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12578/203307 [14:17:23<216:41:16,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12579/203307 [14:17:27<216:41:06,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12579/203307 [14:17:27<216:41:07,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12580/203307 [14:17:31<216:40:56,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12580/203307 [14:17:31<216:40:56,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12581/203307 [14:17:34<216:40:48,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   6%|▌         | 12581/203307 [14:17:34<216:40:48,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12582/203307 [14:17:39<216:40:48,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12582/203307 [14:17:39<216:40:48,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12583/203307 [14:17:43<216:40:47,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12583/203307 [14:17:43<216:40:47,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12584/203307 [14:17:47<216:40:37,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12584/203307 [14:17:47<216:40:37,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12585/203307 [14:17:51<216:40:28,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12585/203307 [14:17:51<216:40:28,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12586/203307 [14:17:55<216:40:27,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12586/203307 [14:17:55<216:40:28,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12587/203307 [14:17:59<216:40:17,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12587/203307 [14:17:59<216:40:17,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12588/203307 [14:18:02<216:40:06,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12588/203307 [14:18:02<216:40:06,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12589/203307 [14:18:06<216:39:56,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12589/203307 [14:18:06<216:39:56,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12590/203307 [14:18:10<216:39:56,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12590/203307 [14:18:10<216:39:56,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12591/203307 [14:18:14<216:39:47,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12591/203307 [14:18:14<216:39:47,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12592/203307 [14:18:18<216:39:47,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12592/203307 [14:18:18<216:39:47,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12593/203307 [14:18:22<216:39:38,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12593/203307 [14:18:22<216:39:38,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12594/203307 [14:18:26<216:39:38,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12594/203307 [14:18:26<216:39:38,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12595/203307 [14:18:31<216:39:36,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12595/203307 [14:18:31<216:39:36,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12596/203307 [14:18:35<216:39:28,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12596/203307 [14:18:35<216:39:28,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12597/203307 [14:18:38<216:39:17,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12597/203307 [14:18:38<216:39:17,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12598/203307 [14:18:42<216:39:08,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12598/203307 [14:18:42<216:39:08,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12599/203307 [14:18:46<216:39:10,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12599/203307 [14:18:46<216:39:10,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12600/203307 [14:18:50<216:39:01,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12600/203307 [14:18:50<216:39:01,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12601/203307 [14:18:55<216:39:01,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   6%|▌         | 12601/203307 [14:18:55<216:39:01,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12602/203307 [14:18:59<216:39:00,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12602/203307 [14:18:59<216:39:00,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12603/203307 [14:19:03<216:38:50,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12603/203307 [14:19:03<216:38:50,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12604/203307 [14:19:07<216:38:48,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12604/203307 [14:19:07<216:38:48,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12605/203307 [14:19:11<216:38:39,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12605/203307 [14:19:11<216:38:39,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12606/203307 [14:19:14<216:38:29,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12606/203307 [14:19:14<216:38:29,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12607/203307 [14:19:18<216:38:20,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12607/203307 [14:19:18<216:38:20,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12608/203307 [14:19:22<216:38:21,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12608/203307 [14:19:22<216:38:21,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12609/203307 [14:19:27<216:38:20,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12609/203307 [14:19:27<216:38:21,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12610/203307 [14:19:31<216:38:11,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12610/203307 [14:19:31<216:38:11,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12611/203307 [14:19:35<216:38:10,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12611/203307 [14:19:35<216:38:10,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12612/203307 [14:19:39<216:38:01,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12612/203307 [14:19:39<216:38:01,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12613/203307 [14:19:43<216:37:58,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12613/203307 [14:19:43<216:37:58,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12614/203307 [14:19:46<216:37:48,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12614/203307 [14:19:46<216:37:48,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12615/203307 [14:19:50<216:37:38,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12615/203307 [14:19:50<216:37:39,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12616/203307 [14:19:55<216:37:41,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12616/203307 [14:19:55<216:37:41,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12617/203307 [14:19:58<216:37:32,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12617/203307 [14:19:58<216:37:32,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12618/203307 [14:20:03<216:37:33,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12618/203307 [14:20:03<216:37:33,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12619/203307 [14:20:07<216:37:33,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12619/203307 [14:20:07<216:37:33,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12620/203307 [14:20:11<216:37:23,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12620/203307 [14:20:11<216:37:23,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12621/203307 [14:20:15<216:37:15,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   6%|▌         | 12621/203307 [14:20:15<216:37:15,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12622/203307 [14:20:19<216:37:14,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12622/203307 [14:20:19<216:37:14,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12623/203307 [14:20:23<216:37:04,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12623/203307 [14:20:23<216:37:04,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12624/203307 [14:20:26<216:36:54,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12624/203307 [14:20:26<216:36:54,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12625/203307 [14:20:31<216:36:55,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12625/203307 [14:20:31<216:36:55,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12626/203307 [14:20:35<216:36:45,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12626/203307 [14:20:35<216:36:45,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12627/203307 [14:20:39<216:36:48,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12627/203307 [14:20:39<216:36:48,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12628/203307 [14:20:43<216:36:38,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12628/203307 [14:20:43<216:36:39,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12629/203307 [14:20:47<216:36:29,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12629/203307 [14:20:47<216:36:29,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12630/203307 [14:20:51<216:36:24,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12630/203307 [14:20:51<216:36:24,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12631/203307 [14:20:55<216:36:22,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12631/203307 [14:20:55<216:36:22,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12632/203307 [14:20:59<216:36:12,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12632/203307 [14:20:59<216:36:12,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12633/203307 [14:21:02<216:36:02,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12633/203307 [14:21:02<216:36:03,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12634/203307 [14:21:07<216:36:05,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12634/203307 [14:21:07<216:36:05,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12635/203307 [14:21:11<216:36:06,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12635/203307 [14:21:11<216:36:06,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12636/203307 [14:21:15<216:36:04,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12636/203307 [14:21:15<216:36:04,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12637/203307 [14:21:19<216:35:56,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12637/203307 [14:21:19<216:35:56,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12638/203307 [14:21:23<216:35:46,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12638/203307 [14:21:23<216:35:46,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12639/203307 [14:21:27<216:35:37,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12639/203307 [14:21:27<216:35:37,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12640/203307 [14:21:31<216:35:36,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12640/203307 [14:21:31<216:35:36,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12641/203307 [14:21:35<216:35:27,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   6%|▌         | 12641/203307 [14:21:35<216:35:27,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12642/203307 [14:21:39<216:35:27,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12642/203307 [14:21:39<216:35:27,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12643/203307 [14:21:43<216:35:17,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12643/203307 [14:21:43<216:35:17,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12644/203307 [14:21:47<216:35:18,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12644/203307 [14:21:47<216:35:18,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12645/203307 [14:21:51<216:35:07,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12645/203307 [14:21:51<216:35:08,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12646/203307 [14:21:55<216:34:57,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12646/203307 [14:21:55<216:34:58,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12647/203307 [14:21:58<216:34:48,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12647/203307 [14:21:58<216:34:48,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12648/203307 [14:22:02<216:34:38,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12648/203307 [14:22:02<216:34:38,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12649/203307 [14:22:06<216:34:37,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12649/203307 [14:22:06<216:34:37,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12650/203307 [14:22:10<216:34:27,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12650/203307 [14:22:10<216:34:27,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12651/203307 [14:22:14<216:34:28,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12651/203307 [14:22:14<216:34:28,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12652/203307 [14:22:19<216:34:27,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12652/203307 [14:22:19<216:34:27,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12653/203307 [14:22:23<216:34:28,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12653/203307 [14:22:23<216:34:28,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12654/203307 [14:22:27<216:34:18,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12654/203307 [14:22:27<216:34:18,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12655/203307 [14:22:31<216:34:09,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12655/203307 [14:22:31<216:34:09,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12656/203307 [14:22:34<216:34:01,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12656/203307 [14:22:34<216:34:01,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12657/203307 [14:22:38<216:33:52,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12657/203307 [14:22:38<216:33:52,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12658/203307 [14:22:42<216:33:50,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12658/203307 [14:22:42<216:33:50,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12659/203307 [14:22:46<216:33:40,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12659/203307 [14:22:46<216:33:40,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12660/203307 [14:22:51<216:33:42,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12660/203307 [14:22:51<216:33:42,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12661/203307 [14:22:55<216:33:43,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   6%|▌         | 12661/203307 [14:22:55<216:33:43,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12662/203307 [14:22:59<216:33:34,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12662/203307 [14:22:59<216:33:34,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12663/203307 [14:23:03<216:33:24,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12663/203307 [14:23:03<216:33:25,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12664/203307 [14:23:06<216:33:16,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12664/203307 [14:23:06<216:33:16,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12665/203307 [14:23:10<216:33:07,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12665/203307 [14:23:10<216:33:07,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12666/203307 [14:23:14<216:32:58,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12666/203307 [14:23:14<216:32:58,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12667/203307 [14:23:18<216:32:56,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12667/203307 [14:23:18<216:32:56,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12668/203307 [14:23:23<216:32:57,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12668/203307 [14:23:23<216:32:57,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12669/203307 [14:23:27<216:32:57,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12669/203307 [14:23:27<216:32:57,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12670/203307 [14:23:31<216:32:57,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12670/203307 [14:23:31<216:32:57,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12671/203307 [14:23:35<216:32:47,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12671/203307 [14:23:35<216:32:47,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12672/203307 [14:23:39<216:32:37,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12672/203307 [14:23:39<216:32:37,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12673/203307 [14:23:42<216:32:28,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12673/203307 [14:23:42<216:32:28,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12674/203307 [14:23:46<216:32:19,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12674/203307 [14:23:46<216:32:19,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12675/203307 [14:23:50<216:32:10,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12675/203307 [14:23:50<216:32:10,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12676/203307 [14:23:54<216:32:10,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12676/203307 [14:23:54<216:32:10,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12677/203307 [14:23:59<216:32:11,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12677/203307 [14:23:59<216:32:11,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12678/203307 [14:24:02<216:32:00,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12678/203307 [14:24:02<216:32:00,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12679/203307 [14:24:07<216:32:01,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12679/203307 [14:24:07<216:32:02,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12680/203307 [14:24:11<216:31:52,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12680/203307 [14:24:11<216:31:52,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12681/203307 [14:24:14<216:31:41,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▌         | 12681/203307 [14:24:14<216:31:42,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12682/203307 [14:24:18<216:31:33,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12682/203307 [14:24:18<216:31:33,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12683/203307 [14:24:22<216:31:25,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12683/203307 [14:24:22<216:31:25,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12684/203307 [14:24:26<216:31:16,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12684/203307 [14:24:26<216:31:16,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12685/203307 [14:24:30<216:31:15,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12685/203307 [14:24:30<216:31:15,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12686/203307 [14:24:34<216:31:16,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12686/203307 [14:24:34<216:31:16,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12687/203307 [14:24:39<216:31:17,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12687/203307 [14:24:39<216:31:17,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12688/203307 [14:24:42<216:31:07,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12688/203307 [14:24:42<216:31:07,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12689/203307 [14:24:46<216:30:57,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12689/203307 [14:24:46<216:30:57,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12690/203307 [14:24:50<216:30:47,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12690/203307 [14:24:50<216:30:47,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12691/203307 [14:24:54<216:30:39,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12691/203307 [14:24:54<216:30:39,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12692/203307 [14:24:58<216:30:31,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12692/203307 [14:24:58<216:30:31,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12693/203307 [14:25:01<216:30:21,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12693/203307 [14:25:01<216:30:21,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12694/203307 [14:25:06<216:30:23,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12694/203307 [14:25:06<216:30:23,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12695/203307 [14:25:10<216:30:15,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12695/203307 [14:25:10<216:30:15,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12696/203307 [14:25:14<216:30:15,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12696/203307 [14:25:14<216:30:15,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12697/203307 [14:25:18<216:30:07,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12697/203307 [14:25:18<216:30:07,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12698/203307 [14:25:21<216:29:57,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12698/203307 [14:25:21<216:29:57,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12699/203307 [14:25:25<216:29:49,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12699/203307 [14:25:25<216:29:49,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12700/203307 [14:25:29<216:29:40,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12700/203307 [14:25:29<216:29:40,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12701/203307 [14:25:33<216:29:31,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▌         | 12701/203307 [14:25:33<216:29:31,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▌         | 12702/203307 [14:25:37<216:29:31,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▌         | 12702/203307 [14:25:37<216:29:31,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▌         | 12703/203307 [14:25:42<216:29:32,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▌         | 12703/203307 [14:25:42<216:29:32,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▌         | 12704/203307 [14:25:45<216:29:22,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▌         | 12704/203307 [14:25:45<216:29:22,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▌         | 12705/203307 [14:25:50<216:29:22,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▌         | 12705/203307 [14:25:50<216:29:22,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▌         | 12706/203307 [14:25:53<216:29:12,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▌         | 12706/203307 [14:25:53<216:29:12,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▋         | 12707/203307 [14:25:57<216:29:02,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▋         | 12707/203307 [14:25:57<216:29:02,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▋         | 12708/203307 [14:26:01<216:28:53,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▋         | 12708/203307 [14:26:01<216:28:53,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▋         | 12709/203307 [14:26:05<216:28:43,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▋         | 12709/203307 [14:26:05<216:28:43,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▋         | 12710/203307 [14:26:08<216:28:33,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▋         | 12710/203307 [14:26:08<216:28:33,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▋         | 12711/203307 [14:26:13<216:28:33,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▋         | 12711/203307 [14:26:13<216:28:33,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▋         | 12712/203307 [14:26:17<216:28:34,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▋         | 12712/203307 [14:26:17<216:28:34,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▋         | 12713/203307 [14:26:21<216:28:34,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▋         | 12713/203307 [14:26:21<216:28:34,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▋         | 12714/203307 [14:26:25<216:28:25,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▋         | 12714/203307 [14:26:25<216:28:25,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▋         | 12715/203307 [14:26:29<216:28:15,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▋         | 12715/203307 [14:26:29<216:28:15,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▋         | 12716/203307 [14:26:32<216:28:05,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▋         | 12716/203307 [14:26:32<216:28:05,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▋         | 12717/203307 [14:26:36<216:27:55,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▋         | 12717/203307 [14:26:36<216:27:55,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▋         | 12718/203307 [14:26:40<216:27:47,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▋         | 12718/203307 [14:26:40<216:27:47,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▋         | 12719/203307 [14:26:45<216:27:49,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▋         | 12719/203307 [14:26:45<216:27:49,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▋         | 12720/203307 [14:26:49<216:27:50,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▋         | 12720/203307 [14:26:49<216:27:50,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▋         | 12721/203307 [14:26:53<216:27:48,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   6%|▋         | 12721/203307 [14:26:53<216:27:48,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12722/203307 [14:26:58<216:27:48,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12722/203307 [14:26:58<216:27:48,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12723/203307 [14:27:01<216:27:38,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12723/203307 [14:27:01<216:27:38,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12724/203307 [14:27:05<216:27:28,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12724/203307 [14:27:05<216:27:28,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12725/203307 [14:27:09<216:27:18,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12725/203307 [14:27:09<216:27:18,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12726/203307 [14:27:12<216:27:07,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12726/203307 [14:27:12<216:27:07,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12727/203307 [14:27:17<216:27:07,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12727/203307 [14:27:17<216:27:07,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12728/203307 [14:27:20<216:26:58,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12728/203307 [14:27:20<216:26:58,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12729/203307 [14:27:25<216:26:58,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12729/203307 [14:27:25<216:26:58,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12730/203307 [14:27:29<216:26:56,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12730/203307 [14:27:29<216:26:56,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12731/203307 [14:27:33<216:26:57,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12731/203307 [14:27:33<216:26:57,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12732/203307 [14:27:37<216:26:47,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12732/203307 [14:27:37<216:26:47,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12733/203307 [14:27:41<216:26:37,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12733/203307 [14:27:41<216:26:37,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12734/203307 [14:27:44<216:26:27,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12734/203307 [14:27:44<216:26:28,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12735/203307 [14:27:48<216:26:18,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12735/203307 [14:27:48<216:26:18,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12736/203307 [14:27:53<216:26:17,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12736/203307 [14:27:53<216:26:18,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12737/203307 [14:27:56<216:26:08,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12737/203307 [14:27:56<216:26:08,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12738/203307 [14:28:01<216:26:07,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12738/203307 [14:28:01<216:26:07,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12739/203307 [14:28:05<216:26:08,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12739/203307 [14:28:05<216:26:08,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12740/203307 [14:28:09<216:25:58,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12740/203307 [14:28:09<216:25:58,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12741/203307 [14:28:12<216:25:48,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   6%|▋         | 12741/203307 [14:28:12<216:25:48,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12742/203307 [14:28:16<216:25:37,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12742/203307 [14:28:16<216:25:38,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12743/203307 [14:28:20<216:25:27,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12743/203307 [14:28:20<216:25:28,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12744/203307 [14:28:24<216:25:26,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12744/203307 [14:28:24<216:25:26,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12745/203307 [14:28:28<216:25:16,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12745/203307 [14:28:28<216:25:16,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12746/203307 [14:28:32<216:25:16,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12746/203307 [14:28:32<216:25:16,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12747/203307 [14:28:36<216:25:06,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12747/203307 [14:28:36<216:25:06,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12748/203307 [14:28:40<216:25:06,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12748/203307 [14:28:40<216:25:06,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12749/203307 [14:28:44<216:24:56,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12749/203307 [14:28:44<216:24:56,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12750/203307 [14:28:47<216:24:45,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12750/203307 [14:28:47<216:24:46,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12751/203307 [14:28:51<216:24:35,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12751/203307 [14:28:51<216:24:35,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12752/203307 [14:28:55<216:24:35,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12752/203307 [14:28:55<216:24:35,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12753/203307 [14:28:59<216:24:25,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12753/203307 [14:28:59<216:24:25,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12754/203307 [14:29:03<216:24:14,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12754/203307 [14:29:03<216:24:14,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12755/203307 [14:29:07<216:24:16,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12755/203307 [14:29:07<216:24:16,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12756/203307 [14:29:11<216:24:06,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12756/203307 [14:29:11<216:24:06,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12757/203307 [14:29:15<216:24:07,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12757/203307 [14:29:15<216:24:07,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12758/203307 [14:29:19<216:23:57,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12758/203307 [14:29:19<216:23:57,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12759/203307 [14:29:23<216:23:48,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12759/203307 [14:29:23<216:23:48,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12760/203307 [14:29:27<216:23:39,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12760/203307 [14:29:27<216:23:39,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12761/203307 [14:29:31<216:23:40,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   6%|▋         | 12761/203307 [14:29:31<216:23:40,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12762/203307 [14:29:35<216:23:31,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12762/203307 [14:29:35<216:23:31,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12763/203307 [14:29:39<216:23:22,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12763/203307 [14:29:39<216:23:22,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12764/203307 [14:29:43<216:23:25,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12764/203307 [14:29:43<216:23:25,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12765/203307 [14:29:47<216:23:25,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12765/203307 [14:29:47<216:23:25,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12766/203307 [14:29:52<216:23:24,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12766/203307 [14:29:52<216:23:24,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12767/203307 [14:29:56<216:23:16,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12767/203307 [14:29:56<216:23:16,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12768/203307 [14:29:59<216:23:05,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12768/203307 [14:29:59<216:23:05,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12769/203307 [14:30:04<216:23:06,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12769/203307 [14:30:04<216:23:06,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12770/203307 [14:30:07<216:22:58,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12770/203307 [14:30:07<216:22:58,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12771/203307 [14:30:11<216:22:49,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12771/203307 [14:30:11<216:22:49,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12772/203307 [14:30:16<216:22:50,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12772/203307 [14:30:16<216:22:50,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12773/203307 [14:30:19<216:22:40,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12773/203307 [14:30:19<216:22:40,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12774/203307 [14:30:24<216:22:40,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12774/203307 [14:30:24<216:22:40,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12775/203307 [14:30:28<216:22:39,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12775/203307 [14:30:28<216:22:39,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12776/203307 [14:30:32<216:22:29,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12776/203307 [14:30:32<216:22:29,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12777/203307 [14:30:36<216:22:29,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12777/203307 [14:30:36<216:22:29,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12778/203307 [14:30:40<216:22:18,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12778/203307 [14:30:40<216:22:18,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12779/203307 [14:30:43<216:22:08,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12779/203307 [14:30:43<216:22:08,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12780/203307 [14:30:47<216:21:58,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12780/203307 [14:30:47<216:21:58,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12781/203307 [14:30:52<216:21:59,  0.24it/s, v_num=t5e6, training/loss=0.0983]Epoch 0:   6%|▋         | 12781/203307 [14:30:52<216:21:59,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12782/203307 [14:30:55<216:21:48,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12782/203307 [14:30:55<216:21:48,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12783/203307 [14:31:00<216:21:48,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12783/203307 [14:31:00<216:21:48,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12784/203307 [14:31:04<216:21:45,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12784/203307 [14:31:04<216:21:45,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12785/203307 [14:31:07<216:21:35,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12785/203307 [14:31:07<216:21:35,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12786/203307 [14:31:12<216:21:33,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12786/203307 [14:31:12<216:21:33,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12787/203307 [14:31:15<216:21:23,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12787/203307 [14:31:15<216:21:23,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12788/203307 [14:31:19<216:21:13,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12788/203307 [14:31:19<216:21:13,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12789/203307 [14:31:23<216:21:04,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12789/203307 [14:31:23<216:21:04,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12790/203307 [14:31:27<216:21:07,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12790/203307 [14:31:27<216:21:07,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12791/203307 [14:31:32<216:21:07,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12791/203307 [14:31:32<216:21:07,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12792/203307 [14:31:35<216:20:58,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12792/203307 [14:31:35<216:20:58,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12793/203307 [14:31:40<216:20:56,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12793/203307 [14:31:40<216:20:57,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12794/203307 [14:31:44<216:20:55,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12794/203307 [14:31:44<216:20:56,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12795/203307 [14:31:48<216:20:46,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12795/203307 [14:31:48<216:20:46,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12796/203307 [14:31:51<216:20:35,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12796/203307 [14:31:51<216:20:35,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12797/203307 [14:31:55<216:20:25,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12797/203307 [14:31:55<216:20:26,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12798/203307 [14:31:59<216:20:27,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12798/203307 [14:31:59<216:20:27,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12799/203307 [14:32:03<216:20:18,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12799/203307 [14:32:03<216:20:18,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12800/203307 [14:32:08<216:20:17,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12800/203307 [14:32:08<216:20:18,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12801/203307 [14:32:11<216:20:07,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   6%|▋         | 12801/203307 [14:32:11<216:20:08,  0.24it/s, v_num=t5e6, training/loss=0.084] Epoch 0:   6%|▋         | 12802/203307 [14:32:16<216:20:07,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12802/203307 [14:32:16<216:20:07,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12803/203307 [14:32:19<216:19:58,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12803/203307 [14:32:19<216:19:58,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12804/203307 [14:32:23<216:19:47,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12804/203307 [14:32:23<216:19:47,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12805/203307 [14:32:27<216:19:38,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12805/203307 [14:32:27<216:19:38,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12806/203307 [14:32:31<216:19:29,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12806/203307 [14:32:31<216:19:30,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12807/203307 [14:32:35<216:19:31,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12807/203307 [14:32:35<216:19:31,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12808/203307 [14:32:39<216:19:21,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12808/203307 [14:32:39<216:19:21,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12809/203307 [14:32:43<216:19:22,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12809/203307 [14:32:43<216:19:22,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12810/203307 [14:32:47<216:19:11,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12810/203307 [14:32:47<216:19:11,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12811/203307 [14:32:51<216:19:10,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12811/203307 [14:32:51<216:19:10,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12812/203307 [14:32:55<216:19:01,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12812/203307 [14:32:55<216:19:01,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12813/203307 [14:32:58<216:18:51,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12813/203307 [14:32:59<216:18:51,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12814/203307 [14:33:02<216:18:41,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12814/203307 [14:33:02<216:18:41,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12815/203307 [14:33:06<216:18:32,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12815/203307 [14:33:06<216:18:32,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12816/203307 [14:33:10<216:18:33,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12816/203307 [14:33:10<216:18:33,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12817/203307 [14:33:15<216:18:32,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12817/203307 [14:33:15<216:18:32,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12818/203307 [14:33:18<216:18:23,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12818/203307 [14:33:18<216:18:23,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12819/203307 [14:33:23<216:18:23,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12819/203307 [14:33:23<216:18:23,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12820/203307 [14:33:27<216:18:22,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12820/203307 [14:33:27<216:18:22,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12821/203307 [14:33:31<216:18:12,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   6%|▋         | 12821/203307 [14:33:31<216:18:12,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12822/203307 [14:33:34<216:18:02,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12822/203307 [14:33:34<216:18:02,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12823/203307 [14:33:38<216:17:52,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12823/203307 [14:33:38<216:17:52,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12824/203307 [14:33:43<216:17:53,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12824/203307 [14:33:43<216:17:53,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12825/203307 [14:33:46<216:17:44,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12825/203307 [14:33:46<216:17:44,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12826/203307 [14:33:51<216:17:44,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12826/203307 [14:33:51<216:17:44,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12827/203307 [14:33:55<216:17:42,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12827/203307 [14:33:55<216:17:42,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12828/203307 [14:33:59<216:17:32,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12828/203307 [14:33:59<216:17:32,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12829/203307 [14:34:03<216:17:31,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12829/203307 [14:34:03<216:17:31,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12830/203307 [14:34:07<216:17:20,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12830/203307 [14:34:07<216:17:20,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12831/203307 [14:34:10<216:17:11,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12831/203307 [14:34:10<216:17:11,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12832/203307 [14:34:14<216:17:03,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12832/203307 [14:34:14<216:17:03,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12833/203307 [14:34:19<216:17:05,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12833/203307 [14:34:19<216:17:05,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12834/203307 [14:34:22<216:16:54,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12834/203307 [14:34:22<216:16:54,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12835/203307 [14:34:27<216:16:55,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12835/203307 [14:34:27<216:16:55,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12836/203307 [14:34:31<216:16:53,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12836/203307 [14:34:31<216:16:53,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12837/203307 [14:34:35<216:16:44,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12837/203307 [14:34:35<216:16:44,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12838/203307 [14:34:39<216:16:41,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12838/203307 [14:34:39<216:16:41,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12839/203307 [14:34:43<216:16:32,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12839/203307 [14:34:43<216:16:32,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12840/203307 [14:34:46<216:16:21,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12840/203307 [14:34:46<216:16:21,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12841/203307 [14:34:50<216:16:11,  0.24it/s, v_num=t5e6, training/loss=0.0786]Epoch 0:   6%|▋         | 12841/203307 [14:34:50<216:16:11,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12842/203307 [14:34:54<216:16:12,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12842/203307 [14:34:54<216:16:12,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12843/203307 [14:34:59<216:16:11,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12843/203307 [14:34:59<216:16:11,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12844/203307 [14:35:03<216:16:10,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12844/203307 [14:35:03<216:16:10,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12845/203307 [14:35:07<216:16:00,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12845/203307 [14:35:07<216:16:00,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12846/203307 [14:35:10<216:15:50,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12846/203307 [14:35:10<216:15:50,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12847/203307 [14:35:15<216:15:48,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12847/203307 [14:35:15<216:15:48,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12848/203307 [14:35:18<216:15:38,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12848/203307 [14:35:18<216:15:38,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12849/203307 [14:35:22<216:15:28,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12849/203307 [14:35:22<216:15:28,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12850/203307 [14:35:26<216:15:28,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12850/203307 [14:35:26<216:15:29,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12851/203307 [14:35:30<216:15:20,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12851/203307 [14:35:30<216:15:20,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12852/203307 [14:35:34<216:15:20,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12852/203307 [14:35:34<216:15:20,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12853/203307 [14:35:38<216:15:11,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12853/203307 [14:35:38<216:15:11,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12854/203307 [14:35:42<216:15:02,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12854/203307 [14:35:42<216:15:02,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12855/203307 [14:35:46<216:14:53,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12855/203307 [14:35:46<216:14:53,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12856/203307 [14:35:50<216:14:51,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12856/203307 [14:35:50<216:14:51,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12857/203307 [14:35:54<216:14:41,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12857/203307 [14:35:54<216:14:42,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12858/203307 [14:35:57<216:14:32,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12858/203307 [14:35:57<216:14:33,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12859/203307 [14:36:02<216:14:34,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12859/203307 [14:36:02<216:14:34,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12860/203307 [14:36:06<216:14:24,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12860/203307 [14:36:06<216:14:24,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12861/203307 [14:36:10<216:14:24,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   6%|▋         | 12861/203307 [14:36:10<216:14:24,  0.24it/s, v_num=t5e6, training/loss=0.081] Epoch 0:   6%|▋         | 12862/203307 [14:36:14<216:14:15,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12862/203307 [14:36:14<216:14:15,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12863/203307 [14:36:17<216:14:06,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12863/203307 [14:36:17<216:14:06,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12864/203307 [14:36:21<216:13:57,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12864/203307 [14:36:21<216:13:57,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12865/203307 [14:36:26<216:13:57,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12865/203307 [14:36:26<216:13:57,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12866/203307 [14:36:29<216:13:47,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12866/203307 [14:36:29<216:13:47,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12867/203307 [14:36:34<216:13:45,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12867/203307 [14:36:34<216:13:46,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12868/203307 [14:36:38<216:13:46,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12868/203307 [14:36:38<216:13:46,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12869/203307 [14:36:42<216:13:47,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12869/203307 [14:36:42<216:13:47,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12870/203307 [14:36:46<216:13:37,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12870/203307 [14:36:46<216:13:37,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12871/203307 [14:36:50<216:13:27,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12871/203307 [14:36:50<216:13:27,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12872/203307 [14:36:53<216:13:17,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12872/203307 [14:36:53<216:13:17,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12873/203307 [14:36:57<216:13:08,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12873/203307 [14:36:57<216:13:08,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12874/203307 [14:37:01<216:13:06,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12874/203307 [14:37:01<216:13:06,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12875/203307 [14:37:06<216:13:04,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12875/203307 [14:37:06<216:13:04,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12876/203307 [14:37:10<216:13:05,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12876/203307 [14:37:10<216:13:05,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12877/203307 [14:37:14<216:13:05,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12877/203307 [14:37:14<216:13:05,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12878/203307 [14:37:19<216:13:06,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12878/203307 [14:37:19<216:13:06,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12879/203307 [14:37:23<216:12:57,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12879/203307 [14:37:23<216:12:57,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12880/203307 [14:37:26<216:12:48,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12880/203307 [14:37:26<216:12:48,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12881/203307 [14:37:30<216:12:38,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:   6%|▋         | 12881/203307 [14:37:30<216:12:38,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12882/203307 [14:37:34<216:12:28,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12882/203307 [14:37:34<216:12:28,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12883/203307 [14:37:38<216:12:25,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12883/203307 [14:37:38<216:12:25,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12884/203307 [14:37:42<216:12:23,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12884/203307 [14:37:42<216:12:24,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12885/203307 [14:37:47<216:12:24,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12885/203307 [14:37:47<216:12:24,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12886/203307 [14:37:51<216:12:23,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12886/203307 [14:37:51<216:12:23,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12887/203307 [14:37:55<216:12:23,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12887/203307 [14:37:55<216:12:23,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12888/203307 [14:37:59<216:12:12,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12888/203307 [14:37:59<216:12:13,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12889/203307 [14:38:03<216:12:03,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12889/203307 [14:38:03<216:12:03,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12890/203307 [14:38:06<216:11:54,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12890/203307 [14:38:06<216:11:54,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12891/203307 [14:38:10<216:11:45,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12891/203307 [14:38:10<216:11:45,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12892/203307 [14:38:14<216:11:43,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12892/203307 [14:38:14<216:11:43,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12893/203307 [14:38:18<216:11:35,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12893/203307 [14:38:18<216:11:35,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12894/203307 [14:38:23<216:11:36,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12894/203307 [14:38:23<216:11:36,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12895/203307 [14:38:27<216:11:36,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12895/203307 [14:38:27<216:11:36,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12896/203307 [14:38:31<216:11:27,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12896/203307 [14:38:31<216:11:27,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12897/203307 [14:38:34<216:11:18,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12897/203307 [14:38:34<216:11:18,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12898/203307 [14:38:38<216:11:08,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12898/203307 [14:38:38<216:11:08,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12899/203307 [14:38:42<216:10:57,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12899/203307 [14:38:42<216:10:57,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12900/203307 [14:38:46<216:10:55,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12900/203307 [14:38:46<216:10:55,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12901/203307 [14:38:50<216:10:54,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   6%|▋         | 12901/203307 [14:38:50<216:10:54,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12902/203307 [14:38:55<216:10:53,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12902/203307 [14:38:55<216:10:53,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12903/203307 [14:38:58<216:10:43,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12903/203307 [14:38:58<216:10:43,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12904/203307 [14:39:03<216:10:44,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12904/203307 [14:39:03<216:10:44,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12905/203307 [14:39:06<216:10:34,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12905/203307 [14:39:06<216:10:34,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12906/203307 [14:39:10<216:10:23,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12906/203307 [14:39:10<216:10:23,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12907/203307 [14:39:14<216:10:13,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12907/203307 [14:39:14<216:10:13,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12908/203307 [14:39:17<216:10:03,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12908/203307 [14:39:17<216:10:03,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12909/203307 [14:39:22<216:10:02,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12909/203307 [14:39:22<216:10:02,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12910/203307 [14:39:26<216:10:01,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12910/203307 [14:39:26<216:10:01,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12911/203307 [14:39:30<216:10:01,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12911/203307 [14:39:30<216:10:02,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12912/203307 [14:39:34<216:09:52,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12912/203307 [14:39:34<216:09:52,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12913/203307 [14:39:38<216:09:52,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12913/203307 [14:39:39<216:09:52,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12914/203307 [14:39:42<216:09:43,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12914/203307 [14:39:42<216:09:43,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12915/203307 [14:39:46<216:09:32,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12915/203307 [14:39:46<216:09:32,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12916/203307 [14:39:50<216:09:23,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12916/203307 [14:39:50<216:09:23,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12917/203307 [14:39:54<216:09:22,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12917/203307 [14:39:54<216:09:22,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12918/203307 [14:39:58<216:09:13,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12918/203307 [14:39:58<216:09:13,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12919/203307 [14:40:02<216:09:13,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12919/203307 [14:40:02<216:09:13,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12920/203307 [14:40:06<216:09:13,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12920/203307 [14:40:06<216:09:13,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12921/203307 [14:40:11<216:09:12,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:   6%|▋         | 12921/203307 [14:40:11<216:09:12,  0.24it/s, v_num=t5e6, training/loss=0.079] Epoch 0:   6%|▋         | 12922/203307 [14:40:14<216:09:02,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12922/203307 [14:40:14<216:09:02,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12923/203307 [14:40:18<216:08:53,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12923/203307 [14:40:18<216:08:53,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12924/203307 [14:40:22<216:08:43,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12924/203307 [14:40:22<216:08:43,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12925/203307 [14:40:26<216:08:44,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12925/203307 [14:40:26<216:08:44,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12926/203307 [14:40:30<216:08:34,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12926/203307 [14:40:30<216:08:34,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12927/203307 [14:40:34<216:08:34,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12927/203307 [14:40:34<216:08:34,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12928/203307 [14:40:39<216:08:35,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12928/203307 [14:40:39<216:08:35,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12929/203307 [14:40:43<216:08:27,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12929/203307 [14:40:43<216:08:27,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12930/203307 [14:40:47<216:08:28,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12930/203307 [14:40:47<216:08:28,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12931/203307 [14:40:51<216:08:20,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12931/203307 [14:40:51<216:08:20,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12932/203307 [14:40:55<216:08:10,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12932/203307 [14:40:55<216:08:10,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12933/203307 [14:40:58<216:08:01,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12933/203307 [14:40:58<216:08:01,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12934/203307 [14:41:02<216:07:59,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12934/203307 [14:41:02<216:07:59,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12935/203307 [14:41:06<216:07:49,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12935/203307 [14:41:06<216:07:49,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12936/203307 [14:41:11<216:07:50,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12936/203307 [14:41:11<216:07:50,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12937/203307 [14:41:15<216:07:52,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12937/203307 [14:41:15<216:07:52,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12938/203307 [14:41:19<216:07:43,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12938/203307 [14:41:19<216:07:43,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12939/203307 [14:41:23<216:07:45,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12939/203307 [14:41:23<216:07:45,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12940/203307 [14:41:27<216:07:36,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12940/203307 [14:41:27<216:07:36,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12941/203307 [14:41:31<216:07:25,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:   6%|▋         | 12941/203307 [14:41:31<216:07:25,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12942/203307 [14:41:35<216:07:25,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12942/203307 [14:41:35<216:07:25,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12943/203307 [14:41:39<216:07:17,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12943/203307 [14:41:39<216:07:17,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12944/203307 [14:41:43<216:07:16,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12944/203307 [14:41:43<216:07:16,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12945/203307 [14:41:47<216:07:07,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12945/203307 [14:41:47<216:07:07,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12946/203307 [14:41:52<216:07:10,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12946/203307 [14:41:52<216:07:10,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12947/203307 [14:41:56<216:07:09,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12947/203307 [14:41:56<216:07:09,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12948/203307 [14:42:00<216:07:00,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12948/203307 [14:42:00<216:07:00,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12949/203307 [14:42:03<216:06:50,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12949/203307 [14:42:03<216:06:51,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12950/203307 [14:42:08<216:06:50,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12950/203307 [14:42:08<216:06:50,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12951/203307 [14:42:11<216:06:41,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12951/203307 [14:42:11<216:06:41,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12952/203307 [14:42:16<216:06:40,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12952/203307 [14:42:16<216:06:40,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12953/203307 [14:42:19<216:06:31,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12953/203307 [14:42:19<216:06:31,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12954/203307 [14:42:24<216:06:31,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12954/203307 [14:42:24<216:06:31,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12955/203307 [14:42:28<216:06:30,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12955/203307 [14:42:28<216:06:30,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12956/203307 [14:42:32<216:06:30,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12956/203307 [14:42:32<216:06:30,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12957/203307 [14:42:36<216:06:19,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12957/203307 [14:42:36<216:06:19,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12958/203307 [14:42:40<216:06:10,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12958/203307 [14:42:40<216:06:10,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12959/203307 [14:42:44<216:06:10,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12959/203307 [14:42:44<216:06:10,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12960/203307 [14:42:48<216:06:00,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12960/203307 [14:42:48<216:06:00,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12961/203307 [14:42:52<216:05:59,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:   6%|▋         | 12961/203307 [14:42:52<216:05:59,  0.24it/s, v_num=t5e6, training/loss=0.100] Epoch 0:   6%|▋         | 12962/203307 [14:42:56<216:05:50,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12962/203307 [14:42:56<216:05:51,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12963/203307 [14:43:00<216:05:52,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12963/203307 [14:43:00<216:05:52,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12964/203307 [14:43:05<216:05:49,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12964/203307 [14:43:05<216:05:49,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12965/203307 [14:43:09<216:05:50,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12965/203307 [14:43:09<216:05:50,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12966/203307 [14:43:13<216:05:40,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12966/203307 [14:43:13<216:05:40,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12967/203307 [14:43:17<216:05:38,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12967/203307 [14:43:17<216:05:38,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12968/203307 [14:43:21<216:05:29,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12968/203307 [14:43:21<216:05:29,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12969/203307 [14:43:25<216:05:29,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12969/203307 [14:43:25<216:05:29,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12970/203307 [14:43:29<216:05:20,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12970/203307 [14:43:29<216:05:20,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12971/203307 [14:43:32<216:05:10,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12971/203307 [14:43:32<216:05:10,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12972/203307 [14:43:37<216:05:12,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12972/203307 [14:43:37<216:05:12,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12973/203307 [14:43:41<216:05:11,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12973/203307 [14:43:41<216:05:12,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12974/203307 [14:43:45<216:05:02,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12974/203307 [14:43:45<216:05:02,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12975/203307 [14:43:49<216:05:01,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12975/203307 [14:43:49<216:05:01,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12976/203307 [14:43:53<216:04:51,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12976/203307 [14:43:53<216:04:51,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12977/203307 [14:43:57<216:04:49,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12977/203307 [14:43:57<216:04:49,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12978/203307 [14:44:01<216:04:40,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12978/203307 [14:44:01<216:04:40,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12979/203307 [14:44:05<216:04:30,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12979/203307 [14:44:05<216:04:30,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12980/203307 [14:44:09<216:04:31,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12980/203307 [14:44:09<216:04:31,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12981/203307 [14:44:13<216:04:22,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 12981/203307 [14:44:13<216:04:23,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12982/203307 [14:44:17<216:04:23,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12982/203307 [14:44:17<216:04:23,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12983/203307 [14:44:21<216:04:13,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12983/203307 [14:44:21<216:04:13,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12984/203307 [14:44:25<216:04:12,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12984/203307 [14:44:25<216:04:12,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12985/203307 [14:44:29<216:04:03,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12985/203307 [14:44:29<216:04:03,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12986/203307 [14:44:33<216:04:02,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12986/203307 [14:44:33<216:04:02,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12987/203307 [14:44:37<216:03:53,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12987/203307 [14:44:37<216:03:53,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12988/203307 [14:44:41<216:03:44,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12988/203307 [14:44:41<216:03:44,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12989/203307 [14:44:45<216:03:46,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12989/203307 [14:44:45<216:03:46,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12990/203307 [14:44:49<216:03:37,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12990/203307 [14:44:49<216:03:37,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12991/203307 [14:44:53<216:03:36,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12991/203307 [14:44:53<216:03:36,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12992/203307 [14:44:58<216:03:34,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12992/203307 [14:44:58<216:03:34,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12993/203307 [14:45:01<216:03:24,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12993/203307 [14:45:01<216:03:24,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12994/203307 [14:45:06<216:03:23,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12994/203307 [14:45:06<216:03:23,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12995/203307 [14:45:09<216:03:13,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12995/203307 [14:45:09<216:03:13,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12996/203307 [14:45:13<216:03:02,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12996/203307 [14:45:13<216:03:03,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12997/203307 [14:45:17<216:02:53,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12997/203307 [14:45:17<216:02:53,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12998/203307 [14:45:21<216:02:55,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12998/203307 [14:45:21<216:02:55,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12999/203307 [14:45:26<216:02:55,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 12999/203307 [14:45:26<216:02:55,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 13000/203307 [14:45:30<216:02:55,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 13000/203307 [14:45:30<216:02:55,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 13001/203307 [14:45:34<216:02:46,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   6%|▋         | 13001/203307 [14:45:34<216:02:46,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13002/203307 [14:45:38<216:02:46,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13002/203307 [14:45:38<216:02:46,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13003/203307 [14:45:42<216:02:36,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13003/203307 [14:45:42<216:02:37,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13004/203307 [14:45:45<216:02:27,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13004/203307 [14:45:45<216:02:27,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13005/203307 [14:45:49<216:02:18,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13005/203307 [14:45:49<216:02:18,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13006/203307 [14:45:54<216:02:20,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13006/203307 [14:45:54<216:02:20,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13007/203307 [14:45:57<216:02:11,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13007/203307 [14:45:57<216:02:11,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13008/203307 [14:46:02<216:02:11,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13008/203307 [14:46:02<216:02:11,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13009/203307 [14:46:06<216:02:10,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13009/203307 [14:46:06<216:02:10,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13010/203307 [14:46:10<216:02:01,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13010/203307 [14:46:10<216:02:01,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13011/203307 [14:46:14<216:02:00,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13011/203307 [14:46:14<216:02:00,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13012/203307 [14:46:18<216:01:52,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13012/203307 [14:46:18<216:01:52,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13013/203307 [14:46:22<216:01:44,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13013/203307 [14:46:22<216:01:44,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13014/203307 [14:46:26<216:01:35,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13014/203307 [14:46:26<216:01:35,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13015/203307 [14:46:30<216:01:36,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13015/203307 [14:46:30<216:01:36,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13016/203307 [14:46:34<216:01:25,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13016/203307 [14:46:34<216:01:25,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13017/203307 [14:46:38<216:01:26,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13017/203307 [14:46:38<216:01:26,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13018/203307 [14:46:42<216:01:23,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13018/203307 [14:46:42<216:01:24,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13019/203307 [14:46:47<216:01:23,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13019/203307 [14:46:47<216:01:23,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13020/203307 [14:46:50<216:01:14,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13020/203307 [14:46:50<216:01:14,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13021/203307 [14:46:54<216:01:07,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   6%|▋         | 13021/203307 [14:46:54<216:01:08,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13022/203307 [14:46:58<216:00:58,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13022/203307 [14:46:58<216:00:58,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13023/203307 [14:47:02<216:00:48,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13023/203307 [14:47:02<216:00:48,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13024/203307 [14:47:06<216:00:49,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13024/203307 [14:47:06<216:00:49,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13025/203307 [14:47:10<216:00:50,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13025/203307 [14:47:10<216:00:50,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13026/203307 [14:47:14<216:00:39,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13026/203307 [14:47:14<216:00:39,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13027/203307 [14:47:18<216:00:38,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13027/203307 [14:47:18<216:00:38,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13028/203307 [14:47:22<216:00:28,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13028/203307 [14:47:22<216:00:29,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13029/203307 [14:47:26<216:00:18,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13029/203307 [14:47:26<216:00:18,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13030/203307 [14:47:29<216:00:09,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13030/203307 [14:47:29<216:00:09,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13031/203307 [14:47:33<215:59:59,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13031/203307 [14:47:33<215:59:59,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13032/203307 [14:47:38<216:00:01,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13032/203307 [14:47:38<216:00:01,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13033/203307 [14:47:41<215:59:51,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13033/203307 [14:47:41<215:59:51,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13034/203307 [14:47:46<215:59:52,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13034/203307 [14:47:46<215:59:52,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13035/203307 [14:47:49<215:59:42,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13035/203307 [14:47:49<215:59:42,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13036/203307 [14:47:54<215:59:43,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13036/203307 [14:47:54<215:59:43,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13037/203307 [14:47:58<215:59:33,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13037/203307 [14:47:58<215:59:33,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13038/203307 [14:48:01<215:59:23,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13038/203307 [14:48:01<215:59:23,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13039/203307 [14:48:05<215:59:14,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13039/203307 [14:48:05<215:59:14,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13040/203307 [14:48:09<215:59:05,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13040/203307 [14:48:09<215:59:05,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13041/203307 [14:48:13<215:59:06,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:   6%|▋         | 13041/203307 [14:48:13<215:59:06,  0.24it/s, v_num=t5e6, training/loss=0.087] Epoch 0:   6%|▋         | 13042/203307 [14:48:18<215:59:05,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13042/203307 [14:48:18<215:59:05,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13043/203307 [14:48:22<215:59:05,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13043/203307 [14:48:22<215:59:05,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13044/203307 [14:48:26<215:59:04,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13044/203307 [14:48:26<215:59:04,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13045/203307 [14:48:30<215:59:02,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13045/203307 [14:48:30<215:59:02,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13046/203307 [14:48:34<215:58:53,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13046/203307 [14:48:34<215:58:53,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13047/203307 [14:48:38<215:58:44,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13047/203307 [14:48:38<215:58:44,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13048/203307 [14:48:42<215:58:35,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13048/203307 [14:48:42<215:58:35,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13049/203307 [14:48:45<215:58:26,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13049/203307 [14:48:45<215:58:26,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13050/203307 [14:48:50<215:58:28,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13050/203307 [14:48:50<215:58:28,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13051/203307 [14:48:54<215:58:28,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13051/203307 [14:48:54<215:58:28,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13052/203307 [14:48:59<215:58:27,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13052/203307 [14:48:59<215:58:28,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13053/203307 [14:49:02<215:58:19,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13053/203307 [14:49:02<215:58:19,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13054/203307 [14:49:07<215:58:17,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13054/203307 [14:49:07<215:58:17,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13055/203307 [14:49:10<215:58:09,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13055/203307 [14:49:10<215:58:09,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13056/203307 [14:49:14<215:57:59,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13056/203307 [14:49:14<215:57:59,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13057/203307 [14:49:18<215:57:50,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13057/203307 [14:49:18<215:57:50,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13058/203307 [14:49:22<215:57:50,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13058/203307 [14:49:22<215:57:50,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13059/203307 [14:49:27<215:57:49,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13059/203307 [14:49:27<215:57:49,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13060/203307 [14:49:31<215:57:48,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13060/203307 [14:49:31<215:57:49,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13061/203307 [14:49:35<215:57:47,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   6%|▋         | 13061/203307 [14:49:35<215:57:47,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13062/203307 [14:49:39<215:57:37,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13062/203307 [14:49:39<215:57:37,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13063/203307 [14:49:43<215:57:35,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13063/203307 [14:49:43<215:57:35,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13064/203307 [14:49:47<215:57:24,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13064/203307 [14:49:47<215:57:24,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13065/203307 [14:49:50<215:57:14,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13065/203307 [14:49:50<215:57:14,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13066/203307 [14:49:54<215:57:04,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13066/203307 [14:49:54<215:57:05,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13067/203307 [14:49:59<215:57:06,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13067/203307 [14:49:59<215:57:06,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13068/203307 [14:50:02<215:56:56,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13068/203307 [14:50:02<215:56:56,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13069/203307 [14:50:07<215:56:57,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13069/203307 [14:50:07<215:56:57,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13070/203307 [14:50:10<215:56:48,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13070/203307 [14:50:10<215:56:48,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13071/203307 [14:50:14<215:56:38,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13071/203307 [14:50:14<215:56:38,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13072/203307 [14:50:18<215:56:35,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13072/203307 [14:50:18<215:56:36,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13073/203307 [14:50:22<215:56:28,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13073/203307 [14:50:22<215:56:28,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13074/203307 [14:50:26<215:56:18,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13074/203307 [14:50:26<215:56:18,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13075/203307 [14:50:30<215:56:16,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13075/203307 [14:50:30<215:56:16,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13076/203307 [14:50:34<215:56:16,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13076/203307 [14:50:34<215:56:17,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13077/203307 [14:50:39<215:56:17,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13077/203307 [14:50:39<215:56:17,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13078/203307 [14:50:43<215:56:07,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13078/203307 [14:50:43<215:56:07,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13079/203307 [14:50:46<215:55:59,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13079/203307 [14:50:46<215:55:59,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13080/203307 [14:50:50<215:55:49,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13080/203307 [14:50:50<215:55:49,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13081/203307 [14:50:54<215:55:48,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   6%|▋         | 13081/203307 [14:50:54<215:55:48,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13082/203307 [14:50:58<215:55:38,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13082/203307 [14:50:58<215:55:38,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13083/203307 [14:51:02<215:55:30,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13083/203307 [14:51:02<215:55:30,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13084/203307 [14:51:06<215:55:32,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13084/203307 [14:51:06<215:55:32,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13085/203307 [14:51:10<215:55:23,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13085/203307 [14:51:10<215:55:23,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13086/203307 [14:51:14<215:55:24,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13086/203307 [14:51:14<215:55:24,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13087/203307 [14:51:18<215:55:15,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13087/203307 [14:51:18<215:55:15,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13088/203307 [14:51:22<215:55:06,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13088/203307 [14:51:22<215:55:06,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13089/203307 [14:51:26<215:54:55,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13089/203307 [14:51:26<215:54:55,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13090/203307 [14:51:30<215:54:53,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13090/203307 [14:51:30<215:54:53,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13091/203307 [14:51:34<215:54:43,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13091/203307 [14:51:34<215:54:43,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13092/203307 [14:51:38<215:54:42,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13092/203307 [14:51:38<215:54:42,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13093/203307 [14:51:42<215:54:41,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13093/203307 [14:51:42<215:54:41,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13094/203307 [14:51:46<215:54:39,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13094/203307 [14:51:46<215:54:39,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13095/203307 [14:51:51<215:54:40,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13095/203307 [14:51:51<215:54:40,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13096/203307 [14:51:54<215:54:30,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13096/203307 [14:51:54<215:54:30,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13097/203307 [14:51:58<215:54:20,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13097/203307 [14:51:58<215:54:20,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13098/203307 [14:52:02<215:54:11,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13098/203307 [14:52:02<215:54:11,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13099/203307 [14:52:06<215:54:09,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13099/203307 [14:52:06<215:54:09,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13100/203307 [14:52:10<215:54:07,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13100/203307 [14:52:10<215:54:07,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13101/203307 [14:52:14<215:53:57,  0.24it/s, v_num=t5e6, training/loss=0.0981]Epoch 0:   6%|▋         | 13101/203307 [14:52:14<215:53:57,  0.24it/s, v_num=t5e6, training/loss=0.086] Epoch 0:   6%|▋         | 13102/203307 [14:52:19<215:53:59,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13102/203307 [14:52:19<215:53:59,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13103/203307 [14:52:23<215:54:00,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13103/203307 [14:52:23<215:54:00,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13104/203307 [14:52:27<215:53:50,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13104/203307 [14:52:27<215:53:50,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13105/203307 [14:52:31<215:53:44,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13105/203307 [14:52:31<215:53:44,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13106/203307 [14:52:34<215:53:35,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13106/203307 [14:52:34<215:53:35,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13107/203307 [14:52:38<215:53:25,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13107/203307 [14:52:38<215:53:26,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13108/203307 [14:52:42<215:53:23,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13108/203307 [14:52:42<215:53:23,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13109/203307 [14:52:47<215:53:22,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13109/203307 [14:52:47<215:53:22,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13110/203307 [14:52:51<215:53:21,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13110/203307 [14:52:51<215:53:21,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13111/203307 [14:52:55<215:53:21,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13111/203307 [14:52:55<215:53:21,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13112/203307 [14:53:00<215:53:22,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13112/203307 [14:53:00<215:53:22,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13113/203307 [14:53:03<215:53:13,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13113/203307 [14:53:03<215:53:13,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13114/203307 [14:53:07<215:53:03,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13114/203307 [14:53:07<215:53:03,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13115/203307 [14:53:11<215:52:53,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13115/203307 [14:53:11<215:52:53,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13116/203307 [14:53:14<215:52:43,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13116/203307 [14:53:14<215:52:43,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13117/203307 [14:53:19<215:52:40,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13117/203307 [14:53:19<215:52:40,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13118/203307 [14:53:22<215:52:32,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13118/203307 [14:53:22<215:52:32,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13119/203307 [14:53:27<215:52:31,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13119/203307 [14:53:27<215:52:32,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13120/203307 [14:53:30<215:52:22,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13120/203307 [14:53:30<215:52:22,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13121/203307 [14:53:35<215:52:22,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   6%|▋         | 13121/203307 [14:53:35<215:52:22,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13122/203307 [14:53:39<215:52:13,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13122/203307 [14:53:39<215:52:13,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13123/203307 [14:53:42<215:52:04,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13123/203307 [14:53:42<215:52:04,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13124/203307 [14:53:46<215:51:54,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13124/203307 [14:53:46<215:51:54,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13125/203307 [14:53:50<215:51:55,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13125/203307 [14:53:50<215:51:55,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13126/203307 [14:53:55<215:51:52,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13126/203307 [14:53:55<215:51:52,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13127/203307 [14:53:59<215:51:50,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13127/203307 [14:53:59<215:51:50,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13128/203307 [14:54:03<215:51:51,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13128/203307 [14:54:03<215:51:51,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13129/203307 [14:54:08<215:51:51,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13129/203307 [14:54:08<215:51:51,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13130/203307 [14:54:11<215:51:40,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13130/203307 [14:54:11<215:51:40,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13131/203307 [14:54:15<215:51:31,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13131/203307 [14:54:15<215:51:32,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13132/203307 [14:54:19<215:51:22,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13132/203307 [14:54:19<215:51:22,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13133/203307 [14:54:22<215:51:13,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13133/203307 [14:54:22<215:51:13,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13134/203307 [14:54:27<215:51:11,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13134/203307 [14:54:27<215:51:11,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13135/203307 [14:54:31<215:51:09,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13135/203307 [14:54:31<215:51:09,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13136/203307 [14:54:35<215:51:09,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13136/203307 [14:54:35<215:51:09,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13137/203307 [14:54:39<215:51:00,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13137/203307 [14:54:39<215:51:00,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13138/203307 [14:54:43<215:51:00,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13138/203307 [14:54:43<215:51:00,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13139/203307 [14:54:47<215:50:51,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13139/203307 [14:54:47<215:50:51,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13140/203307 [14:54:51<215:50:41,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13140/203307 [14:54:51<215:50:41,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13141/203307 [14:54:54<215:50:30,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   6%|▋         | 13141/203307 [14:54:55<215:50:31,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13142/203307 [14:54:59<215:50:30,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13142/203307 [14:54:59<215:50:30,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13143/203307 [14:55:03<215:50:20,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13143/203307 [14:55:03<215:50:20,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13144/203307 [14:55:07<215:50:20,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13144/203307 [14:55:07<215:50:20,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13145/203307 [14:55:11<215:50:20,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13145/203307 [14:55:11<215:50:20,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13146/203307 [14:55:15<215:50:11,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13146/203307 [14:55:15<215:50:11,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13147/203307 [14:55:19<215:50:12,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13147/203307 [14:55:19<215:50:12,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13148/203307 [14:55:23<215:50:02,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13148/203307 [14:55:23<215:50:02,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13149/203307 [14:55:27<215:49:53,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13149/203307 [14:55:27<215:49:53,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13150/203307 [14:55:31<215:49:51,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13150/203307 [14:55:31<215:49:52,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13151/203307 [14:55:35<215:49:43,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13151/203307 [14:55:35<215:49:43,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13152/203307 [14:55:39<215:49:43,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13152/203307 [14:55:39<215:49:43,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13153/203307 [14:55:43<215:49:39,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13153/203307 [14:55:43<215:49:39,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13154/203307 [14:55:48<215:49:39,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13154/203307 [14:55:48<215:49:39,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13155/203307 [14:55:52<215:49:39,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13155/203307 [14:55:52<215:49:39,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13156/203307 [14:55:56<215:49:30,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13156/203307 [14:55:56<215:49:30,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13157/203307 [14:56:00<215:49:20,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13157/203307 [14:56:00<215:49:20,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13158/203307 [14:56:03<215:49:11,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13158/203307 [14:56:03<215:49:11,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13159/203307 [14:56:08<215:49:10,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13159/203307 [14:56:08<215:49:10,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13160/203307 [14:56:11<215:49:00,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13160/203307 [14:56:11<215:49:00,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13161/203307 [14:56:16<215:48:59,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   6%|▋         | 13161/203307 [14:56:16<215:49:00,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13162/203307 [14:56:20<215:49:01,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13162/203307 [14:56:20<215:49:01,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13163/203307 [14:56:24<215:48:53,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13163/203307 [14:56:24<215:48:53,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13164/203307 [14:56:28<215:48:53,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13164/203307 [14:56:28<215:48:53,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13165/203307 [14:56:32<215:48:44,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13165/203307 [14:56:32<215:48:44,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13166/203307 [14:56:36<215:48:35,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13166/203307 [14:56:36<215:48:35,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13167/203307 [14:56:40<215:48:34,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13167/203307 [14:56:40<215:48:34,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13168/203307 [14:56:44<215:48:24,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13168/203307 [14:56:44<215:48:24,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13169/203307 [14:56:48<215:48:23,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13169/203307 [14:56:48<215:48:23,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13170/203307 [14:56:52<215:48:15,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13170/203307 [14:56:52<215:48:15,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13171/203307 [14:56:56<215:48:15,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13171/203307 [14:56:56<215:48:15,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13172/203307 [14:57:00<215:48:05,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13172/203307 [14:57:00<215:48:05,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13173/203307 [14:57:04<215:48:06,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13173/203307 [14:57:04<215:48:06,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13174/203307 [14:57:08<215:47:56,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13174/203307 [14:57:08<215:47:57,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13175/203307 [14:57:12<215:47:55,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13175/203307 [14:57:12<215:47:55,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13176/203307 [14:57:16<215:47:45,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13176/203307 [14:57:16<215:47:45,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13177/203307 [14:57:20<215:47:45,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13177/203307 [14:57:20<215:47:45,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13178/203307 [14:57:24<215:47:35,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13178/203307 [14:57:24<215:47:35,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13179/203307 [14:57:28<215:47:26,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13179/203307 [14:57:28<215:47:26,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13180/203307 [14:57:32<215:47:27,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13180/203307 [14:57:32<215:47:27,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13181/203307 [14:57:37<215:47:26,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   6%|▋         | 13181/203307 [14:57:37<215:47:26,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13182/203307 [14:57:40<215:47:17,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13182/203307 [14:57:40<215:47:17,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13183/203307 [14:57:44<215:47:08,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13183/203307 [14:57:44<215:47:08,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13184/203307 [14:57:48<215:47:07,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13184/203307 [14:57:48<215:47:07,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13185/203307 [14:57:52<215:46:57,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13185/203307 [14:57:52<215:46:57,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13186/203307 [14:57:56<215:46:55,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13186/203307 [14:57:56<215:46:55,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13187/203307 [14:58:00<215:46:46,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13187/203307 [14:58:00<215:46:46,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13188/203307 [14:58:04<215:46:45,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13188/203307 [14:58:04<215:46:45,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13189/203307 [14:58:09<215:46:44,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13189/203307 [14:58:09<215:46:44,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13190/203307 [14:58:13<215:46:44,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13190/203307 [14:58:13<215:46:45,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13191/203307 [14:58:17<215:46:35,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13191/203307 [14:58:17<215:46:35,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13192/203307 [14:58:21<215:46:33,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13192/203307 [14:58:21<215:46:33,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13193/203307 [14:58:25<215:46:24,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13193/203307 [14:58:25<215:46:24,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13194/203307 [14:58:29<215:46:24,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13194/203307 [14:58:29<215:46:24,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13195/203307 [14:58:33<215:46:15,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13195/203307 [14:58:33<215:46:15,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13196/203307 [14:58:36<215:46:06,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13196/203307 [14:58:36<215:46:06,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13197/203307 [14:58:41<215:46:07,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13197/203307 [14:58:41<215:46:08,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13198/203307 [14:58:45<215:46:05,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13198/203307 [14:58:45<215:46:05,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13199/203307 [14:58:50<215:46:06,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13199/203307 [14:58:50<215:46:06,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13200/203307 [14:58:54<215:46:06,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13200/203307 [14:58:54<215:46:06,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13201/203307 [14:58:58<215:45:56,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:   6%|▋         | 13201/203307 [14:58:58<215:45:56,  0.24it/s, v_num=t5e6, training/loss=0.100] Epoch 0:   6%|▋         | 13202/203307 [14:59:02<215:45:55,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 13202/203307 [14:59:02<215:45:55,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 13203/203307 [14:59:06<215:45:46,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 13203/203307 [14:59:06<215:45:46,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 13204/203307 [14:59:09<215:45:37,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 13204/203307 [14:59:09<215:45:37,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 13205/203307 [14:59:13<215:45:28,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 13205/203307 [14:59:13<215:45:28,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 13206/203307 [14:59:18<215:45:30,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 13206/203307 [14:59:18<215:45:30,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 13207/203307 [14:59:22<215:45:30,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 13207/203307 [14:59:22<215:45:30,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 13208/203307 [14:59:26<215:45:21,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 13208/203307 [14:59:26<215:45:22,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 13209/203307 [14:59:30<215:45:21,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 13209/203307 [14:59:30<215:45:21,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 13210/203307 [14:59:34<215:45:13,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 13210/203307 [14:59:34<215:45:13,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 13211/203307 [14:59:38<215:45:12,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 13211/203307 [14:59:38<215:45:12,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 13212/203307 [14:59:42<215:45:03,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 13212/203307 [14:59:42<215:45:03,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 13213/203307 [14:59:46<215:44:53,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 13213/203307 [14:59:46<215:44:53,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 13214/203307 [14:59:50<215:44:52,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   6%|▋         | 13214/203307 [14:59:50<215:44:52,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   7%|▋         | 13215/203307 [14:59:54<215:44:43,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   7%|▋         | 13215/203307 [14:59:54<215:44:44,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   7%|▋         | 13216/203307 [14:59:58<215:44:43,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   7%|▋         | 13216/203307 [14:59:58<215:44:44,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   7%|▋         | 13217/203307 [15:00:02<215:44:42,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   7%|▋         | 13217/203307 [15:00:02<215:44:42,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   7%|▋         | 13218/203307 [15:00:06<215:44:33,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   7%|▋         | 13218/203307 [15:00:06<215:44:33,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   7%|▋         | 13219/203307 [15:00:10<215:44:32,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   7%|▋         | 13219/203307 [15:00:10<215:44:32,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   7%|▋         | 13220/203307 [15:00:14<215:44:22,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   7%|▋         | 13220/203307 [15:00:14<215:44:22,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   7%|▋         | 13221/203307 [15:00:18<215:44:14,  0.24it/s, v_num=t5e6, training/loss=0.100]Epoch 0:   7%|▋         | 13221/203307 [15:00:18<215:44:14,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13222/203307 [15:00:22<215:44:07,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13222/203307 [15:00:22<215:44:07,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13223/203307 [15:00:26<215:44:09,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13223/203307 [15:00:26<215:44:09,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13224/203307 [15:00:30<215:43:58,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13224/203307 [15:00:30<215:43:58,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13225/203307 [15:00:34<215:44:00,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13225/203307 [15:00:34<215:44:00,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13226/203307 [15:00:38<215:43:50,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13226/203307 [15:00:38<215:43:50,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13227/203307 [15:00:42<215:43:49,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13227/203307 [15:00:42<215:43:49,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13228/203307 [15:00:46<215:43:39,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13228/203307 [15:00:46<215:43:39,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13229/203307 [15:00:50<215:43:30,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13229/203307 [15:00:50<215:43:30,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13230/203307 [15:00:53<215:43:20,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13230/203307 [15:00:53<215:43:20,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13231/203307 [15:00:57<215:43:11,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13231/203307 [15:00:57<215:43:11,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13232/203307 [15:01:02<215:43:12,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13232/203307 [15:01:02<215:43:12,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13233/203307 [15:01:06<215:43:11,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13233/203307 [15:01:06<215:43:11,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13234/203307 [15:01:10<215:43:10,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13234/203307 [15:01:10<215:43:10,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13235/203307 [15:01:14<215:43:01,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13235/203307 [15:01:14<215:43:01,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13236/203307 [15:01:18<215:43:01,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13236/203307 [15:01:18<215:43:01,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13237/203307 [15:01:22<215:42:51,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13237/203307 [15:01:22<215:42:51,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13238/203307 [15:01:26<215:42:42,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13238/203307 [15:01:26<215:42:42,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13239/203307 [15:01:30<215:42:32,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13239/203307 [15:01:30<215:42:32,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13240/203307 [15:01:34<215:42:34,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13240/203307 [15:01:34<215:42:34,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13241/203307 [15:01:38<215:42:24,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   7%|▋         | 13241/203307 [15:01:38<215:42:25,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13242/203307 [15:01:42<215:42:25,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13242/203307 [15:01:42<215:42:25,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13243/203307 [15:01:46<215:42:22,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13243/203307 [15:01:46<215:42:22,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13244/203307 [15:01:50<215:42:20,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13244/203307 [15:01:50<215:42:20,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13245/203307 [15:01:54<215:42:09,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13245/203307 [15:01:54<215:42:09,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13246/203307 [15:01:58<215:41:59,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13246/203307 [15:01:58<215:41:59,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13247/203307 [15:02:02<215:41:50,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13247/203307 [15:02:02<215:41:50,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13248/203307 [15:02:05<215:41:41,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13248/203307 [15:02:05<215:41:41,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13249/203307 [15:02:10<215:41:43,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13249/203307 [15:02:10<215:41:43,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13250/203307 [15:02:14<215:41:40,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13250/203307 [15:02:14<215:41:40,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13251/203307 [15:02:18<215:41:39,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13251/203307 [15:02:18<215:41:39,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13252/203307 [15:02:23<215:41:38,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13252/203307 [15:02:23<215:41:38,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13253/203307 [15:02:26<215:41:30,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13253/203307 [15:02:26<215:41:30,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13254/203307 [15:02:30<215:41:21,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13254/203307 [15:02:30<215:41:21,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13255/203307 [15:02:34<215:41:11,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13255/203307 [15:02:34<215:41:11,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13256/203307 [15:02:38<215:41:02,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13256/203307 [15:02:38<215:41:02,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13257/203307 [15:02:41<215:40:53,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13257/203307 [15:02:41<215:40:53,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13258/203307 [15:02:46<215:40:55,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13258/203307 [15:02:46<215:40:55,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13259/203307 [15:02:50<215:40:56,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13259/203307 [15:02:50<215:40:56,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13260/203307 [15:02:54<215:40:48,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13260/203307 [15:02:54<215:40:48,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13261/203307 [15:02:58<215:40:49,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:   7%|▋         | 13261/203307 [15:02:58<215:40:49,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13262/203307 [15:03:02<215:40:40,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13262/203307 [15:03:02<215:40:40,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13263/203307 [15:03:06<215:40:32,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13263/203307 [15:03:06<215:40:32,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13264/203307 [15:03:10<215:40:23,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13264/203307 [15:03:10<215:40:23,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13265/203307 [15:03:14<215:40:14,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13265/203307 [15:03:14<215:40:14,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13266/203307 [15:03:18<215:40:15,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13266/203307 [15:03:18<215:40:15,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13267/203307 [15:03:22<215:40:14,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13267/203307 [15:03:22<215:40:15,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13268/203307 [15:03:27<215:40:15,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13268/203307 [15:03:27<215:40:15,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13269/203307 [15:03:31<215:40:15,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13269/203307 [15:03:31<215:40:15,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13270/203307 [15:03:35<215:40:12,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13270/203307 [15:03:35<215:40:12,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13271/203307 [15:03:39<215:40:04,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13271/203307 [15:03:39<215:40:04,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13272/203307 [15:03:43<215:39:55,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13272/203307 [15:03:43<215:39:55,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13273/203307 [15:03:47<215:39:46,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13273/203307 [15:03:47<215:39:46,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13274/203307 [15:03:50<215:39:38,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13274/203307 [15:03:50<215:39:38,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13275/203307 [15:03:55<215:39:42,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13275/203307 [15:03:55<215:39:42,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13276/203307 [15:03:59<215:39:33,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13276/203307 [15:03:59<215:39:33,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13277/203307 [15:04:03<215:39:34,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13277/203307 [15:04:03<215:39:34,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13278/203307 [15:04:07<215:39:26,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13278/203307 [15:04:07<215:39:27,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13279/203307 [15:04:11<215:39:24,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13279/203307 [15:04:11<215:39:24,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13280/203307 [15:04:15<215:39:14,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13280/203307 [15:04:15<215:39:14,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13281/203307 [15:04:19<215:39:06,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:   7%|▋         | 13281/203307 [15:04:19<215:39:06,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13282/203307 [15:04:22<215:38:56,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13282/203307 [15:04:22<215:38:56,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13283/203307 [15:04:26<215:38:47,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13283/203307 [15:04:26<215:38:47,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13284/203307 [15:04:31<215:38:48,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13284/203307 [15:04:31<215:38:48,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13285/203307 [15:04:35<215:38:47,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13285/203307 [15:04:35<215:38:48,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13286/203307 [15:04:39<215:38:47,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13286/203307 [15:04:39<215:38:47,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13287/203307 [15:04:43<215:38:37,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13287/203307 [15:04:43<215:38:37,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13288/203307 [15:04:47<215:38:34,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13288/203307 [15:04:47<215:38:34,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13289/203307 [15:04:51<215:38:25,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13289/203307 [15:04:51<215:38:26,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13290/203307 [15:04:55<215:38:16,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13290/203307 [15:04:55<215:38:16,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13291/203307 [15:04:58<215:38:06,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13291/203307 [15:04:58<215:38:06,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13292/203307 [15:05:03<215:38:06,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13292/203307 [15:05:03<215:38:06,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13293/203307 [15:05:06<215:37:57,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13293/203307 [15:05:06<215:37:57,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13294/203307 [15:05:11<215:37:57,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13294/203307 [15:05:11<215:37:57,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13295/203307 [15:05:14<215:37:47,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13295/203307 [15:05:14<215:37:47,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13296/203307 [15:05:18<215:37:38,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13296/203307 [15:05:18<215:37:38,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13297/203307 [15:05:22<215:37:37,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13297/203307 [15:05:22<215:37:37,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13298/203307 [15:05:26<215:37:26,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13298/203307 [15:05:26<215:37:27,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13299/203307 [15:05:30<215:37:16,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13299/203307 [15:05:30<215:37:16,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13300/203307 [15:05:34<215:37:14,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13300/203307 [15:05:34<215:37:14,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13301/203307 [15:05:38<215:37:15,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 13301/203307 [15:05:38<215:37:15,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13302/203307 [15:05:43<215:37:14,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13302/203307 [15:05:43<215:37:14,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13303/203307 [15:05:47<215:37:14,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13303/203307 [15:05:47<215:37:14,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13304/203307 [15:05:51<215:37:03,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13304/203307 [15:05:51<215:37:03,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13305/203307 [15:05:54<215:36:54,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13305/203307 [15:05:54<215:36:54,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13306/203307 [15:05:59<215:36:52,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13306/203307 [15:05:59<215:36:53,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13307/203307 [15:06:02<215:36:44,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13307/203307 [15:06:02<215:36:44,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13308/203307 [15:06:06<215:36:34,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13308/203307 [15:06:06<215:36:34,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13309/203307 [15:06:10<215:36:34,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13309/203307 [15:06:10<215:36:34,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13310/203307 [15:06:15<215:36:35,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13310/203307 [15:06:15<215:36:35,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13311/203307 [15:06:19<215:36:36,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13311/203307 [15:06:19<215:36:36,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13312/203307 [15:06:23<215:36:26,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13312/203307 [15:06:23<215:36:26,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13313/203307 [15:06:27<215:36:17,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13313/203307 [15:06:27<215:36:17,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13314/203307 [15:06:30<215:36:07,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13314/203307 [15:06:30<215:36:07,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13315/203307 [15:06:35<215:36:06,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13315/203307 [15:06:35<215:36:06,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13316/203307 [15:06:38<215:35:57,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13316/203307 [15:06:38<215:35:57,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13317/203307 [15:06:43<215:35:56,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13317/203307 [15:06:43<215:35:56,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13318/203307 [15:06:47<215:35:57,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13318/203307 [15:06:47<215:35:57,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13319/203307 [15:06:52<215:35:56,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13319/203307 [15:06:52<215:35:56,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13320/203307 [15:06:56<215:35:57,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13320/203307 [15:06:56<215:35:57,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13321/203307 [15:07:00<215:35:47,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   7%|▋         | 13321/203307 [15:07:00<215:35:47,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13322/203307 [15:07:03<215:35:37,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13322/203307 [15:07:03<215:35:37,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13323/203307 [15:07:07<215:35:28,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13323/203307 [15:07:07<215:35:28,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13324/203307 [15:07:11<215:35:24,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13324/203307 [15:07:11<215:35:24,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13325/203307 [15:07:15<215:35:22,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13325/203307 [15:07:15<215:35:22,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13326/203307 [15:07:19<215:35:12,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13326/203307 [15:07:19<215:35:12,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13327/203307 [15:07:23<215:35:13,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13327/203307 [15:07:23<215:35:13,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13328/203307 [15:07:28<215:35:14,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13328/203307 [15:07:28<215:35:14,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13329/203307 [15:07:32<215:35:05,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13329/203307 [15:07:32<215:35:05,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13330/203307 [15:07:35<215:34:55,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13330/203307 [15:07:35<215:34:55,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13331/203307 [15:07:39<215:34:45,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13331/203307 [15:07:39<215:34:45,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13332/203307 [15:07:43<215:34:35,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13332/203307 [15:07:43<215:34:35,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13333/203307 [15:07:47<215:34:33,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13333/203307 [15:07:47<215:34:34,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13334/203307 [15:07:51<215:34:32,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13334/203307 [15:07:51<215:34:32,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13335/203307 [15:07:55<215:34:22,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13335/203307 [15:07:55<215:34:23,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13336/203307 [15:07:59<215:34:24,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13336/203307 [15:07:59<215:34:24,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13337/203307 [15:08:03<215:34:15,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13337/203307 [15:08:03<215:34:15,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13338/203307 [15:08:07<215:34:04,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13338/203307 [15:08:07<215:34:04,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13339/203307 [15:08:10<215:33:55,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13339/203307 [15:08:10<215:33:55,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13340/203307 [15:08:14<215:33:45,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13340/203307 [15:08:14<215:33:45,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13341/203307 [15:08:18<215:33:35,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:   7%|▋         | 13341/203307 [15:08:18<215:33:35,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13342/203307 [15:08:22<215:33:35,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13342/203307 [15:08:22<215:33:35,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13343/203307 [15:08:26<215:33:26,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13343/203307 [15:08:26<215:33:26,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13344/203307 [15:08:30<215:33:26,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13344/203307 [15:08:30<215:33:26,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13345/203307 [15:08:35<215:33:26,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13345/203307 [15:08:35<215:33:26,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13346/203307 [15:08:38<215:33:16,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13346/203307 [15:08:38<215:33:16,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13347/203307 [15:08:42<215:33:06,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13347/203307 [15:08:42<215:33:06,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13348/203307 [15:08:46<215:32:57,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13348/203307 [15:08:46<215:32:57,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13349/203307 [15:08:49<215:32:47,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13349/203307 [15:08:49<215:32:47,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13350/203307 [15:08:54<215:32:46,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13350/203307 [15:08:54<215:32:46,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13351/203307 [15:08:58<215:32:44,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13351/203307 [15:08:58<215:32:44,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13352/203307 [15:09:02<215:32:41,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13352/203307 [15:09:02<215:32:41,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13353/203307 [15:09:06<215:32:41,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13353/203307 [15:09:06<215:32:41,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13354/203307 [15:09:10<215:32:31,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13354/203307 [15:09:10<215:32:31,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13355/203307 [15:09:14<215:32:20,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13355/203307 [15:09:14<215:32:20,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13356/203307 [15:09:18<215:32:12,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13356/203307 [15:09:18<215:32:12,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13357/203307 [15:09:21<215:32:03,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13357/203307 [15:09:21<215:32:03,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13358/203307 [15:09:25<215:31:54,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13358/203307 [15:09:25<215:31:55,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13359/203307 [15:09:29<215:31:53,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13359/203307 [15:09:29<215:31:53,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13360/203307 [15:09:34<215:31:51,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13360/203307 [15:09:34<215:31:51,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13361/203307 [15:09:38<215:31:53,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 13361/203307 [15:09:38<215:31:53,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13362/203307 [15:09:42<215:31:53,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13362/203307 [15:09:42<215:31:53,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13363/203307 [15:09:46<215:31:43,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13363/203307 [15:09:46<215:31:43,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13364/203307 [15:09:50<215:31:34,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13364/203307 [15:09:50<215:31:34,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13365/203307 [15:09:54<215:31:25,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13365/203307 [15:09:54<215:31:25,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13366/203307 [15:09:57<215:31:16,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13366/203307 [15:09:57<215:31:16,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13367/203307 [15:10:02<215:31:16,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13367/203307 [15:10:02<215:31:16,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13368/203307 [15:10:05<215:31:08,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13368/203307 [15:10:05<215:31:08,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13369/203307 [15:10:10<215:31:07,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13369/203307 [15:10:10<215:31:07,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13370/203307 [15:10:14<215:31:09,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13370/203307 [15:10:14<215:31:09,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13371/203307 [15:10:18<215:31:01,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13371/203307 [15:10:18<215:31:01,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13372/203307 [15:10:22<215:30:53,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13372/203307 [15:10:22<215:30:53,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13373/203307 [15:10:26<215:30:44,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13373/203307 [15:10:26<215:30:44,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13374/203307 [15:10:29<215:30:35,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13374/203307 [15:10:29<215:30:35,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13375/203307 [15:10:34<215:30:35,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13375/203307 [15:10:34<215:30:35,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13376/203307 [15:10:38<215:30:27,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13376/203307 [15:10:38<215:30:27,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13377/203307 [15:10:42<215:30:26,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13377/203307 [15:10:42<215:30:26,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13378/203307 [15:10:46<215:30:28,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13378/203307 [15:10:46<215:30:28,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13379/203307 [15:10:51<215:30:28,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13379/203307 [15:10:51<215:30:28,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13380/203307 [15:10:54<215:30:18,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13380/203307 [15:10:54<215:30:18,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13381/203307 [15:10:58<215:30:11,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:   7%|▋         | 13381/203307 [15:10:58<215:30:11,  0.24it/s, v_num=t5e6, training/loss=0.094] Epoch 0:   7%|▋         | 13382/203307 [15:11:02<215:30:02,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13382/203307 [15:11:02<215:30:02,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13383/203307 [15:11:06<215:29:54,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13383/203307 [15:11:06<215:29:54,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13384/203307 [15:11:10<215:29:52,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13384/203307 [15:11:10<215:29:52,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13385/203307 [15:11:14<215:29:45,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13385/203307 [15:11:14<215:29:45,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13386/203307 [15:11:18<215:29:47,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13386/203307 [15:11:18<215:29:47,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13387/203307 [15:11:23<215:29:43,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13387/203307 [15:11:23<215:29:43,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13388/203307 [15:11:27<215:29:43,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13388/203307 [15:11:27<215:29:43,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13389/203307 [15:11:31<215:29:33,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13389/203307 [15:11:31<215:29:33,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13390/203307 [15:11:34<215:29:23,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13390/203307 [15:11:34<215:29:23,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13391/203307 [15:11:38<215:29:14,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13391/203307 [15:11:38<215:29:14,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13392/203307 [15:11:42<215:29:15,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13392/203307 [15:11:42<215:29:15,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13393/203307 [15:11:46<215:29:06,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13393/203307 [15:11:46<215:29:06,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13394/203307 [15:11:51<215:29:06,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13394/203307 [15:11:51<215:29:06,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13395/203307 [15:11:55<215:29:06,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13395/203307 [15:11:55<215:29:06,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13396/203307 [15:11:59<215:29:06,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13396/203307 [15:11:59<215:29:06,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13397/203307 [15:12:03<215:28:56,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13397/203307 [15:12:03<215:28:57,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13398/203307 [15:12:07<215:28:47,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13398/203307 [15:12:07<215:28:47,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13399/203307 [15:12:10<215:28:37,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13399/203307 [15:12:10<215:28:38,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13400/203307 [15:12:15<215:28:36,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13400/203307 [15:12:15<215:28:36,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13401/203307 [15:12:18<215:28:26,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:   7%|▋         | 13401/203307 [15:12:18<215:28:26,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13402/203307 [15:12:23<215:28:25,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13402/203307 [15:12:23<215:28:25,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13403/203307 [15:12:27<215:28:26,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13403/203307 [15:12:27<215:28:26,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13404/203307 [15:12:31<215:28:18,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13404/203307 [15:12:31<215:28:18,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13405/203307 [15:12:35<215:28:19,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13405/203307 [15:12:35<215:28:19,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13406/203307 [15:12:39<215:28:10,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13406/203307 [15:12:39<215:28:10,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13407/203307 [15:12:43<215:28:00,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13407/203307 [15:12:43<215:28:00,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13408/203307 [15:12:46<215:27:50,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13408/203307 [15:12:46<215:27:50,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13409/203307 [15:12:51<215:27:49,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13409/203307 [15:12:51<215:27:50,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13410/203307 [15:12:54<215:27:40,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13410/203307 [15:12:54<215:27:40,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13411/203307 [15:12:59<215:27:40,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13411/203307 [15:12:59<215:27:40,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13412/203307 [15:13:03<215:27:31,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13412/203307 [15:13:03<215:27:31,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13413/203307 [15:13:06<215:27:22,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13413/203307 [15:13:06<215:27:22,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13414/203307 [15:13:11<215:27:24,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13414/203307 [15:13:11<215:27:24,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13415/203307 [15:13:15<215:27:15,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13415/203307 [15:13:15<215:27:15,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13416/203307 [15:13:18<215:27:06,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13416/203307 [15:13:18<215:27:06,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13417/203307 [15:13:23<215:27:05,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13417/203307 [15:13:23<215:27:05,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13418/203307 [15:13:26<215:26:56,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13418/203307 [15:13:26<215:26:57,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13419/203307 [15:13:31<215:26:56,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13419/203307 [15:13:31<215:26:57,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13420/203307 [15:13:35<215:26:57,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13420/203307 [15:13:35<215:26:57,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13421/203307 [15:13:39<215:26:48,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:   7%|▋         | 13421/203307 [15:13:39<215:26:48,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13422/203307 [15:13:43<215:26:49,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13422/203307 [15:13:43<215:26:49,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13423/203307 [15:13:48<215:26:46,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13423/203307 [15:13:48<215:26:47,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13424/203307 [15:13:51<215:26:37,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13424/203307 [15:13:51<215:26:37,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13425/203307 [15:13:56<215:26:36,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13425/203307 [15:13:56<215:26:36,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13426/203307 [15:13:59<215:26:26,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13426/203307 [15:13:59<215:26:26,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13427/203307 [15:14:04<215:26:25,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13427/203307 [15:14:04<215:26:25,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13428/203307 [15:14:08<215:26:27,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13428/203307 [15:14:08<215:26:27,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13429/203307 [15:14:12<215:26:18,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13429/203307 [15:14:12<215:26:18,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13430/203307 [15:14:16<215:26:09,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13430/203307 [15:14:16<215:26:09,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13431/203307 [15:14:20<215:26:10,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13431/203307 [15:14:20<215:26:10,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13432/203307 [15:14:24<215:26:07,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13432/203307 [15:14:24<215:26:07,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13433/203307 [15:14:28<215:25:57,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13433/203307 [15:14:28<215:25:57,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13434/203307 [15:14:32<215:25:55,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13434/203307 [15:14:32<215:25:55,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13435/203307 [15:14:36<215:25:44,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13435/203307 [15:14:36<215:25:44,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13436/203307 [15:14:40<215:25:44,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13436/203307 [15:14:40<215:25:44,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13437/203307 [15:14:44<215:25:34,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13437/203307 [15:14:44<215:25:34,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13438/203307 [15:14:47<215:25:24,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13438/203307 [15:14:47<215:25:24,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13439/203307 [15:14:51<215:25:14,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13439/203307 [15:14:51<215:25:14,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13440/203307 [15:14:55<215:25:14,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13440/203307 [15:14:55<215:25:14,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13441/203307 [15:15:00<215:25:13,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   7%|▋         | 13441/203307 [15:15:00<215:25:13,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13442/203307 [15:15:04<215:25:10,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13442/203307 [15:15:04<215:25:10,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13443/203307 [15:15:07<215:25:00,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13443/203307 [15:15:07<215:25:00,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13444/203307 [15:15:12<215:24:58,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13444/203307 [15:15:12<215:24:58,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13445/203307 [15:15:16<215:24:58,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13445/203307 [15:15:16<215:24:58,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13446/203307 [15:15:20<215:24:49,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13446/203307 [15:15:20<215:24:49,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13447/203307 [15:15:24<215:24:39,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13447/203307 [15:15:24<215:24:40,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13448/203307 [15:15:28<215:24:39,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13448/203307 [15:15:28<215:24:39,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13449/203307 [15:15:32<215:24:31,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13449/203307 [15:15:32<215:24:31,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13450/203307 [15:15:36<215:24:30,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13450/203307 [15:15:36<215:24:30,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13451/203307 [15:15:40<215:24:20,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13451/203307 [15:15:40<215:24:20,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13452/203307 [15:15:44<215:24:18,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13452/203307 [15:15:44<215:24:18,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13453/203307 [15:15:48<215:24:18,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13453/203307 [15:15:48<215:24:18,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13454/203307 [15:15:52<215:24:08,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13454/203307 [15:15:52<215:24:08,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13455/203307 [15:15:56<215:23:58,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13455/203307 [15:15:56<215:23:58,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13456/203307 [15:15:59<215:23:49,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13456/203307 [15:15:59<215:23:49,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13457/203307 [15:16:04<215:23:51,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13457/203307 [15:16:04<215:23:51,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13458/203307 [15:16:08<215:23:41,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13458/203307 [15:16:08<215:23:41,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13459/203307 [15:16:12<215:23:40,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13459/203307 [15:16:12<215:23:40,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13460/203307 [15:16:15<215:23:30,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13460/203307 [15:16:15<215:23:30,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13461/203307 [15:16:20<215:23:32,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13461/203307 [15:16:20<215:23:32,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13462/203307 [15:16:24<215:23:23,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13462/203307 [15:16:24<215:23:23,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13463/203307 [15:16:27<215:23:13,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13463/203307 [15:16:27<215:23:13,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13464/203307 [15:16:31<215:23:04,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13464/203307 [15:16:31<215:23:04,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13465/203307 [15:16:35<215:22:56,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13465/203307 [15:16:35<215:22:56,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13466/203307 [15:16:40<215:22:59,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13466/203307 [15:16:40<215:22:59,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13467/203307 [15:16:44<215:22:58,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13467/203307 [15:16:44<215:22:58,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13468/203307 [15:16:48<215:22:57,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13468/203307 [15:16:48<215:22:57,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13469/203307 [15:16:52<215:22:55,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13469/203307 [15:16:52<215:22:56,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13470/203307 [15:16:57<215:22:56,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13470/203307 [15:16:57<215:22:56,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13471/203307 [15:17:01<215:22:47,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13471/203307 [15:17:01<215:22:47,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13472/203307 [15:17:04<215:22:38,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13472/203307 [15:17:04<215:22:38,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13473/203307 [15:17:08<215:22:28,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13473/203307 [15:17:08<215:22:28,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13474/203307 [15:17:12<215:22:30,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13474/203307 [15:17:12<215:22:30,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13475/203307 [15:17:17<215:22:29,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13475/203307 [15:17:17<215:22:29,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13476/203307 [15:17:21<215:22:21,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13476/203307 [15:17:21<215:22:21,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13477/203307 [15:17:25<215:22:19,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13477/203307 [15:17:25<215:22:20,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13478/203307 [15:17:29<215:22:20,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13478/203307 [15:17:29<215:22:20,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13479/203307 [15:17:33<215:22:10,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13479/203307 [15:17:33<215:22:10,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13480/203307 [15:17:37<215:22:00,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13480/203307 [15:17:37<215:22:00,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13481/203307 [15:17:40<215:21:51,  0.24it/s, v_num=t5e6, training/loss=0.0736]Epoch 0:   7%|▋         | 13481/203307 [15:17:40<215:21:51,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13482/203307 [15:17:44<215:21:41,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13482/203307 [15:17:44<215:21:41,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13483/203307 [15:17:48<215:21:42,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13483/203307 [15:17:48<215:21:42,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13484/203307 [15:17:53<215:21:40,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13484/203307 [15:17:53<215:21:40,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13485/203307 [15:17:56<215:21:29,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13485/203307 [15:17:56<215:21:29,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13486/203307 [15:18:01<215:21:29,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13486/203307 [15:18:01<215:21:29,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13487/203307 [15:18:04<215:21:20,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13487/203307 [15:18:04<215:21:20,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13488/203307 [15:18:08<215:21:09,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13488/203307 [15:18:08<215:21:09,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13489/203307 [15:18:12<215:20:59,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13489/203307 [15:18:12<215:20:59,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13490/203307 [15:18:15<215:20:50,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13490/203307 [15:18:15<215:20:50,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13491/203307 [15:18:19<215:20:40,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13491/203307 [15:18:19<215:20:40,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13492/203307 [15:18:24<215:20:42,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13492/203307 [15:18:24<215:20:42,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13493/203307 [15:18:27<215:20:33,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13493/203307 [15:18:27<215:20:33,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13494/203307 [15:18:32<215:20:32,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13494/203307 [15:18:32<215:20:32,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13495/203307 [15:18:36<215:20:33,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13495/203307 [15:18:36<215:20:33,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13496/203307 [15:18:40<215:20:23,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13496/203307 [15:18:40<215:20:23,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13497/203307 [15:18:43<215:20:14,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13497/203307 [15:18:43<215:20:14,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13498/203307 [15:18:47<215:20:05,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13498/203307 [15:18:47<215:20:05,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13499/203307 [15:18:51<215:19:55,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13499/203307 [15:18:51<215:19:55,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13500/203307 [15:18:55<215:19:56,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13500/203307 [15:18:55<215:19:56,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13501/203307 [15:18:59<215:19:47,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 13501/203307 [15:18:59<215:19:47,  0.24it/s, v_num=t5e6, training/loss=0.089] Epoch 0:   7%|▋         | 13502/203307 [15:19:03<215:19:46,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13502/203307 [15:19:03<215:19:46,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13503/203307 [15:19:08<215:19:47,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13503/203307 [15:19:08<215:19:47,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13504/203307 [15:19:12<215:19:43,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13504/203307 [15:19:12<215:19:43,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13505/203307 [15:19:16<215:19:33,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13505/203307 [15:19:16<215:19:33,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13506/203307 [15:19:19<215:19:24,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13506/203307 [15:19:19<215:19:24,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13507/203307 [15:19:23<215:19:14,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13507/203307 [15:19:23<215:19:14,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13508/203307 [15:19:27<215:19:05,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13508/203307 [15:19:27<215:19:05,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13509/203307 [15:19:31<215:19:08,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13509/203307 [15:19:31<215:19:08,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13510/203307 [15:19:35<215:18:58,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13510/203307 [15:19:35<215:18:58,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13511/203307 [15:19:39<215:18:59,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13511/203307 [15:19:39<215:18:59,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13512/203307 [15:19:43<215:18:50,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13512/203307 [15:19:43<215:18:50,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13513/203307 [15:19:47<215:18:49,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13513/203307 [15:19:47<215:18:49,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13514/203307 [15:19:51<215:18:38,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13514/203307 [15:19:51<215:18:39,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13515/203307 [15:19:55<215:18:29,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13515/203307 [15:19:55<215:18:29,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13516/203307 [15:19:58<215:18:19,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13516/203307 [15:19:58<215:18:19,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13517/203307 [15:20:03<215:18:19,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13517/203307 [15:20:03<215:18:19,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13518/203307 [15:20:07<215:18:19,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13518/203307 [15:20:07<215:18:19,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13519/203307 [15:20:11<215:18:17,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13519/203307 [15:20:11<215:18:17,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13520/203307 [15:20:16<215:18:17,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13520/203307 [15:20:16<215:18:17,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13521/203307 [15:20:20<215:18:10,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   7%|▋         | 13521/203307 [15:20:20<215:18:10,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13522/203307 [15:20:24<215:18:07,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13522/203307 [15:20:24<215:18:07,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13523/203307 [15:20:27<215:17:58,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13523/203307 [15:20:27<215:17:58,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13524/203307 [15:20:31<215:17:47,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13524/203307 [15:20:31<215:17:47,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13525/203307 [15:20:35<215:17:46,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13525/203307 [15:20:35<215:17:46,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13526/203307 [15:20:40<215:17:45,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13526/203307 [15:20:40<215:17:45,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13527/203307 [15:20:44<215:17:43,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13527/203307 [15:20:44<215:17:43,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13528/203307 [15:20:48<215:17:42,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13528/203307 [15:20:48<215:17:42,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13529/203307 [15:20:52<215:17:32,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13529/203307 [15:20:52<215:17:32,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13530/203307 [15:20:56<215:17:22,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13530/203307 [15:20:56<215:17:22,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13531/203307 [15:21:00<215:17:20,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13531/203307 [15:21:00<215:17:20,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13532/203307 [15:21:03<215:17:10,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13532/203307 [15:21:03<215:17:10,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13533/203307 [15:21:07<215:17:00,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13533/203307 [15:21:07<215:17:00,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13534/203307 [15:21:11<215:16:59,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13534/203307 [15:21:11<215:16:59,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13535/203307 [15:21:16<215:17:00,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13535/203307 [15:21:16<215:17:00,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13536/203307 [15:21:20<215:17:01,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13536/203307 [15:21:20<215:17:01,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13537/203307 [15:21:24<215:16:53,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13537/203307 [15:21:24<215:16:53,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13538/203307 [15:21:28<215:16:43,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13538/203307 [15:21:28<215:16:43,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13539/203307 [15:21:32<215:16:35,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13539/203307 [15:21:32<215:16:35,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13540/203307 [15:21:36<215:16:32,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13540/203307 [15:21:36<215:16:32,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13541/203307 [15:21:40<215:16:24,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   7%|▋         | 13541/203307 [15:21:40<215:16:25,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13542/203307 [15:21:44<215:16:21,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13542/203307 [15:21:44<215:16:22,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13543/203307 [15:21:48<215:16:13,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13543/203307 [15:21:48<215:16:13,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13544/203307 [15:21:52<215:16:14,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13544/203307 [15:21:52<215:16:14,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13545/203307 [15:21:56<215:16:15,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13545/203307 [15:21:56<215:16:15,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13546/203307 [15:22:00<215:16:06,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13546/203307 [15:22:00<215:16:06,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13547/203307 [15:22:04<215:15:57,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13547/203307 [15:22:04<215:15:57,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13548/203307 [15:22:08<215:15:47,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13548/203307 [15:22:08<215:15:47,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13549/203307 [15:22:12<215:15:44,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13549/203307 [15:22:12<215:15:44,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13550/203307 [15:22:16<215:15:44,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13550/203307 [15:22:16<215:15:44,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13551/203307 [15:22:20<215:15:36,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13551/203307 [15:22:20<215:15:36,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13552/203307 [15:22:24<215:15:36,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13552/203307 [15:22:24<215:15:36,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13553/203307 [15:22:29<215:15:37,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13553/203307 [15:22:29<215:15:37,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13554/203307 [15:22:32<215:15:28,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13554/203307 [15:22:32<215:15:28,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13555/203307 [15:22:36<215:15:18,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13555/203307 [15:22:36<215:15:18,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13556/203307 [15:22:40<215:15:09,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13556/203307 [15:22:40<215:15:09,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13557/203307 [15:22:44<215:15:01,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13557/203307 [15:22:44<215:15:01,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13558/203307 [15:22:48<215:14:59,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13558/203307 [15:22:48<215:14:59,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13559/203307 [15:22:52<215:14:56,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13559/203307 [15:22:52<215:14:57,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13560/203307 [15:22:56<215:14:47,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13560/203307 [15:22:56<215:14:47,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13561/203307 [15:23:00<215:14:48,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 13561/203307 [15:23:00<215:14:48,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13562/203307 [15:23:04<215:14:39,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13562/203307 [15:23:04<215:14:39,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13563/203307 [15:23:08<215:14:30,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13563/203307 [15:23:08<215:14:30,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13564/203307 [15:23:11<215:14:20,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13564/203307 [15:23:11<215:14:20,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13565/203307 [15:23:15<215:14:11,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13565/203307 [15:23:15<215:14:12,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13566/203307 [15:23:19<215:14:02,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13566/203307 [15:23:19<215:14:03,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13567/203307 [15:23:23<215:14:02,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13567/203307 [15:23:23<215:14:02,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13568/203307 [15:23:27<215:13:53,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13568/203307 [15:23:27<215:13:53,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13569/203307 [15:23:31<215:13:53,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13569/203307 [15:23:31<215:13:53,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13570/203307 [15:23:36<215:13:54,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13570/203307 [15:23:36<215:13:54,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13571/203307 [15:23:39<215:13:45,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13571/203307 [15:23:39<215:13:45,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13572/203307 [15:23:43<215:13:35,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13572/203307 [15:23:43<215:13:35,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13573/203307 [15:23:47<215:13:26,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13573/203307 [15:23:47<215:13:27,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13574/203307 [15:23:51<215:13:18,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13574/203307 [15:23:51<215:13:18,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13575/203307 [15:23:55<215:13:18,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13575/203307 [15:23:55<215:13:18,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13576/203307 [15:23:59<215:13:14,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13576/203307 [15:23:59<215:13:14,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13577/203307 [15:24:03<215:13:13,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13577/203307 [15:24:03<215:13:13,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13578/203307 [15:24:08<215:13:14,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13578/203307 [15:24:08<215:13:14,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13579/203307 [15:24:11<215:13:04,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13579/203307 [15:24:11<215:13:04,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13580/203307 [15:24:15<215:12:55,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13580/203307 [15:24:15<215:12:55,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13581/203307 [15:24:19<215:12:47,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   7%|▋         | 13581/203307 [15:24:19<215:12:47,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13582/203307 [15:24:23<215:12:37,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13582/203307 [15:24:23<215:12:37,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13583/203307 [15:24:26<215:12:27,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13583/203307 [15:24:26<215:12:27,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13584/203307 [15:24:31<215:12:24,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13584/203307 [15:24:31<215:12:25,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13585/203307 [15:24:35<215:12:22,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13585/203307 [15:24:35<215:12:22,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13586/203307 [15:24:39<215:12:22,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13586/203307 [15:24:39<215:12:22,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13587/203307 [15:24:43<215:12:21,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13587/203307 [15:24:43<215:12:21,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13588/203307 [15:24:47<215:12:11,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13588/203307 [15:24:47<215:12:11,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13589/203307 [15:24:51<215:12:00,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13589/203307 [15:24:51<215:12:00,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13590/203307 [15:24:54<215:11:52,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13590/203307 [15:24:54<215:11:52,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13591/203307 [15:24:58<215:11:42,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13591/203307 [15:24:58<215:11:42,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13592/203307 [15:25:02<215:11:41,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13592/203307 [15:25:02<215:11:41,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13593/203307 [15:25:06<215:11:32,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13593/203307 [15:25:06<215:11:32,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13594/203307 [15:25:10<215:11:30,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13594/203307 [15:25:10<215:11:31,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13595/203307 [15:25:15<215:11:30,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13595/203307 [15:25:15<215:11:30,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13596/203307 [15:25:19<215:11:30,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13596/203307 [15:25:19<215:11:30,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13597/203307 [15:25:23<215:11:21,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13597/203307 [15:25:23<215:11:21,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13598/203307 [15:25:27<215:11:11,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13598/203307 [15:25:27<215:11:11,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13599/203307 [15:25:30<215:11:00,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13599/203307 [15:25:30<215:11:00,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13600/203307 [15:25:34<215:10:58,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13600/203307 [15:25:34<215:10:58,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13601/203307 [15:25:38<215:10:48,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   7%|▋         | 13601/203307 [15:25:38<215:10:48,  0.24it/s, v_num=t5e6, training/loss=0.086] Epoch 0:   7%|▋         | 13602/203307 [15:25:42<215:10:45,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13602/203307 [15:25:42<215:10:45,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13603/203307 [15:25:47<215:10:44,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13603/203307 [15:25:47<215:10:44,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13604/203307 [15:25:51<215:10:44,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13604/203307 [15:25:51<215:10:44,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13605/203307 [15:25:54<215:10:33,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13605/203307 [15:25:54<215:10:33,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13606/203307 [15:25:58<215:10:23,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13606/203307 [15:25:58<215:10:23,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13607/203307 [15:26:02<215:10:13,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13607/203307 [15:26:02<215:10:13,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13608/203307 [15:26:05<215:10:03,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13608/203307 [15:26:05<215:10:03,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13609/203307 [15:26:10<215:10:02,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13609/203307 [15:26:10<215:10:02,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13610/203307 [15:26:13<215:09:52,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13610/203307 [15:26:13<215:09:52,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13611/203307 [15:26:18<215:09:53,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13611/203307 [15:26:18<215:09:53,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13612/203307 [15:26:22<215:09:51,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13612/203307 [15:26:22<215:09:51,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13613/203307 [15:26:27<215:09:52,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13613/203307 [15:26:27<215:09:52,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13614/203307 [15:26:30<215:09:41,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13614/203307 [15:26:30<215:09:41,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13615/203307 [15:26:34<215:09:34,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13615/203307 [15:26:34<215:09:34,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13616/203307 [15:26:38<215:09:24,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13616/203307 [15:26:38<215:09:24,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13617/203307 [15:26:42<215:09:22,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13617/203307 [15:26:42<215:09:22,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13618/203307 [15:26:46<215:09:12,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13618/203307 [15:26:46<215:09:12,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13619/203307 [15:26:50<215:09:10,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13619/203307 [15:26:50<215:09:10,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13620/203307 [15:26:54<215:09:09,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13620/203307 [15:26:54<215:09:09,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13621/203307 [15:26:58<215:09:06,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 13621/203307 [15:26:58<215:09:06,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13622/203307 [15:27:03<215:09:07,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13622/203307 [15:27:03<215:09:07,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13623/203307 [15:27:06<215:08:56,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13623/203307 [15:27:06<215:08:56,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13624/203307 [15:27:10<215:08:46,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13624/203307 [15:27:10<215:08:46,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13625/203307 [15:27:14<215:08:45,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13625/203307 [15:27:14<215:08:45,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13626/203307 [15:27:18<215:08:38,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13626/203307 [15:27:18<215:08:38,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13627/203307 [15:27:22<215:08:37,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13627/203307 [15:27:22<215:08:37,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13628/203307 [15:27:27<215:08:38,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13628/203307 [15:27:27<215:08:38,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13629/203307 [15:27:31<215:08:29,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13629/203307 [15:27:31<215:08:29,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13630/203307 [15:27:35<215:08:30,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13630/203307 [15:27:35<215:08:30,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13631/203307 [15:27:39<215:08:21,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13631/203307 [15:27:39<215:08:21,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13632/203307 [15:27:42<215:08:11,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13632/203307 [15:27:42<215:08:12,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13633/203307 [15:27:46<215:08:03,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13633/203307 [15:27:46<215:08:03,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13634/203307 [15:27:51<215:08:02,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13634/203307 [15:27:51<215:08:02,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13635/203307 [15:27:54<215:07:52,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13635/203307 [15:27:54<215:07:52,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13636/203307 [15:27:59<215:07:53,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13636/203307 [15:27:59<215:07:53,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13637/203307 [15:28:02<215:07:44,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13637/203307 [15:28:02<215:07:44,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13638/203307 [15:28:06<215:07:35,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13638/203307 [15:28:06<215:07:35,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13639/203307 [15:28:11<215:07:35,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13639/203307 [15:28:11<215:07:35,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13640/203307 [15:28:14<215:07:26,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13640/203307 [15:28:14<215:07:26,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13641/203307 [15:28:18<215:07:17,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:   7%|▋         | 13641/203307 [15:28:18<215:07:17,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13642/203307 [15:28:22<215:07:17,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13642/203307 [15:28:22<215:07:18,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13643/203307 [15:28:26<215:07:09,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13643/203307 [15:28:26<215:07:09,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13644/203307 [15:28:31<215:07:09,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13644/203307 [15:28:31<215:07:09,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13645/203307 [15:28:35<215:07:11,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13645/203307 [15:28:35<215:07:11,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13646/203307 [15:28:39<215:07:02,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13646/203307 [15:28:39<215:07:02,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13647/203307 [15:28:42<215:06:53,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13647/203307 [15:28:42<215:06:53,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13648/203307 [15:28:47<215:06:55,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13648/203307 [15:28:47<215:06:55,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13649/203307 [15:28:51<215:06:46,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13649/203307 [15:28:51<215:06:46,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13650/203307 [15:28:55<215:06:45,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13650/203307 [15:28:55<215:06:45,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13651/203307 [15:28:59<215:06:36,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13651/203307 [15:28:59<215:06:36,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13652/203307 [15:29:03<215:06:34,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13652/203307 [15:29:03<215:06:35,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13653/203307 [15:29:08<215:06:36,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13653/203307 [15:29:08<215:06:36,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13654/203307 [15:29:11<215:06:27,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13654/203307 [15:29:11<215:06:27,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13655/203307 [15:29:15<215:06:18,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13655/203307 [15:29:15<215:06:18,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13656/203307 [15:29:20<215:06:20,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13656/203307 [15:29:20<215:06:20,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13657/203307 [15:29:24<215:06:18,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13657/203307 [15:29:24<215:06:18,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13658/203307 [15:29:27<215:06:09,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13658/203307 [15:29:27<215:06:09,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13659/203307 [15:29:32<215:06:08,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13659/203307 [15:29:32<215:06:08,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13660/203307 [15:29:35<215:05:59,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13660/203307 [15:29:35<215:05:59,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13661/203307 [15:29:40<215:06:00,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 13661/203307 [15:29:40<215:06:00,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13662/203307 [15:29:44<215:05:51,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13662/203307 [15:29:44<215:05:51,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13663/203307 [15:29:47<215:05:42,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13663/203307 [15:29:47<215:05:42,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13664/203307 [15:29:51<215:05:32,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13664/203307 [15:29:51<215:05:32,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13665/203307 [15:29:56<215:05:35,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13665/203307 [15:29:56<215:05:35,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13666/203307 [15:30:00<215:05:32,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13666/203307 [15:30:00<215:05:32,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13667/203307 [15:30:04<215:05:30,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13667/203307 [15:30:04<215:05:31,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13668/203307 [15:30:08<215:05:22,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13668/203307 [15:30:08<215:05:22,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13669/203307 [15:30:12<215:05:22,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13669/203307 [15:30:12<215:05:22,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13670/203307 [15:30:17<215:05:22,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13670/203307 [15:30:17<215:05:22,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13671/203307 [15:30:20<215:05:14,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13671/203307 [15:30:20<215:05:14,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13672/203307 [15:30:24<215:05:04,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13672/203307 [15:30:24<215:05:04,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13673/203307 [15:30:28<215:04:54,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13673/203307 [15:30:28<215:04:54,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13674/203307 [15:30:32<215:04:56,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13674/203307 [15:30:32<215:04:56,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13675/203307 [15:30:36<215:04:54,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13675/203307 [15:30:36<215:04:54,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13676/203307 [15:30:40<215:04:44,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13676/203307 [15:30:40<215:04:44,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13677/203307 [15:30:44<215:04:43,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13677/203307 [15:30:44<215:04:43,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13678/203307 [15:30:49<215:04:43,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13678/203307 [15:30:49<215:04:43,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13679/203307 [15:30:53<215:04:34,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13679/203307 [15:30:53<215:04:34,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13680/203307 [15:30:56<215:04:25,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13680/203307 [15:30:56<215:04:25,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13681/203307 [15:31:00<215:04:17,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   7%|▋         | 13681/203307 [15:31:00<215:04:17,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13682/203307 [15:31:04<215:04:17,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13682/203307 [15:31:04<215:04:17,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13683/203307 [15:31:08<215:04:08,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13683/203307 [15:31:08<215:04:08,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13684/203307 [15:31:12<215:04:06,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13684/203307 [15:31:12<215:04:06,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13685/203307 [15:31:16<215:03:56,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13685/203307 [15:31:16<215:03:56,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13686/203307 [15:31:21<215:03:57,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13686/203307 [15:31:21<215:03:58,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13687/203307 [15:31:24<215:03:49,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13687/203307 [15:31:24<215:03:49,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13688/203307 [15:31:28<215:03:39,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13688/203307 [15:31:28<215:03:39,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13689/203307 [15:31:32<215:03:30,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13689/203307 [15:31:32<215:03:30,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13690/203307 [15:31:35<215:03:21,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13690/203307 [15:31:35<215:03:21,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13691/203307 [15:31:40<215:03:22,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13691/203307 [15:31:40<215:03:22,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13692/203307 [15:31:44<215:03:19,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13692/203307 [15:31:44<215:03:20,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13693/203307 [15:31:48<215:03:16,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13693/203307 [15:31:48<215:03:16,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13694/203307 [15:31:52<215:03:14,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13694/203307 [15:31:52<215:03:15,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13695/203307 [15:31:57<215:03:14,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13695/203307 [15:31:57<215:03:14,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13696/203307 [15:32:01<215:03:05,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13696/203307 [15:32:01<215:03:05,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13697/203307 [15:32:04<215:02:56,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13697/203307 [15:32:04<215:02:56,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13698/203307 [15:32:08<215:02:46,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13698/203307 [15:32:08<215:02:46,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13699/203307 [15:32:12<215:02:36,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13699/203307 [15:32:12<215:02:36,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13700/203307 [15:32:16<215:02:39,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13700/203307 [15:32:16<215:02:39,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13701/203307 [15:32:20<215:02:30,  0.24it/s, v_num=t5e6, training/loss=0.0991]Epoch 0:   7%|▋         | 13701/203307 [15:32:20<215:02:30,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13702/203307 [15:32:24<215:02:29,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13702/203307 [15:32:24<215:02:29,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13703/203307 [15:32:29<215:02:29,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13703/203307 [15:32:29<215:02:29,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13704/203307 [15:32:32<215:02:20,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13704/203307 [15:32:32<215:02:20,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13705/203307 [15:32:36<215:02:10,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13705/203307 [15:32:36<215:02:10,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13706/203307 [15:32:40<215:02:01,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13706/203307 [15:32:40<215:02:01,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13707/203307 [15:32:43<215:01:51,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13707/203307 [15:32:43<215:01:51,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13708/203307 [15:32:48<215:01:53,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13708/203307 [15:32:48<215:01:53,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13709/203307 [15:32:52<215:01:50,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13709/203307 [15:32:52<215:01:50,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13710/203307 [15:32:56<215:01:40,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13710/203307 [15:32:56<215:01:40,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13711/203307 [15:33:00<215:01:42,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13711/203307 [15:33:00<215:01:42,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13712/203307 [15:33:04<215:01:32,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13712/203307 [15:33:04<215:01:32,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13713/203307 [15:33:08<215:01:23,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13713/203307 [15:33:08<215:01:23,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13714/203307 [15:33:11<215:01:13,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13714/203307 [15:33:11<215:01:13,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13715/203307 [15:33:15<215:01:04,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13715/203307 [15:33:15<215:01:04,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13716/203307 [15:33:19<215:00:55,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13716/203307 [15:33:19<215:00:56,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13717/203307 [15:33:23<215:00:57,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13717/203307 [15:33:23<215:00:57,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13718/203307 [15:33:27<215:00:48,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13718/203307 [15:33:27<215:00:48,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13719/203307 [15:33:31<215:00:48,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13719/203307 [15:33:31<215:00:48,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13720/203307 [15:33:36<215:00:48,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13720/203307 [15:33:36<215:00:49,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13721/203307 [15:33:39<215:00:39,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   7%|▋         | 13721/203307 [15:33:39<215:00:39,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13722/203307 [15:33:43<215:00:29,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13722/203307 [15:33:43<215:00:29,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13723/203307 [15:33:47<215:00:21,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13723/203307 [15:33:47<215:00:21,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13724/203307 [15:33:51<215:00:11,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13724/203307 [15:33:51<215:00:11,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13725/203307 [15:33:55<215:00:10,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13725/203307 [15:33:55<215:00:10,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13726/203307 [15:33:59<215:00:10,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13726/203307 [15:33:59<215:00:10,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13727/203307 [15:34:03<215:00:07,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13727/203307 [15:34:03<215:00:07,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13728/203307 [15:34:08<215:00:07,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13728/203307 [15:34:08<215:00:07,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13729/203307 [15:34:12<215:00:03,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13729/203307 [15:34:12<215:00:03,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13730/203307 [15:34:15<214:59:53,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13730/203307 [15:34:16<214:59:53,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13731/203307 [15:34:19<214:59:44,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13731/203307 [15:34:19<214:59:44,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13732/203307 [15:34:23<214:59:36,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13732/203307 [15:34:23<214:59:36,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13733/203307 [15:34:27<214:59:26,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13733/203307 [15:34:27<214:59:26,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13734/203307 [15:34:31<214:59:27,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13734/203307 [15:34:31<214:59:27,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13735/203307 [15:34:35<214:59:19,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13735/203307 [15:34:35<214:59:19,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13736/203307 [15:34:39<214:59:19,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13736/203307 [15:34:39<214:59:19,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13737/203307 [15:34:43<214:59:10,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13737/203307 [15:34:43<214:59:10,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13738/203307 [15:34:47<214:59:08,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13738/203307 [15:34:47<214:59:08,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13739/203307 [15:34:51<214:58:57,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13739/203307 [15:34:51<214:58:58,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13740/203307 [15:34:55<214:58:49,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13740/203307 [15:34:55<214:58:49,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13741/203307 [15:34:58<214:58:40,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   7%|▋         | 13741/203307 [15:34:58<214:58:40,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13742/203307 [15:35:03<214:58:39,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13742/203307 [15:35:03<214:58:39,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13743/203307 [15:35:07<214:58:40,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13743/203307 [15:35:07<214:58:40,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13744/203307 [15:35:11<214:58:38,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13744/203307 [15:35:11<214:58:38,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13745/203307 [15:35:16<214:58:38,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13745/203307 [15:35:16<214:58:38,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13746/203307 [15:35:20<214:58:30,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13746/203307 [15:35:20<214:58:30,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13747/203307 [15:35:24<214:58:29,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13747/203307 [15:35:24<214:58:29,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13748/203307 [15:35:28<214:58:20,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13748/203307 [15:35:28<214:58:20,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13749/203307 [15:35:31<214:58:11,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13749/203307 [15:35:31<214:58:11,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13750/203307 [15:35:36<214:58:09,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13750/203307 [15:35:36<214:58:09,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13751/203307 [15:35:39<214:58:00,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13751/203307 [15:35:39<214:58:01,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13752/203307 [15:35:44<214:58:01,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13752/203307 [15:35:44<214:58:01,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13753/203307 [15:35:48<214:58:02,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13753/203307 [15:35:48<214:58:02,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13754/203307 [15:35:52<214:57:53,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13754/203307 [15:35:52<214:57:53,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13755/203307 [15:35:56<214:57:44,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13755/203307 [15:35:56<214:57:44,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13756/203307 [15:36:00<214:57:43,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13756/203307 [15:36:00<214:57:43,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13757/203307 [15:36:04<214:57:33,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13757/203307 [15:36:04<214:57:33,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13758/203307 [15:36:07<214:57:25,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13758/203307 [15:36:07<214:57:25,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13759/203307 [15:36:12<214:57:24,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13759/203307 [15:36:12<214:57:24,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13760/203307 [15:36:16<214:57:24,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13760/203307 [15:36:16<214:57:25,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13761/203307 [15:36:21<214:57:26,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 13761/203307 [15:36:21<214:57:26,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13762/203307 [15:36:24<214:57:17,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13762/203307 [15:36:24<214:57:17,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13763/203307 [15:36:28<214:57:08,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13763/203307 [15:36:28<214:57:08,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13764/203307 [15:36:32<214:56:59,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13764/203307 [15:36:32<214:56:59,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13765/203307 [15:36:36<214:56:58,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13765/203307 [15:36:36<214:56:58,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13766/203307 [15:36:40<214:56:50,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13766/203307 [15:36:40<214:56:50,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13767/203307 [15:36:44<214:56:49,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13767/203307 [15:36:44<214:56:49,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13768/203307 [15:36:48<214:56:41,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13768/203307 [15:36:48<214:56:41,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13769/203307 [15:36:52<214:56:42,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13769/203307 [15:36:52<214:56:42,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13770/203307 [15:36:57<214:56:43,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13770/203307 [15:36:57<214:56:43,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13771/203307 [15:37:01<214:56:34,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13771/203307 [15:37:01<214:56:34,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13772/203307 [15:37:04<214:56:25,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13772/203307 [15:37:04<214:56:25,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13773/203307 [15:37:08<214:56:16,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13773/203307 [15:37:08<214:56:16,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13774/203307 [15:37:12<214:56:12,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13774/203307 [15:37:12<214:56:12,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13775/203307 [15:37:17<214:56:13,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13775/203307 [15:37:17<214:56:13,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13776/203307 [15:37:20<214:56:06,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13776/203307 [15:37:20<214:56:06,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13777/203307 [15:37:25<214:56:06,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13777/203307 [15:37:25<214:56:06,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13778/203307 [15:37:29<214:56:08,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13778/203307 [15:37:29<214:56:08,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13779/203307 [15:37:33<214:55:59,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13779/203307 [15:37:33<214:55:59,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13780/203307 [15:37:37<214:55:52,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13780/203307 [15:37:37<214:55:52,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13781/203307 [15:37:41<214:55:44,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:   7%|▋         | 13781/203307 [15:37:41<214:55:44,  0.24it/s, v_num=t5e6, training/loss=0.084] Epoch 0:   7%|▋         | 13782/203307 [15:37:45<214:55:35,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13782/203307 [15:37:45<214:55:36,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13783/203307 [15:37:49<214:55:32,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13783/203307 [15:37:49<214:55:32,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13784/203307 [15:37:53<214:55:30,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13784/203307 [15:37:53<214:55:30,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13785/203307 [15:37:57<214:55:21,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13785/203307 [15:37:57<214:55:21,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13786/203307 [15:38:01<214:55:23,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13786/203307 [15:38:01<214:55:23,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13787/203307 [15:38:05<214:55:14,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13787/203307 [15:38:05<214:55:15,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13788/203307 [15:38:09<214:55:06,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13788/203307 [15:38:09<214:55:06,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13789/203307 [15:38:12<214:54:58,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13789/203307 [15:38:12<214:54:58,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13790/203307 [15:38:16<214:54:49,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13790/203307 [15:38:16<214:54:49,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13791/203307 [15:38:20<214:54:42,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13791/203307 [15:38:20<214:54:42,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13792/203307 [15:38:24<214:54:41,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13792/203307 [15:38:24<214:54:41,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13793/203307 [15:38:28<214:54:34,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13793/203307 [15:38:28<214:54:34,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13794/203307 [15:38:33<214:54:33,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13794/203307 [15:38:33<214:54:34,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13795/203307 [15:38:37<214:54:35,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13795/203307 [15:38:37<214:54:35,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13796/203307 [15:38:41<214:54:26,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13796/203307 [15:38:41<214:54:26,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13797/203307 [15:38:45<214:54:17,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13797/203307 [15:38:45<214:54:17,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13798/203307 [15:38:48<214:54:09,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13798/203307 [15:38:48<214:54:09,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13799/203307 [15:38:52<214:54:00,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13799/203307 [15:38:52<214:54:00,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13800/203307 [15:38:56<214:53:59,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13800/203307 [15:38:56<214:53:59,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13801/203307 [15:39:01<214:53:57,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   7%|▋         | 13801/203307 [15:39:01<214:53:57,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13802/203307 [15:39:05<214:53:56,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13802/203307 [15:39:05<214:53:56,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13803/203307 [15:39:09<214:53:56,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13803/203307 [15:39:09<214:53:56,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13804/203307 [15:39:14<214:53:57,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13804/203307 [15:39:14<214:53:57,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13805/203307 [15:39:18<214:53:50,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13805/203307 [15:39:18<214:53:50,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13806/203307 [15:39:21<214:53:41,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13806/203307 [15:39:21<214:53:41,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13807/203307 [15:39:25<214:53:32,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13807/203307 [15:39:25<214:53:32,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13808/203307 [15:39:29<214:53:23,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13808/203307 [15:39:29<214:53:23,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13809/203307 [15:39:33<214:53:22,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13809/203307 [15:39:33<214:53:22,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13810/203307 [15:39:37<214:53:19,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13810/203307 [15:39:37<214:53:19,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13811/203307 [15:39:42<214:53:19,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13811/203307 [15:39:42<214:53:19,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13812/203307 [15:39:46<214:53:20,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13812/203307 [15:39:46<214:53:20,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13813/203307 [15:39:50<214:53:10,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13813/203307 [15:39:50<214:53:10,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13814/203307 [15:39:53<214:53:01,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13814/203307 [15:39:53<214:53:01,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13815/203307 [15:39:57<214:52:52,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13815/203307 [15:39:57<214:52:53,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13816/203307 [15:40:01<214:52:44,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13816/203307 [15:40:01<214:52:44,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13817/203307 [15:40:05<214:52:42,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13817/203307 [15:40:05<214:52:42,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13818/203307 [15:40:09<214:52:33,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13818/203307 [15:40:09<214:52:33,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13819/203307 [15:40:13<214:52:33,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13819/203307 [15:40:13<214:52:33,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13820/203307 [15:40:18<214:52:34,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13820/203307 [15:40:18<214:52:34,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13821/203307 [15:40:22<214:52:33,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   7%|▋         | 13821/203307 [15:40:22<214:52:34,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13822/203307 [15:40:26<214:52:23,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13822/203307 [15:40:26<214:52:23,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13823/203307 [15:40:29<214:52:14,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13823/203307 [15:40:29<214:52:14,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13824/203307 [15:40:33<214:52:05,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13824/203307 [15:40:33<214:52:05,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13825/203307 [15:40:37<214:52:04,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13825/203307 [15:40:37<214:52:04,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13826/203307 [15:40:41<214:51:55,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13826/203307 [15:40:41<214:51:55,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13827/203307 [15:40:45<214:51:53,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13827/203307 [15:40:45<214:51:53,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13828/203307 [15:40:50<214:51:52,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13828/203307 [15:40:50<214:51:53,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13829/203307 [15:40:53<214:51:43,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13829/203307 [15:40:53<214:51:43,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13830/203307 [15:40:58<214:51:44,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13830/203307 [15:40:58<214:51:44,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13831/203307 [15:41:02<214:51:34,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13831/203307 [15:41:02<214:51:34,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13832/203307 [15:41:05<214:51:23,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13832/203307 [15:41:05<214:51:24,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13833/203307 [15:41:09<214:51:14,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13833/203307 [15:41:09<214:51:14,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13834/203307 [15:41:13<214:51:13,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13834/203307 [15:41:13<214:51:13,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13835/203307 [15:41:17<214:51:05,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13835/203307 [15:41:17<214:51:05,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13836/203307 [15:41:21<214:51:06,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13836/203307 [15:41:21<214:51:06,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13837/203307 [15:41:26<214:51:04,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13837/203307 [15:41:26<214:51:04,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13838/203307 [15:41:30<214:51:05,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13838/203307 [15:41:30<214:51:05,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13839/203307 [15:41:34<214:50:56,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13839/203307 [15:41:34<214:50:56,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13840/203307 [15:41:37<214:50:46,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13840/203307 [15:41:37<214:50:46,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13841/203307 [15:41:41<214:50:38,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   7%|▋         | 13841/203307 [15:41:41<214:50:38,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13842/203307 [15:41:46<214:50:37,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13842/203307 [15:41:46<214:50:37,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13843/203307 [15:41:49<214:50:28,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13843/203307 [15:41:49<214:50:28,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13844/203307 [15:41:53<214:50:26,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13844/203307 [15:41:53<214:50:26,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13845/203307 [15:41:58<214:50:25,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13845/203307 [15:41:58<214:50:25,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13846/203307 [15:42:02<214:50:23,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13846/203307 [15:42:02<214:50:23,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13847/203307 [15:42:06<214:50:22,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13847/203307 [15:42:06<214:50:22,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13848/203307 [15:42:10<214:50:14,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13848/203307 [15:42:10<214:50:14,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13849/203307 [15:42:14<214:50:03,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13849/203307 [15:42:14<214:50:04,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13850/203307 [15:42:18<214:50:03,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13850/203307 [15:42:18<214:50:03,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13851/203307 [15:42:22<214:49:54,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13851/203307 [15:42:22<214:49:54,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13852/203307 [15:42:26<214:49:53,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13852/203307 [15:42:26<214:49:53,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13853/203307 [15:42:31<214:49:54,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13853/203307 [15:42:31<214:49:54,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13854/203307 [15:42:34<214:49:44,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13854/203307 [15:42:34<214:49:44,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13855/203307 [15:42:38<214:49:41,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13855/203307 [15:42:38<214:49:41,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13856/203307 [15:42:43<214:49:41,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13856/203307 [15:42:43<214:49:41,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13857/203307 [15:42:46<214:49:31,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13857/203307 [15:42:46<214:49:31,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13858/203307 [15:42:50<214:49:21,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13858/203307 [15:42:50<214:49:21,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13859/203307 [15:42:54<214:49:19,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13859/203307 [15:42:54<214:49:19,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13860/203307 [15:42:58<214:49:09,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13860/203307 [15:42:58<214:49:09,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13861/203307 [15:43:02<214:49:10,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:   7%|▋         | 13861/203307 [15:43:02<214:49:10,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13862/203307 [15:43:06<214:49:02,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13862/203307 [15:43:06<214:49:02,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13863/203307 [15:43:10<214:48:52,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13863/203307 [15:43:10<214:48:52,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13864/203307 [15:43:14<214:48:52,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13864/203307 [15:43:14<214:48:52,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13865/203307 [15:43:18<214:48:43,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13865/203307 [15:43:18<214:48:43,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13866/203307 [15:43:22<214:48:35,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13866/203307 [15:43:22<214:48:35,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13867/203307 [15:43:26<214:48:33,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13867/203307 [15:43:26<214:48:33,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13868/203307 [15:43:30<214:48:24,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13868/203307 [15:43:30<214:48:24,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13869/203307 [15:43:34<214:48:23,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13869/203307 [15:43:34<214:48:23,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13870/203307 [15:43:38<214:48:24,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13870/203307 [15:43:38<214:48:24,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13871/203307 [15:43:42<214:48:14,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13871/203307 [15:43:42<214:48:14,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13872/203307 [15:43:46<214:48:04,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13872/203307 [15:43:46<214:48:04,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13873/203307 [15:43:50<214:48:06,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13873/203307 [15:43:50<214:48:06,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13874/203307 [15:43:54<214:47:56,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13874/203307 [15:43:54<214:47:56,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13875/203307 [15:43:58<214:47:54,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13875/203307 [15:43:58<214:47:54,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13876/203307 [15:44:02<214:47:45,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13876/203307 [15:44:02<214:47:45,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13877/203307 [15:44:06<214:47:44,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13877/203307 [15:44:06<214:47:44,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13878/203307 [15:44:11<214:47:45,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13878/203307 [15:44:11<214:47:45,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13879/203307 [15:44:14<214:47:35,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13879/203307 [15:44:14<214:47:35,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13880/203307 [15:44:18<214:47:26,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13880/203307 [15:44:18<214:47:26,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13881/203307 [15:44:22<214:47:18,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 13881/203307 [15:44:22<214:47:18,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13882/203307 [15:44:26<214:47:19,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13882/203307 [15:44:26<214:47:19,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13883/203307 [15:44:30<214:47:10,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13883/203307 [15:44:30<214:47:10,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13884/203307 [15:44:34<214:47:07,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13884/203307 [15:44:34<214:47:07,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13885/203307 [15:44:38<214:46:56,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13885/203307 [15:44:38<214:46:56,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13886/203307 [15:44:42<214:46:57,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13886/203307 [15:44:42<214:46:57,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13887/203307 [15:44:46<214:46:49,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13887/203307 [15:44:46<214:46:49,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13888/203307 [15:44:50<214:46:41,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13888/203307 [15:44:50<214:46:41,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13889/203307 [15:44:54<214:46:32,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13889/203307 [15:44:54<214:46:32,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13890/203307 [15:44:58<214:46:33,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13890/203307 [15:44:58<214:46:33,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13891/203307 [15:45:02<214:46:28,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13891/203307 [15:45:02<214:46:28,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13892/203307 [15:45:06<214:46:26,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13892/203307 [15:45:06<214:46:26,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13893/203307 [15:45:10<214:46:17,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13893/203307 [15:45:10<214:46:18,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13894/203307 [15:45:14<214:46:17,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13894/203307 [15:45:14<214:46:17,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13895/203307 [15:45:19<214:46:17,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13895/203307 [15:45:19<214:46:17,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13896/203307 [15:45:22<214:46:08,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13896/203307 [15:45:22<214:46:08,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13897/203307 [15:45:26<214:45:59,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13897/203307 [15:45:26<214:45:59,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13898/203307 [15:45:30<214:45:49,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13898/203307 [15:45:30<214:45:49,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13899/203307 [15:45:34<214:45:51,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13899/203307 [15:45:34<214:45:51,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13900/203307 [15:45:39<214:45:49,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13900/203307 [15:45:39<214:45:49,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13901/203307 [15:45:42<214:45:40,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:   7%|▋         | 13901/203307 [15:45:42<214:45:40,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13902/203307 [15:45:47<214:45:40,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13902/203307 [15:45:47<214:45:40,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13903/203307 [15:45:51<214:45:39,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13903/203307 [15:45:51<214:45:39,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13904/203307 [15:45:55<214:45:30,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13904/203307 [15:45:55<214:45:30,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13905/203307 [15:45:58<214:45:22,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13905/203307 [15:45:58<214:45:22,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13906/203307 [15:46:02<214:45:13,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13906/203307 [15:46:02<214:45:13,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13907/203307 [15:46:06<214:45:03,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13907/203307 [15:46:06<214:45:03,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13908/203307 [15:46:10<214:45:04,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13908/203307 [15:46:10<214:45:04,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13909/203307 [15:46:15<214:45:02,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13909/203307 [15:46:15<214:45:02,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13910/203307 [15:46:18<214:44:52,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13910/203307 [15:46:18<214:44:52,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13911/203307 [15:46:23<214:44:53,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13911/203307 [15:46:23<214:44:53,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13912/203307 [15:46:26<214:44:44,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13912/203307 [15:46:26<214:44:44,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13913/203307 [15:46:30<214:44:35,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13913/203307 [15:46:30<214:44:35,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13914/203307 [15:46:34<214:44:25,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13914/203307 [15:46:34<214:44:25,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13915/203307 [15:46:37<214:44:16,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13915/203307 [15:46:37<214:44:16,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13916/203307 [15:46:42<214:44:16,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13916/203307 [15:46:42<214:44:17,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13917/203307 [15:46:46<214:44:14,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13917/203307 [15:46:46<214:44:14,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13918/203307 [15:46:50<214:44:10,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13918/203307 [15:46:50<214:44:10,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13919/203307 [15:46:54<214:44:08,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13919/203307 [15:46:54<214:44:08,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13920/203307 [15:46:59<214:44:08,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13920/203307 [15:46:59<214:44:08,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13921/203307 [15:47:02<214:43:59,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   7%|▋         | 13921/203307 [15:47:03<214:43:59,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13922/203307 [15:47:06<214:43:49,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13922/203307 [15:47:06<214:43:49,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13923/203307 [15:47:10<214:43:40,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13923/203307 [15:47:10<214:43:40,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13924/203307 [15:47:14<214:43:31,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13924/203307 [15:47:14<214:43:31,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13925/203307 [15:47:18<214:43:33,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13925/203307 [15:47:18<214:43:33,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13926/203307 [15:47:22<214:43:25,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13926/203307 [15:47:22<214:43:25,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13927/203307 [15:47:26<214:43:25,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13927/203307 [15:47:26<214:43:26,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13928/203307 [15:47:31<214:43:26,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13928/203307 [15:47:31<214:43:26,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13929/203307 [15:47:35<214:43:18,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13929/203307 [15:47:35<214:43:18,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13930/203307 [15:47:38<214:43:09,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13930/203307 [15:47:38<214:43:09,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13931/203307 [15:47:42<214:43:01,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13931/203307 [15:47:42<214:43:01,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13932/203307 [15:47:46<214:42:52,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13932/203307 [15:47:46<214:42:52,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13933/203307 [15:47:50<214:42:44,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13933/203307 [15:47:50<214:42:44,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13934/203307 [15:47:54<214:42:45,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13934/203307 [15:47:54<214:42:45,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13935/203307 [15:47:58<214:42:36,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13935/203307 [15:47:58<214:42:37,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13936/203307 [15:48:02<214:42:38,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13936/203307 [15:48:02<214:42:38,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13937/203307 [15:48:06<214:42:29,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13937/203307 [15:48:06<214:42:29,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13938/203307 [15:48:10<214:42:20,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13938/203307 [15:48:10<214:42:20,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13939/203307 [15:48:14<214:42:12,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13939/203307 [15:48:14<214:42:12,  0.24it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13940/203307 [15:48:17<214:42:04,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13940/203307 [15:48:17<214:42:04,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13941/203307 [15:48:21<214:41:54,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   7%|▋         | 13941/203307 [15:48:21<214:41:55,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13942/203307 [15:48:25<214:41:56,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13942/203307 [15:48:26<214:41:56,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13943/203307 [15:48:29<214:41:48,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13943/203307 [15:48:29<214:41:48,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13944/203307 [15:48:34<214:41:48,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13944/203307 [15:48:34<214:41:48,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13945/203307 [15:48:38<214:41:48,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13945/203307 [15:48:38<214:41:48,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13946/203307 [15:48:42<214:41:39,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13946/203307 [15:48:42<214:41:39,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13947/203307 [15:48:45<214:41:30,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13947/203307 [15:48:45<214:41:30,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13948/203307 [15:48:49<214:41:22,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13948/203307 [15:48:49<214:41:22,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13949/203307 [15:48:53<214:41:13,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13949/203307 [15:48:53<214:41:13,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13950/203307 [15:48:57<214:41:12,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13950/203307 [15:48:57<214:41:13,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13951/203307 [15:49:02<214:41:13,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13951/203307 [15:49:02<214:41:13,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13952/203307 [15:49:06<214:41:12,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13952/203307 [15:49:06<214:41:12,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13953/203307 [15:49:10<214:41:12,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13953/203307 [15:49:10<214:41:12,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13954/203307 [15:49:15<214:41:10,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13954/203307 [15:49:15<214:41:10,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13955/203307 [15:49:18<214:41:01,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13955/203307 [15:49:18<214:41:01,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13956/203307 [15:49:22<214:40:52,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13956/203307 [15:49:22<214:40:52,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13957/203307 [15:49:26<214:40:43,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13957/203307 [15:49:26<214:40:43,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13958/203307 [15:49:30<214:40:34,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13958/203307 [15:49:30<214:40:34,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13959/203307 [15:49:34<214:40:33,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13959/203307 [15:49:34<214:40:33,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13960/203307 [15:49:38<214:40:33,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13960/203307 [15:49:38<214:40:33,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13961/203307 [15:49:43<214:40:34,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 13961/203307 [15:49:43<214:40:34,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13962/203307 [15:49:46<214:40:24,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13962/203307 [15:49:46<214:40:25,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13963/203307 [15:49:51<214:40:22,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13963/203307 [15:49:51<214:40:22,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13964/203307 [15:49:54<214:40:12,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13964/203307 [15:49:54<214:40:12,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13965/203307 [15:49:58<214:40:03,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13965/203307 [15:49:58<214:40:03,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13966/203307 [15:50:02<214:39:55,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13966/203307 [15:50:02<214:39:55,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13967/203307 [15:50:06<214:39:54,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13967/203307 [15:50:06<214:39:54,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13968/203307 [15:50:10<214:39:55,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13968/203307 [15:50:11<214:39:55,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13969/203307 [15:50:15<214:39:54,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13969/203307 [15:50:15<214:39:54,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13970/203307 [15:50:19<214:39:55,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13970/203307 [15:50:19<214:39:55,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13971/203307 [15:50:23<214:39:45,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13971/203307 [15:50:23<214:39:45,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13972/203307 [15:50:27<214:39:43,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13972/203307 [15:50:27<214:39:43,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13973/203307 [15:50:31<214:39:34,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13973/203307 [15:50:31<214:39:34,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13974/203307 [15:50:35<214:39:25,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13974/203307 [15:50:35<214:39:25,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13975/203307 [15:50:39<214:39:23,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13975/203307 [15:50:39<214:39:24,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13976/203307 [15:50:43<214:39:15,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13976/203307 [15:50:43<214:39:16,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13977/203307 [15:50:47<214:39:16,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13977/203307 [15:50:47<214:39:16,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13978/203307 [15:50:52<214:39:17,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13978/203307 [15:50:52<214:39:17,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13979/203307 [15:50:55<214:39:08,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13979/203307 [15:50:55<214:39:08,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13980/203307 [15:50:59<214:39:00,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13980/203307 [15:50:59<214:39:00,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13981/203307 [15:51:03<214:39:00,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   7%|▋         | 13981/203307 [15:51:03<214:39:00,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13982/203307 [15:51:07<214:38:51,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13982/203307 [15:51:07<214:38:51,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13983/203307 [15:51:11<214:38:43,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13983/203307 [15:51:11<214:38:43,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13984/203307 [15:51:15<214:38:42,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13984/203307 [15:51:15<214:38:42,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13985/203307 [15:51:19<214:38:32,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13985/203307 [15:51:19<214:38:32,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13986/203307 [15:51:23<214:38:33,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13986/203307 [15:51:23<214:38:33,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13987/203307 [15:51:27<214:38:23,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13987/203307 [15:51:27<214:38:23,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13988/203307 [15:51:31<214:38:14,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13988/203307 [15:51:31<214:38:14,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13989/203307 [15:51:34<214:38:05,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13989/203307 [15:51:34<214:38:05,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13990/203307 [15:51:39<214:38:03,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13990/203307 [15:51:39<214:38:03,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13991/203307 [15:51:42<214:37:54,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13991/203307 [15:51:42<214:37:54,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13992/203307 [15:51:47<214:37:52,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13992/203307 [15:51:47<214:37:52,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13993/203307 [15:51:50<214:37:42,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13993/203307 [15:51:50<214:37:42,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13994/203307 [15:51:55<214:37:42,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13994/203307 [15:51:55<214:37:42,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13995/203307 [15:51:59<214:37:42,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13995/203307 [15:51:59<214:37:42,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13996/203307 [15:52:03<214:37:33,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13996/203307 [15:52:03<214:37:33,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13997/203307 [15:52:06<214:37:23,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13997/203307 [15:52:06<214:37:23,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13998/203307 [15:52:10<214:37:14,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13998/203307 [15:52:10<214:37:14,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13999/203307 [15:52:14<214:37:13,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 13999/203307 [15:52:14<214:37:13,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 14000/203307 [15:52:19<214:37:11,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 14000/203307 [15:52:19<214:37:11,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 14001/203307 [15:52:22<214:37:01,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 14001/203307 [15:52:22<214:37:01,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14002/203307 [15:52:27<214:37:00,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14002/203307 [15:52:27<214:37:00,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14003/203307 [15:52:31<214:37:01,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14003/203307 [15:52:31<214:37:01,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14004/203307 [15:52:35<214:36:52,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14004/203307 [15:52:35<214:36:52,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14005/203307 [15:52:38<214:36:42,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14005/203307 [15:52:38<214:36:42,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14006/203307 [15:52:42<214:36:34,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14006/203307 [15:52:42<214:36:34,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14007/203307 [15:52:46<214:36:25,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14007/203307 [15:52:46<214:36:25,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14008/203307 [15:52:50<214:36:23,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14008/203307 [15:52:50<214:36:23,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14009/203307 [15:52:54<214:36:20,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14009/203307 [15:52:54<214:36:20,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14010/203307 [15:52:58<214:36:11,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14010/203307 [15:52:58<214:36:11,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14011/203307 [15:53:02<214:36:12,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14011/203307 [15:53:02<214:36:12,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14012/203307 [15:53:07<214:36:13,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14012/203307 [15:53:07<214:36:13,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14013/203307 [15:53:11<214:36:03,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14013/203307 [15:53:11<214:36:03,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14014/203307 [15:53:14<214:35:54,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14014/203307 [15:53:14<214:35:54,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14015/203307 [15:53:18<214:35:47,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14015/203307 [15:53:18<214:35:47,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14016/203307 [15:53:22<214:35:38,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14016/203307 [15:53:22<214:35:38,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14017/203307 [15:53:26<214:35:38,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14017/203307 [15:53:26<214:35:38,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14018/203307 [15:53:30<214:35:30,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14018/203307 [15:53:30<214:35:30,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14019/203307 [15:53:34<214:35:29,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14019/203307 [15:53:34<214:35:29,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14020/203307 [15:53:39<214:35:30,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14020/203307 [15:53:39<214:35:30,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14021/203307 [15:53:43<214:35:22,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14021/203307 [15:53:43<214:35:22,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14022/203307 [15:53:46<214:35:12,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14022/203307 [15:53:46<214:35:12,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14023/203307 [15:53:50<214:35:04,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14023/203307 [15:53:50<214:35:04,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14024/203307 [15:53:54<214:34:55,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14024/203307 [15:53:54<214:34:55,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14025/203307 [15:53:58<214:34:54,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14025/203307 [15:53:58<214:34:54,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14026/203307 [15:54:02<214:34:50,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14026/203307 [15:54:02<214:34:50,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14027/203307 [15:54:06<214:34:48,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14027/203307 [15:54:06<214:34:48,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14028/203307 [15:54:11<214:34:48,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14028/203307 [15:54:11<214:34:48,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14029/203307 [15:54:15<214:34:48,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14029/203307 [15:54:15<214:34:48,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14030/203307 [15:54:19<214:34:39,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14030/203307 [15:54:19<214:34:39,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14031/203307 [15:54:23<214:34:30,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14031/203307 [15:54:23<214:34:30,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14032/203307 [15:54:26<214:34:21,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14032/203307 [15:54:26<214:34:21,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14033/203307 [15:54:30<214:34:12,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14033/203307 [15:54:30<214:34:12,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14034/203307 [15:54:34<214:34:12,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14034/203307 [15:54:34<214:34:12,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14035/203307 [15:54:39<214:34:09,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14035/203307 [15:54:39<214:34:09,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14036/203307 [15:54:43<214:34:09,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14036/203307 [15:54:43<214:34:09,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14037/203307 [15:54:47<214:33:59,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14037/203307 [15:54:47<214:33:59,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14038/203307 [15:54:51<214:34:00,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14038/203307 [15:54:51<214:34:00,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14039/203307 [15:54:55<214:33:50,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14039/203307 [15:54:55<214:33:50,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14040/203307 [15:54:58<214:33:42,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14040/203307 [15:54:58<214:33:42,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14041/203307 [15:55:02<214:33:33,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   7%|▋         | 14041/203307 [15:55:02<214:33:33,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14042/203307 [15:55:07<214:33:33,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14042/203307 [15:55:07<214:33:33,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14043/203307 [15:55:10<214:33:23,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14043/203307 [15:55:10<214:33:23,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14044/203307 [15:55:15<214:33:24,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14044/203307 [15:55:15<214:33:24,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14045/203307 [15:55:19<214:33:25,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14045/203307 [15:55:19<214:33:25,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14046/203307 [15:55:24<214:33:26,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14046/203307 [15:55:24<214:33:26,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14047/203307 [15:55:27<214:33:17,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14047/203307 [15:55:27<214:33:17,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14048/203307 [15:55:31<214:33:08,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14048/203307 [15:55:31<214:33:08,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14049/203307 [15:55:35<214:32:59,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14049/203307 [15:55:35<214:32:59,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14050/203307 [15:55:39<214:32:59,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14050/203307 [15:55:39<214:32:59,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14051/203307 [15:55:43<214:32:50,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14051/203307 [15:55:43<214:32:50,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14052/203307 [15:55:47<214:32:48,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14052/203307 [15:55:47<214:32:48,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14053/203307 [15:55:51<214:32:48,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14053/203307 [15:55:51<214:32:48,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14054/203307 [15:55:55<214:32:39,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14054/203307 [15:55:55<214:32:39,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14055/203307 [15:56:00<214:32:40,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14055/203307 [15:56:00<214:32:40,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14056/203307 [15:56:03<214:32:32,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14056/203307 [15:56:03<214:32:33,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14057/203307 [15:56:07<214:32:23,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14057/203307 [15:56:07<214:32:23,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14058/203307 [15:56:11<214:32:14,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14058/203307 [15:56:11<214:32:14,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14059/203307 [15:56:15<214:32:13,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14059/203307 [15:56:15<214:32:13,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14060/203307 [15:56:19<214:32:04,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14060/203307 [15:56:19<214:32:04,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14061/203307 [15:56:23<214:32:05,  0.25it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:   7%|▋         | 14061/203307 [15:56:23<214:32:06,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14062/203307 [15:56:28<214:32:02,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14062/203307 [15:56:28<214:32:03,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14063/203307 [15:56:31<214:31:56,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14063/203307 [15:56:31<214:31:56,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14064/203307 [15:56:36<214:31:56,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14064/203307 [15:56:36<214:31:56,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14065/203307 [15:56:40<214:31:46,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14065/203307 [15:56:40<214:31:46,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14066/203307 [15:56:43<214:31:36,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14066/203307 [15:56:43<214:31:36,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14067/203307 [15:56:47<214:31:35,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14067/203307 [15:56:47<214:31:35,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14068/203307 [15:56:51<214:31:25,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14068/203307 [15:56:51<214:31:25,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14069/203307 [15:56:55<214:31:23,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14069/203307 [15:56:55<214:31:24,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14070/203307 [15:57:00<214:31:25,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14070/203307 [15:57:00<214:31:25,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14071/203307 [15:57:04<214:31:22,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14071/203307 [15:57:04<214:31:22,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14072/203307 [15:57:08<214:31:22,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14072/203307 [15:57:08<214:31:22,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14073/203307 [15:57:12<214:31:14,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14073/203307 [15:57:12<214:31:14,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14074/203307 [15:57:16<214:31:04,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14074/203307 [15:57:16<214:31:04,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14075/203307 [15:57:20<214:31:03,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14075/203307 [15:57:20<214:31:04,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14076/203307 [15:57:24<214:30:55,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14076/203307 [15:57:24<214:30:55,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14077/203307 [15:57:28<214:30:53,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14077/203307 [15:57:28<214:30:53,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14078/203307 [15:57:33<214:30:54,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14078/203307 [15:57:33<214:30:54,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14079/203307 [15:57:36<214:30:44,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14079/203307 [15:57:36<214:30:45,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14080/203307 [15:57:40<214:30:42,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14080/203307 [15:57:40<214:30:42,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14081/203307 [15:57:45<214:30:42,  0.25it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   7%|▋         | 14081/203307 [15:57:45<214:30:42,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14082/203307 [15:57:49<214:30:34,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14082/203307 [15:57:49<214:30:34,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14083/203307 [15:57:52<214:30:24,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14083/203307 [15:57:52<214:30:24,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14084/203307 [15:57:57<214:30:24,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14084/203307 [15:57:57<214:30:24,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14085/203307 [15:58:00<214:30:14,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14085/203307 [15:58:00<214:30:14,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14086/203307 [15:58:05<214:30:17,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14086/203307 [15:58:05<214:30:17,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14087/203307 [15:58:09<214:30:11,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14087/203307 [15:58:09<214:30:11,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14088/203307 [15:58:13<214:30:04,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14088/203307 [15:58:13<214:30:04,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14089/203307 [15:58:17<214:30:02,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14089/203307 [15:58:17<214:30:02,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14090/203307 [15:58:21<214:30:03,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14090/203307 [15:58:21<214:30:03,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14091/203307 [15:58:25<214:29:56,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14091/203307 [15:58:25<214:29:56,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14092/203307 [15:58:30<214:29:55,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14092/203307 [15:58:30<214:29:55,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14093/203307 [15:58:33<214:29:46,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14093/203307 [15:58:33<214:29:46,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14094/203307 [15:58:38<214:29:46,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14094/203307 [15:58:38<214:29:46,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14095/203307 [15:58:42<214:29:46,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14095/203307 [15:58:42<214:29:46,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14096/203307 [15:58:46<214:29:38,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14096/203307 [15:58:46<214:29:38,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14097/203307 [15:58:50<214:29:29,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14097/203307 [15:58:50<214:29:29,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14098/203307 [15:58:54<214:29:29,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14098/203307 [15:58:54<214:29:29,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14099/203307 [15:58:58<214:29:21,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14099/203307 [15:58:58<214:29:21,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14100/203307 [15:59:02<214:29:19,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14100/203307 [15:59:02<214:29:19,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14101/203307 [15:59:06<214:29:11,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   7%|▋         | 14101/203307 [15:59:06<214:29:11,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14102/203307 [15:59:10<214:29:09,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14102/203307 [15:59:10<214:29:09,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14103/203307 [15:59:14<214:29:10,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14103/203307 [15:59:14<214:29:10,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14104/203307 [15:59:18<214:29:02,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14104/203307 [15:59:18<214:29:02,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14105/203307 [15:59:22<214:28:53,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14105/203307 [15:59:22<214:28:53,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14106/203307 [15:59:26<214:28:43,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14106/203307 [15:59:26<214:28:44,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14107/203307 [15:59:30<214:28:45,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14107/203307 [15:59:30<214:28:45,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14108/203307 [15:59:34<214:28:36,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14108/203307 [15:59:34<214:28:36,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14109/203307 [15:59:38<214:28:35,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14109/203307 [15:59:38<214:28:35,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14110/203307 [15:59:42<214:28:26,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14110/203307 [15:59:42<214:28:26,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14111/203307 [15:59:46<214:28:27,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14111/203307 [15:59:46<214:28:27,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14112/203307 [15:59:50<214:28:18,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14112/203307 [15:59:50<214:28:18,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14113/203307 [15:59:54<214:28:09,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14113/203307 [15:59:54<214:28:10,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14114/203307 [15:59:58<214:28:00,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14114/203307 [15:59:58<214:28:01,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14115/203307 [16:00:01<214:27:52,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14115/203307 [16:00:01<214:27:52,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14116/203307 [16:00:06<214:27:54,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14116/203307 [16:00:06<214:27:54,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14117/203307 [16:00:10<214:27:53,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14117/203307 [16:00:10<214:27:53,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14118/203307 [16:00:14<214:27:44,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14118/203307 [16:00:14<214:27:44,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14119/203307 [16:00:18<214:27:45,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14119/203307 [16:00:18<214:27:45,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14120/203307 [16:00:23<214:27:45,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14120/203307 [16:00:23<214:27:45,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14121/203307 [16:00:26<214:27:36,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   7%|▋         | 14121/203307 [16:00:26<214:27:36,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14122/203307 [16:00:30<214:27:27,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14122/203307 [16:00:30<214:27:28,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14123/203307 [16:00:34<214:27:19,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14123/203307 [16:00:34<214:27:19,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14124/203307 [16:00:38<214:27:19,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14124/203307 [16:00:38<214:27:19,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14125/203307 [16:00:43<214:27:16,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14125/203307 [16:00:43<214:27:17,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14126/203307 [16:00:46<214:27:08,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14126/203307 [16:00:46<214:27:08,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14127/203307 [16:00:51<214:27:07,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14127/203307 [16:00:51<214:27:07,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14128/203307 [16:00:55<214:27:08,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14128/203307 [16:00:55<214:27:08,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14129/203307 [16:00:59<214:26:59,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14129/203307 [16:00:59<214:26:59,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14130/203307 [16:01:02<214:26:50,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14130/203307 [16:01:02<214:26:50,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14131/203307 [16:01:06<214:26:41,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14131/203307 [16:01:06<214:26:41,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14132/203307 [16:01:10<214:26:32,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14132/203307 [16:01:10<214:26:32,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14133/203307 [16:01:14<214:26:34,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14133/203307 [16:01:14<214:26:34,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14134/203307 [16:01:19<214:26:34,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14134/203307 [16:01:19<214:26:34,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14135/203307 [16:01:23<214:26:25,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14135/203307 [16:01:23<214:26:25,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14136/203307 [16:01:27<214:26:26,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14136/203307 [16:01:27<214:26:27,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14137/203307 [16:01:31<214:26:18,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14137/203307 [16:01:31<214:26:18,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14138/203307 [16:01:34<214:26:09,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14138/203307 [16:01:34<214:26:09,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14139/203307 [16:01:38<214:25:59,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14139/203307 [16:01:38<214:26:00,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14140/203307 [16:01:42<214:25:51,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14140/203307 [16:01:42<214:25:51,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14141/203307 [16:01:46<214:25:41,  0.25it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:   7%|▋         | 14141/203307 [16:01:46<214:25:41,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14142/203307 [16:01:50<214:25:43,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14142/203307 [16:01:50<214:25:43,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14143/203307 [16:01:54<214:25:40,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14143/203307 [16:01:54<214:25:40,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14144/203307 [16:01:59<214:25:38,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14144/203307 [16:01:59<214:25:38,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14145/203307 [16:02:03<214:25:37,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14145/203307 [16:02:03<214:25:37,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14146/203307 [16:02:06<214:25:27,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14146/203307 [16:02:06<214:25:27,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14147/203307 [16:02:10<214:25:17,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14147/203307 [16:02:10<214:25:17,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14148/203307 [16:02:14<214:25:08,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14148/203307 [16:02:14<214:25:08,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14149/203307 [16:02:18<214:25:01,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14149/203307 [16:02:18<214:25:01,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14150/203307 [16:02:22<214:25:01,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14150/203307 [16:02:22<214:25:01,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14151/203307 [16:02:26<214:24:53,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14151/203307 [16:02:26<214:24:53,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14152/203307 [16:02:30<214:24:52,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14152/203307 [16:02:30<214:24:52,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14153/203307 [16:02:35<214:24:52,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14153/203307 [16:02:35<214:24:52,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14154/203307 [16:02:38<214:24:43,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14154/203307 [16:02:38<214:24:44,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14155/203307 [16:02:42<214:24:35,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14155/203307 [16:02:42<214:24:35,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14156/203307 [16:02:46<214:24:25,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14156/203307 [16:02:46<214:24:25,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14157/203307 [16:02:49<214:24:16,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14157/203307 [16:02:49<214:24:16,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14158/203307 [16:02:53<214:24:07,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14158/203307 [16:02:53<214:24:07,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14159/203307 [16:02:58<214:24:08,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14159/203307 [16:02:58<214:24:08,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14160/203307 [16:03:01<214:23:58,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14160/203307 [16:03:01<214:23:58,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14161/203307 [16:03:06<214:23:59,  0.25it/s, v_num=t5e6, training/loss=0.0763]Epoch 0:   7%|▋         | 14161/203307 [16:03:06<214:23:59,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14162/203307 [16:03:09<214:23:50,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14162/203307 [16:03:09<214:23:50,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14163/203307 [16:03:13<214:23:41,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14163/203307 [16:03:13<214:23:41,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14164/203307 [16:03:17<214:23:32,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14164/203307 [16:03:17<214:23:32,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14165/203307 [16:03:21<214:23:24,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14165/203307 [16:03:21<214:23:24,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14166/203307 [16:03:24<214:23:15,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14166/203307 [16:03:24<214:23:15,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14167/203307 [16:03:29<214:23:14,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14167/203307 [16:03:29<214:23:14,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14168/203307 [16:03:33<214:23:14,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14168/203307 [16:03:33<214:23:14,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14169/203307 [16:03:37<214:23:13,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14169/203307 [16:03:37<214:23:13,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14170/203307 [16:03:42<214:23:13,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14170/203307 [16:03:42<214:23:13,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14171/203307 [16:03:45<214:23:02,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14171/203307 [16:03:45<214:23:03,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14172/203307 [16:03:49<214:22:53,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14172/203307 [16:03:49<214:22:54,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14173/203307 [16:03:53<214:22:44,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14173/203307 [16:03:53<214:22:44,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14174/203307 [16:03:56<214:22:35,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14174/203307 [16:03:56<214:22:35,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14175/203307 [16:04:01<214:22:34,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14175/203307 [16:04:01<214:22:34,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14176/203307 [16:04:05<214:22:34,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14176/203307 [16:04:05<214:22:34,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14177/203307 [16:04:09<214:22:32,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14177/203307 [16:04:09<214:22:32,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14178/203307 [16:04:14<214:22:32,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14178/203307 [16:04:14<214:22:32,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14179/203307 [16:04:18<214:22:29,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14179/203307 [16:04:18<214:22:29,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14180/203307 [16:04:22<214:22:19,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14180/203307 [16:04:22<214:22:19,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14181/203307 [16:04:25<214:22:10,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   7%|▋         | 14181/203307 [16:04:25<214:22:10,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14182/203307 [16:04:29<214:22:01,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14182/203307 [16:04:29<214:22:02,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14183/203307 [16:04:33<214:21:53,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14183/203307 [16:04:33<214:21:53,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14184/203307 [16:04:37<214:21:52,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14184/203307 [16:04:37<214:21:52,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14185/203307 [16:04:42<214:21:54,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14185/203307 [16:04:42<214:21:54,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14186/203307 [16:04:46<214:21:54,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14186/203307 [16:04:46<214:21:54,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14187/203307 [16:04:50<214:21:46,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14187/203307 [16:04:50<214:21:46,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14188/203307 [16:04:54<214:21:43,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14188/203307 [16:04:54<214:21:43,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14189/203307 [16:04:58<214:21:34,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14189/203307 [16:04:58<214:21:34,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14190/203307 [16:05:01<214:21:26,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14190/203307 [16:05:01<214:21:26,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14191/203307 [16:05:05<214:21:17,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14191/203307 [16:05:05<214:21:17,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14192/203307 [16:05:09<214:21:16,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14192/203307 [16:05:09<214:21:16,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14193/203307 [16:05:13<214:21:07,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14193/203307 [16:05:13<214:21:07,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14194/203307 [16:05:18<214:21:09,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14194/203307 [16:05:18<214:21:09,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14195/203307 [16:05:22<214:21:10,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14195/203307 [16:05:22<214:21:10,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14196/203307 [16:05:26<214:21:01,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14196/203307 [16:05:26<214:21:01,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14197/203307 [16:05:30<214:20:59,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14197/203307 [16:05:30<214:20:59,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14198/203307 [16:05:34<214:20:50,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14198/203307 [16:05:34<214:20:50,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14199/203307 [16:05:37<214:20:41,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14199/203307 [16:05:37<214:20:41,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14200/203307 [16:05:42<214:20:39,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14200/203307 [16:05:42<214:20:40,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14201/203307 [16:05:45<214:20:30,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   7%|▋         | 14201/203307 [16:05:45<214:20:30,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14202/203307 [16:05:50<214:20:30,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14202/203307 [16:05:50<214:20:30,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14203/203307 [16:05:54<214:20:31,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14203/203307 [16:05:54<214:20:31,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14204/203307 [16:05:58<214:20:22,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14204/203307 [16:05:58<214:20:22,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14205/203307 [16:06:02<214:20:13,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14205/203307 [16:06:02<214:20:13,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14206/203307 [16:06:06<214:20:11,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14206/203307 [16:06:06<214:20:12,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14207/203307 [16:06:10<214:20:02,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14207/203307 [16:06:10<214:20:02,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14208/203307 [16:06:13<214:19:53,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14208/203307 [16:06:13<214:19:53,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14209/203307 [16:06:18<214:19:53,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14209/203307 [16:06:18<214:19:53,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14210/203307 [16:06:21<214:19:43,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14210/203307 [16:06:21<214:19:43,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14211/203307 [16:06:26<214:19:45,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14211/203307 [16:06:26<214:19:45,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14212/203307 [16:06:30<214:19:36,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14212/203307 [16:06:30<214:19:36,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14213/203307 [16:06:33<214:19:27,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14213/203307 [16:06:33<214:19:27,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14214/203307 [16:06:37<214:19:18,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14214/203307 [16:06:37<214:19:18,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14215/203307 [16:06:41<214:19:18,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14215/203307 [16:06:41<214:19:18,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14216/203307 [16:06:45<214:19:09,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14216/203307 [16:06:45<214:19:09,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14217/203307 [16:06:49<214:19:06,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14217/203307 [16:06:49<214:19:06,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14218/203307 [16:06:53<214:18:57,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14218/203307 [16:06:53<214:18:57,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14219/203307 [16:06:57<214:18:56,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14219/203307 [16:06:57<214:18:56,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14220/203307 [16:07:02<214:18:56,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14220/203307 [16:07:02<214:18:56,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14221/203307 [16:07:05<214:18:47,  0.25it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 14221/203307 [16:07:05<214:18:47,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14222/203307 [16:07:09<214:18:38,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14222/203307 [16:07:09<214:18:38,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14223/203307 [16:07:13<214:18:30,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14223/203307 [16:07:13<214:18:30,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14224/203307 [16:07:17<214:18:28,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14224/203307 [16:07:17<214:18:29,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14225/203307 [16:07:22<214:18:28,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14225/203307 [16:07:22<214:18:28,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14226/203307 [16:07:25<214:18:20,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14226/203307 [16:07:25<214:18:20,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14227/203307 [16:07:30<214:18:18,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14227/203307 [16:07:30<214:18:18,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14228/203307 [16:07:34<214:18:19,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14228/203307 [16:07:34<214:18:19,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14229/203307 [16:07:38<214:18:11,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14229/203307 [16:07:38<214:18:11,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14230/203307 [16:07:42<214:18:03,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14230/203307 [16:07:42<214:18:03,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14231/203307 [16:07:45<214:17:55,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14231/203307 [16:07:45<214:17:55,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14232/203307 [16:07:49<214:17:46,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14232/203307 [16:07:49<214:17:46,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14233/203307 [16:07:53<214:17:44,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14233/203307 [16:07:53<214:17:44,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14234/203307 [16:07:58<214:17:44,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14234/203307 [16:07:58<214:17:44,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14235/203307 [16:08:01<214:17:34,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14235/203307 [16:08:01<214:17:35,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14236/203307 [16:08:06<214:17:38,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14236/203307 [16:08:06<214:17:38,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14237/203307 [16:08:10<214:17:38,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14237/203307 [16:08:10<214:17:38,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14238/203307 [16:08:14<214:17:29,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14238/203307 [16:08:14<214:17:29,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14239/203307 [16:08:18<214:17:23,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14239/203307 [16:08:18<214:17:23,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14240/203307 [16:08:22<214:17:15,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14240/203307 [16:08:22<214:17:15,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14241/203307 [16:08:26<214:17:06,  0.25it/s, v_num=t5e6, training/loss=0.0966]Epoch 0:   7%|▋         | 14241/203307 [16:08:26<214:17:06,  0.25it/s, v_num=t5e6, training/loss=0.086] Epoch 0:   7%|▋         | 14242/203307 [16:08:30<214:17:05,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14242/203307 [16:08:30<214:17:05,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14243/203307 [16:08:34<214:16:56,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14243/203307 [16:08:34<214:16:56,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14244/203307 [16:08:38<214:16:55,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14244/203307 [16:08:38<214:16:55,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14245/203307 [16:08:42<214:16:55,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14245/203307 [16:08:42<214:16:55,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14246/203307 [16:08:47<214:16:55,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14246/203307 [16:08:47<214:16:55,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14247/203307 [16:08:50<214:16:45,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14247/203307 [16:08:50<214:16:45,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14248/203307 [16:08:54<214:16:35,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14248/203307 [16:08:54<214:16:35,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14249/203307 [16:08:58<214:16:25,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14249/203307 [16:08:58<214:16:25,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14250/203307 [16:09:02<214:16:23,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14250/203307 [16:09:02<214:16:23,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14251/203307 [16:09:06<214:16:20,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14251/203307 [16:09:06<214:16:20,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14252/203307 [16:09:10<214:16:19,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14252/203307 [16:09:10<214:16:19,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14253/203307 [16:09:15<214:16:19,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14253/203307 [16:09:15<214:16:19,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14254/203307 [16:09:19<214:16:20,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14254/203307 [16:09:19<214:16:20,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14255/203307 [16:09:23<214:16:12,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14255/203307 [16:09:23<214:16:12,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14256/203307 [16:09:27<214:16:03,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14256/203307 [16:09:27<214:16:03,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14257/203307 [16:09:30<214:15:54,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14257/203307 [16:09:30<214:15:54,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14258/203307 [16:09:34<214:15:45,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14258/203307 [16:09:34<214:15:45,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14259/203307 [16:09:38<214:15:44,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14259/203307 [16:09:38<214:15:44,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14260/203307 [16:09:43<214:15:42,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14260/203307 [16:09:43<214:15:42,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14261/203307 [16:09:47<214:15:42,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14261/203307 [16:09:47<214:15:42,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14262/203307 [16:09:51<214:15:34,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14262/203307 [16:09:51<214:15:34,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14263/203307 [16:09:55<214:15:34,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14263/203307 [16:09:55<214:15:34,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14264/203307 [16:09:59<214:15:25,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14264/203307 [16:09:59<214:15:25,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14265/203307 [16:10:03<214:15:15,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14265/203307 [16:10:03<214:15:16,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14266/203307 [16:10:06<214:15:07,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14266/203307 [16:10:06<214:15:07,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14267/203307 [16:10:11<214:15:05,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14267/203307 [16:10:11<214:15:05,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14268/203307 [16:10:14<214:14:56,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14268/203307 [16:10:14<214:14:56,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14269/203307 [16:10:19<214:14:58,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14269/203307 [16:10:19<214:14:58,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14270/203307 [16:10:23<214:14:58,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14270/203307 [16:10:23<214:14:58,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14271/203307 [16:10:27<214:14:48,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14271/203307 [16:10:27<214:14:48,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14272/203307 [16:10:31<214:14:48,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14272/203307 [16:10:31<214:14:49,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14273/203307 [16:10:35<214:14:39,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14273/203307 [16:10:35<214:14:39,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14274/203307 [16:10:39<214:14:29,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14274/203307 [16:10:39<214:14:29,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14275/203307 [16:10:43<214:14:27,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14275/203307 [16:10:43<214:14:27,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14276/203307 [16:10:46<214:14:17,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14276/203307 [16:10:46<214:14:17,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14277/203307 [16:10:51<214:14:18,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14277/203307 [16:10:51<214:14:18,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14278/203307 [16:10:55<214:14:19,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14278/203307 [16:10:55<214:14:19,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14279/203307 [16:10:59<214:14:09,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14279/203307 [16:10:59<214:14:10,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14280/203307 [16:11:03<214:14:10,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14280/203307 [16:11:03<214:14:10,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14281/203307 [16:11:07<214:14:01,  0.25it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:   7%|▋         | 14281/203307 [16:11:07<214:14:01,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14282/203307 [16:11:11<214:13:52,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14282/203307 [16:11:11<214:13:52,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14283/203307 [16:11:15<214:13:43,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14283/203307 [16:11:15<214:13:43,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14284/203307 [16:11:19<214:13:44,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14284/203307 [16:11:19<214:13:44,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14285/203307 [16:11:23<214:13:39,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14285/203307 [16:11:23<214:13:39,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14286/203307 [16:11:28<214:13:40,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14286/203307 [16:11:28<214:13:40,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14287/203307 [16:11:32<214:13:38,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14287/203307 [16:11:32<214:13:38,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14288/203307 [16:11:36<214:13:30,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14288/203307 [16:11:36<214:13:30,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14289/203307 [16:11:40<214:13:31,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14289/203307 [16:11:40<214:13:31,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14290/203307 [16:11:44<214:13:22,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14290/203307 [16:11:44<214:13:22,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14291/203307 [16:11:47<214:13:13,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14291/203307 [16:11:47<214:13:13,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14292/203307 [16:11:52<214:13:13,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14292/203307 [16:11:52<214:13:13,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14293/203307 [16:11:55<214:13:04,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14293/203307 [16:11:55<214:13:04,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14294/203307 [16:12:00<214:13:03,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14294/203307 [16:12:00<214:13:03,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14295/203307 [16:12:04<214:13:03,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14295/203307 [16:12:04<214:13:04,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14296/203307 [16:12:08<214:13:01,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14296/203307 [16:12:08<214:13:01,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14297/203307 [16:12:12<214:12:51,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14297/203307 [16:12:12<214:12:51,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14298/203307 [16:12:17<214:12:53,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14298/203307 [16:12:17<214:12:53,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14299/203307 [16:12:20<214:12:44,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14299/203307 [16:12:20<214:12:44,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14300/203307 [16:12:25<214:12:45,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14300/203307 [16:12:25<214:12:45,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14301/203307 [16:12:28<214:12:36,  0.25it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   7%|▋         | 14301/203307 [16:12:28<214:12:36,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14302/203307 [16:12:33<214:12:34,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14302/203307 [16:12:33<214:12:34,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14303/203307 [16:12:37<214:12:34,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14303/203307 [16:12:37<214:12:34,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14304/203307 [16:12:41<214:12:25,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14304/203307 [16:12:41<214:12:25,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14305/203307 [16:12:45<214:12:22,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14305/203307 [16:12:45<214:12:22,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14306/203307 [16:12:49<214:12:21,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14306/203307 [16:12:49<214:12:21,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14307/203307 [16:12:53<214:12:12,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14307/203307 [16:12:53<214:12:12,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14308/203307 [16:12:57<214:12:03,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14308/203307 [16:12:57<214:12:03,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14309/203307 [16:13:01<214:12:01,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14309/203307 [16:13:01<214:12:01,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14310/203307 [16:13:05<214:11:51,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14310/203307 [16:13:05<214:11:51,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14311/203307 [16:13:09<214:11:52,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14311/203307 [16:13:09<214:11:52,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14312/203307 [16:13:13<214:11:43,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14312/203307 [16:13:13<214:11:43,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14313/203307 [16:13:16<214:11:33,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14313/203307 [16:13:16<214:11:33,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14314/203307 [16:13:21<214:11:31,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14314/203307 [16:13:21<214:11:31,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14315/203307 [16:13:25<214:11:32,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14315/203307 [16:13:25<214:11:32,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14316/203307 [16:13:29<214:11:22,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14316/203307 [16:13:29<214:11:22,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14317/203307 [16:13:33<214:11:20,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14317/203307 [16:13:33<214:11:20,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14318/203307 [16:13:37<214:11:11,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14318/203307 [16:13:37<214:11:11,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14319/203307 [16:13:41<214:11:10,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14319/203307 [16:13:41<214:11:10,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14320/203307 [16:13:45<214:11:10,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14320/203307 [16:13:45<214:11:10,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14321/203307 [16:13:49<214:11:01,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14321/203307 [16:13:49<214:11:01,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14322/203307 [16:13:53<214:10:50,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14322/203307 [16:13:53<214:10:50,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14323/203307 [16:13:57<214:10:48,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14323/203307 [16:13:57<214:10:48,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14324/203307 [16:14:01<214:10:48,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14324/203307 [16:14:01<214:10:48,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14325/203307 [16:14:05<214:10:45,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14325/203307 [16:14:05<214:10:45,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14326/203307 [16:14:09<214:10:36,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14326/203307 [16:14:09<214:10:36,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14327/203307 [16:14:13<214:10:34,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14327/203307 [16:14:13<214:10:34,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14328/203307 [16:14:18<214:10:34,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14328/203307 [16:14:18<214:10:34,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14329/203307 [16:14:22<214:10:26,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14329/203307 [16:14:22<214:10:26,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14330/203307 [16:14:25<214:10:17,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14330/203307 [16:14:25<214:10:17,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14331/203307 [16:14:29<214:10:09,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14331/203307 [16:14:29<214:10:09,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14332/203307 [16:14:34<214:10:10,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14332/203307 [16:14:34<214:10:10,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14333/203307 [16:14:37<214:10:02,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14333/203307 [16:14:37<214:10:02,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14334/203307 [16:14:41<214:09:59,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14334/203307 [16:14:41<214:09:59,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14335/203307 [16:14:45<214:09:50,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14335/203307 [16:14:45<214:09:50,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14336/203307 [16:14:50<214:09:50,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14336/203307 [16:14:50<214:09:50,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14337/203307 [16:14:53<214:09:41,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14337/203307 [16:14:53<214:09:41,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14338/203307 [16:14:57<214:09:31,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14338/203307 [16:14:57<214:09:31,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14339/203307 [16:15:01<214:09:23,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14339/203307 [16:15:01<214:09:23,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14340/203307 [16:15:04<214:09:14,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14340/203307 [16:15:04<214:09:14,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14341/203307 [16:15:09<214:09:14,  0.25it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:   7%|▋         | 14341/203307 [16:15:09<214:09:14,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14342/203307 [16:15:13<214:09:13,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14342/203307 [16:15:13<214:09:13,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14343/203307 [16:15:17<214:09:04,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14343/203307 [16:15:17<214:09:04,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14344/203307 [16:15:21<214:09:03,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14344/203307 [16:15:21<214:09:03,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14345/203307 [16:15:25<214:09:02,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14345/203307 [16:15:25<214:09:02,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14346/203307 [16:15:29<214:08:53,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14346/203307 [16:15:29<214:08:53,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14347/203307 [16:15:33<214:08:44,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14347/203307 [16:15:33<214:08:44,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14348/203307 [16:15:36<214:08:35,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14348/203307 [16:15:36<214:08:35,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14349/203307 [16:15:40<214:08:25,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14349/203307 [16:15:40<214:08:25,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14350/203307 [16:15:45<214:08:25,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14350/203307 [16:15:45<214:08:25,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14351/203307 [16:15:48<214:08:15,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14351/203307 [16:15:48<214:08:15,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14352/203307 [16:15:52<214:08:12,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14352/203307 [16:15:52<214:08:12,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14353/203307 [16:15:57<214:08:11,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14353/203307 [16:15:57<214:08:11,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14354/203307 [16:16:00<214:08:01,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14354/203307 [16:16:00<214:08:01,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14355/203307 [16:16:04<214:07:51,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14355/203307 [16:16:04<214:07:52,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14356/203307 [16:16:08<214:07:42,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14356/203307 [16:16:08<214:07:42,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14357/203307 [16:16:11<214:07:32,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14357/203307 [16:16:11<214:07:32,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14358/203307 [16:16:16<214:07:33,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14358/203307 [16:16:16<214:07:33,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14359/203307 [16:16:20<214:07:34,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14359/203307 [16:16:20<214:07:34,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14360/203307 [16:16:24<214:07:24,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14360/203307 [16:16:24<214:07:24,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14361/203307 [16:16:28<214:07:24,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   7%|▋         | 14361/203307 [16:16:28<214:07:24,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14362/203307 [16:16:32<214:07:16,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14362/203307 [16:16:32<214:07:16,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14363/203307 [16:16:36<214:07:08,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14363/203307 [16:16:36<214:07:08,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14364/203307 [16:16:39<214:06:59,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14364/203307 [16:16:39<214:06:59,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14365/203307 [16:16:43<214:06:51,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14365/203307 [16:16:43<214:06:51,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14366/203307 [16:16:47<214:06:41,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14366/203307 [16:16:47<214:06:41,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14367/203307 [16:16:51<214:06:44,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14367/203307 [16:16:51<214:06:44,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14368/203307 [16:16:56<214:06:42,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14368/203307 [16:16:56<214:06:43,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14369/203307 [16:17:00<214:06:41,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14369/203307 [16:17:00<214:06:41,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14370/203307 [16:17:04<214:06:41,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14370/203307 [16:17:04<214:06:41,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14371/203307 [16:17:08<214:06:33,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14371/203307 [16:17:08<214:06:33,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14372/203307 [16:17:12<214:06:24,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14372/203307 [16:17:12<214:06:24,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14373/203307 [16:17:16<214:06:16,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14373/203307 [16:17:16<214:06:16,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14374/203307 [16:17:19<214:06:08,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14374/203307 [16:17:19<214:06:08,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14375/203307 [16:17:24<214:06:06,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14375/203307 [16:17:24<214:06:06,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14376/203307 [16:17:28<214:06:07,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14376/203307 [16:17:28<214:06:07,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14377/203307 [16:17:32<214:06:05,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14377/203307 [16:17:32<214:06:05,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14378/203307 [16:17:37<214:06:06,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14378/203307 [16:17:37<214:06:06,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14379/203307 [16:17:41<214:05:58,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14379/203307 [16:17:41<214:05:58,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14380/203307 [16:17:44<214:05:49,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14380/203307 [16:17:44<214:05:49,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14381/203307 [16:17:48<214:05:41,  0.25it/s, v_num=t5e6, training/loss=0.0974]Epoch 0:   7%|▋         | 14381/203307 [16:17:48<214:05:41,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14382/203307 [16:17:52<214:05:33,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14382/203307 [16:17:52<214:05:33,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14383/203307 [16:17:56<214:05:23,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14383/203307 [16:17:56<214:05:23,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14384/203307 [16:18:00<214:05:24,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14384/203307 [16:18:00<214:05:24,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14385/203307 [16:18:04<214:05:16,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14385/203307 [16:18:04<214:05:16,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14386/203307 [16:18:08<214:05:17,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14386/203307 [16:18:08<214:05:18,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14387/203307 [16:18:12<214:05:09,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14387/203307 [16:18:12<214:05:09,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14388/203307 [16:18:16<214:05:01,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14388/203307 [16:18:16<214:05:01,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14389/203307 [16:18:20<214:04:53,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14389/203307 [16:18:20<214:04:53,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14390/203307 [16:18:23<214:04:45,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14390/203307 [16:18:23<214:04:45,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14391/203307 [16:18:27<214:04:37,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14391/203307 [16:18:27<214:04:37,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14392/203307 [16:18:31<214:04:36,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14392/203307 [16:18:31<214:04:36,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14393/203307 [16:18:36<214:04:37,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14393/203307 [16:18:36<214:04:37,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14394/203307 [16:18:40<214:04:35,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14394/203307 [16:18:40<214:04:35,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14395/203307 [16:18:45<214:04:35,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14395/203307 [16:18:45<214:04:35,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14396/203307 [16:18:48<214:04:25,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14396/203307 [16:18:48<214:04:26,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14397/203307 [16:18:52<214:04:17,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14397/203307 [16:18:52<214:04:17,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14398/203307 [16:18:56<214:04:07,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14398/203307 [16:18:56<214:04:08,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14399/203307 [16:19:00<214:04:00,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14399/203307 [16:19:00<214:04:00,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14400/203307 [16:19:04<214:03:59,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14400/203307 [16:19:04<214:03:59,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14401/203307 [16:19:07<214:03:49,  0.25it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:   7%|▋         | 14401/203307 [16:19:07<214:03:50,  0.25it/s, v_num=t5e6, training/loss=0.086] Epoch 0:   7%|▋         | 14402/203307 [16:19:12<214:03:50,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14402/203307 [16:19:12<214:03:50,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14403/203307 [16:19:16<214:03:49,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14403/203307 [16:19:16<214:03:49,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14404/203307 [16:19:20<214:03:46,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14404/203307 [16:19:20<214:03:46,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14405/203307 [16:19:24<214:03:36,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14405/203307 [16:19:24<214:03:36,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14406/203307 [16:19:28<214:03:27,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14406/203307 [16:19:28<214:03:27,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14407/203307 [16:19:31<214:03:18,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14407/203307 [16:19:31<214:03:18,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14408/203307 [16:19:35<214:03:09,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14408/203307 [16:19:35<214:03:09,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14409/203307 [16:19:39<214:03:07,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14409/203307 [16:19:39<214:03:07,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14410/203307 [16:19:44<214:03:06,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14410/203307 [16:19:44<214:03:06,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14411/203307 [16:19:48<214:03:05,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14411/203307 [16:19:48<214:03:05,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14412/203307 [16:19:52<214:02:55,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14412/203307 [16:19:52<214:02:55,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14413/203307 [16:19:56<214:02:54,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14413/203307 [16:19:56<214:02:54,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14414/203307 [16:20:00<214:02:44,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14414/203307 [16:20:00<214:02:44,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14415/203307 [16:20:03<214:02:35,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14415/203307 [16:20:03<214:02:35,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14416/203307 [16:20:07<214:02:26,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14416/203307 [16:20:07<214:02:26,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14417/203307 [16:20:11<214:02:23,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14417/203307 [16:20:11<214:02:24,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14418/203307 [16:20:15<214:02:14,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14418/203307 [16:20:15<214:02:14,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14419/203307 [16:20:19<214:02:15,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14419/203307 [16:20:19<214:02:15,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14420/203307 [16:20:24<214:02:14,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14420/203307 [16:20:24<214:02:14,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14421/203307 [16:20:27<214:02:05,  0.25it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 14421/203307 [16:20:27<214:02:05,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14422/203307 [16:20:32<214:02:04,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14422/203307 [16:20:32<214:02:04,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14423/203307 [16:20:35<214:01:54,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14423/203307 [16:20:35<214:01:55,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14424/203307 [16:20:39<214:01:46,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14424/203307 [16:20:39<214:01:46,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14425/203307 [16:20:43<214:01:45,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14425/203307 [16:20:43<214:01:45,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14426/203307 [16:20:47<214:01:35,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14426/203307 [16:20:47<214:01:35,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14427/203307 [16:20:51<214:01:34,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14427/203307 [16:20:51<214:01:34,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14428/203307 [16:20:56<214:01:35,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14428/203307 [16:20:56<214:01:35,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14429/203307 [16:20:59<214:01:26,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14429/203307 [16:20:59<214:01:26,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14430/203307 [16:21:03<214:01:16,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14430/203307 [16:21:03<214:01:16,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14431/203307 [16:21:07<214:01:15,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14431/203307 [16:21:07<214:01:15,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14432/203307 [16:21:11<214:01:05,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14432/203307 [16:21:11<214:01:05,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14433/203307 [16:21:15<214:00:56,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14433/203307 [16:21:15<214:00:56,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14434/203307 [16:21:19<214:00:55,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14434/203307 [16:21:19<214:00:55,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14435/203307 [16:21:23<214:00:47,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14435/203307 [16:21:23<214:00:47,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14436/203307 [16:21:27<214:00:49,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14436/203307 [16:21:27<214:00:49,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14437/203307 [16:21:31<214:00:42,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14437/203307 [16:21:31<214:00:42,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14438/203307 [16:21:35<214:00:34,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14438/203307 [16:21:35<214:00:34,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14439/203307 [16:21:39<214:00:26,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14439/203307 [16:21:39<214:00:26,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14440/203307 [16:21:43<214:00:25,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14440/203307 [16:21:43<214:00:25,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14441/203307 [16:21:47<214:00:16,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   7%|▋         | 14441/203307 [16:21:47<214:00:16,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14442/203307 [16:21:51<214:00:14,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14442/203307 [16:21:51<214:00:14,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14443/203307 [16:21:55<214:00:07,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14443/203307 [16:21:55<214:00:07,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14444/203307 [16:21:59<214:00:07,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14444/203307 [16:21:59<214:00:07,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14445/203307 [16:22:04<214:00:07,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14445/203307 [16:22:04<214:00:07,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14446/203307 [16:22:07<213:59:58,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14446/203307 [16:22:07<213:59:58,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14447/203307 [16:22:11<213:59:49,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14447/203307 [16:22:11<213:59:49,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14448/203307 [16:22:15<213:59:41,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14448/203307 [16:22:15<213:59:41,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14449/203307 [16:22:19<213:59:40,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14449/203307 [16:22:19<213:59:40,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14450/203307 [16:22:23<213:59:39,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14450/203307 [16:22:23<213:59:39,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14451/203307 [16:22:27<213:59:30,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14451/203307 [16:22:27<213:59:31,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14452/203307 [16:22:31<213:59:28,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14452/203307 [16:22:31<213:59:29,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14453/203307 [16:22:36<213:59:29,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14453/203307 [16:22:36<213:59:29,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14454/203307 [16:22:40<213:59:29,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14454/203307 [16:22:40<213:59:29,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14455/203307 [16:22:44<213:59:20,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14455/203307 [16:22:44<213:59:20,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14456/203307 [16:22:48<213:59:10,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14456/203307 [16:22:48<213:59:11,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14457/203307 [16:22:51<213:59:01,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14457/203307 [16:22:51<213:59:01,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14458/203307 [16:22:56<213:59:00,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14458/203307 [16:22:56<213:59:00,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14459/203307 [16:23:00<213:58:58,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14459/203307 [16:23:00<213:58:58,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14460/203307 [16:23:03<213:58:48,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14460/203307 [16:23:04<213:58:48,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14461/203307 [16:23:08<213:58:49,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   7%|▋         | 14461/203307 [16:23:08<213:58:49,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14462/203307 [16:23:12<213:58:50,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14462/203307 [16:23:12<213:58:50,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14463/203307 [16:23:16<213:58:41,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14463/203307 [16:23:16<213:58:41,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14464/203307 [16:23:20<213:58:32,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14464/203307 [16:23:20<213:58:32,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14465/203307 [16:23:24<213:58:24,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14465/203307 [16:23:24<213:58:25,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14466/203307 [16:23:27<213:58:16,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14466/203307 [16:23:27<213:58:17,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14467/203307 [16:23:32<213:58:16,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14467/203307 [16:23:32<213:58:16,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14468/203307 [16:23:36<213:58:09,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14468/203307 [16:23:36<213:58:09,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14469/203307 [16:23:40<213:58:07,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14469/203307 [16:23:40<213:58:07,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14470/203307 [16:23:44<213:58:08,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14470/203307 [16:23:44<213:58:08,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14471/203307 [16:23:49<213:58:09,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14471/203307 [16:23:49<213:58:09,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14472/203307 [16:23:53<213:58:01,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14472/203307 [16:23:53<213:58:01,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14473/203307 [16:23:56<213:57:52,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14473/203307 [16:23:56<213:57:52,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14474/203307 [16:24:00<213:57:44,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14474/203307 [16:24:00<213:57:45,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14475/203307 [16:24:04<213:57:43,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14475/203307 [16:24:04<213:57:43,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14476/203307 [16:24:09<213:57:41,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14476/203307 [16:24:09<213:57:41,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14477/203307 [16:24:13<213:57:40,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14477/203307 [16:24:13<213:57:40,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14478/203307 [16:24:17<213:57:39,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14478/203307 [16:24:17<213:57:39,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14479/203307 [16:24:21<213:57:31,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14479/203307 [16:24:21<213:57:31,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14480/203307 [16:24:25<213:57:32,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14480/203307 [16:24:25<213:57:32,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14481/203307 [16:24:29<213:57:23,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 14481/203307 [16:24:29<213:57:23,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14482/203307 [16:24:33<213:57:14,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14482/203307 [16:24:33<213:57:14,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14483/203307 [16:24:37<213:57:06,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14483/203307 [16:24:37<213:57:06,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14484/203307 [16:24:41<213:57:03,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14484/203307 [16:24:41<213:57:03,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14485/203307 [16:24:45<213:57:00,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14485/203307 [16:24:45<213:57:00,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14486/203307 [16:24:49<213:57:00,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14486/203307 [16:24:49<213:57:01,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14487/203307 [16:24:53<213:56:52,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14487/203307 [16:24:53<213:56:52,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14488/203307 [16:24:58<213:56:53,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14488/203307 [16:24:58<213:56:53,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14489/203307 [16:25:01<213:56:44,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14489/203307 [16:25:01<213:56:44,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14490/203307 [16:25:05<213:56:34,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14490/203307 [16:25:05<213:56:34,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14491/203307 [16:25:09<213:56:25,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14491/203307 [16:25:09<213:56:25,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14492/203307 [16:25:13<213:56:22,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14492/203307 [16:25:13<213:56:22,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14493/203307 [16:25:17<213:56:14,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14493/203307 [16:25:17<213:56:14,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14494/203307 [16:25:21<213:56:13,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14494/203307 [16:25:21<213:56:13,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14495/203307 [16:25:25<213:56:13,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14495/203307 [16:25:25<213:56:13,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14496/203307 [16:25:29<213:56:03,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14496/203307 [16:25:29<213:56:04,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14497/203307 [16:25:33<213:56:05,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14497/203307 [16:25:33<213:56:05,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14498/203307 [16:25:37<213:55:56,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14498/203307 [16:25:37<213:55:56,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14499/203307 [16:25:41<213:55:47,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14499/203307 [16:25:41<213:55:47,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14500/203307 [16:25:45<213:55:46,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14500/203307 [16:25:45<213:55:46,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14501/203307 [16:25:49<213:55:37,  0.25it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:   7%|▋         | 14501/203307 [16:25:49<213:55:37,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14502/203307 [16:25:53<213:55:36,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14502/203307 [16:25:53<213:55:36,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14503/203307 [16:25:58<213:55:36,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14503/203307 [16:25:58<213:55:36,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14504/203307 [16:26:01<213:55:28,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14504/203307 [16:26:01<213:55:28,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14505/203307 [16:26:05<213:55:19,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14505/203307 [16:26:05<213:55:19,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14506/203307 [16:26:10<213:55:20,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14506/203307 [16:26:10<213:55:21,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14507/203307 [16:26:13<213:55:12,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14507/203307 [16:26:13<213:55:12,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14508/203307 [16:26:17<213:55:04,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14508/203307 [16:26:17<213:55:04,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14509/203307 [16:26:21<213:55:02,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14509/203307 [16:26:21<213:55:02,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14510/203307 [16:26:25<213:54:52,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14510/203307 [16:26:25<213:54:52,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14511/203307 [16:26:29<213:54:53,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14511/203307 [16:26:29<213:54:53,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14512/203307 [16:26:34<213:54:51,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14512/203307 [16:26:34<213:54:51,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14513/203307 [16:26:37<213:54:43,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14513/203307 [16:26:37<213:54:43,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14514/203307 [16:26:42<213:54:43,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14514/203307 [16:26:42<213:54:43,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14515/203307 [16:26:46<213:54:33,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14515/203307 [16:26:46<213:54:33,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14516/203307 [16:26:49<213:54:24,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14516/203307 [16:26:49<213:54:24,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14517/203307 [16:26:54<213:54:23,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14517/203307 [16:26:54<213:54:23,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14518/203307 [16:26:57<213:54:14,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14518/203307 [16:26:57<213:54:15,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14519/203307 [16:27:02<213:54:13,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14519/203307 [16:27:02<213:54:13,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14520/203307 [16:27:06<213:54:13,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14520/203307 [16:27:06<213:54:13,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14521/203307 [16:27:10<213:54:11,  0.25it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   7%|▋         | 14521/203307 [16:27:10<213:54:11,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14522/203307 [16:27:14<213:54:02,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14522/203307 [16:27:14<213:54:02,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14523/203307 [16:27:18<213:54:03,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14523/203307 [16:27:18<213:54:03,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14524/203307 [16:27:22<213:53:55,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14524/203307 [16:27:22<213:53:55,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14525/203307 [16:27:27<213:53:55,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14525/203307 [16:27:27<213:53:55,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14526/203307 [16:27:30<213:53:47,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14526/203307 [16:27:30<213:53:47,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14527/203307 [16:27:35<213:53:46,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14527/203307 [16:27:35<213:53:46,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14528/203307 [16:27:39<213:53:46,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14528/203307 [16:27:39<213:53:46,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14529/203307 [16:27:43<213:53:37,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14529/203307 [16:27:43<213:53:37,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14530/203307 [16:27:47<213:53:35,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14530/203307 [16:27:47<213:53:35,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14531/203307 [16:27:51<213:53:26,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14531/203307 [16:27:51<213:53:26,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14532/203307 [16:27:55<213:53:28,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14532/203307 [16:27:55<213:53:28,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14533/203307 [16:27:59<213:53:19,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14533/203307 [16:27:59<213:53:19,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14534/203307 [16:28:03<213:53:17,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14534/203307 [16:28:03<213:53:17,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14535/203307 [16:28:07<213:53:07,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14535/203307 [16:28:07<213:53:07,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14536/203307 [16:28:11<213:53:07,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14536/203307 [16:28:11<213:53:07,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14537/203307 [16:28:15<213:52:58,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14537/203307 [16:28:15<213:52:59,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14538/203307 [16:28:19<213:52:49,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14538/203307 [16:28:19<213:52:50,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14539/203307 [16:28:23<213:52:47,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14539/203307 [16:28:23<213:52:47,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14540/203307 [16:28:27<213:52:48,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14540/203307 [16:28:27<213:52:48,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14541/203307 [16:28:31<213:52:39,  0.25it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:   7%|▋         | 14541/203307 [16:28:31<213:52:39,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14542/203307 [16:28:35<213:52:37,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14542/203307 [16:28:35<213:52:37,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14543/203307 [16:28:39<213:52:28,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14543/203307 [16:28:39<213:52:28,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14544/203307 [16:28:43<213:52:27,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14544/203307 [16:28:43<213:52:27,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14545/203307 [16:28:48<213:52:26,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14545/203307 [16:28:48<213:52:27,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14546/203307 [16:28:51<213:52:18,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14546/203307 [16:28:51<213:52:18,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14547/203307 [16:28:55<213:52:08,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14547/203307 [16:28:55<213:52:08,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14548/203307 [16:28:59<213:52:06,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14548/203307 [16:28:59<213:52:06,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14549/203307 [16:29:03<213:52:05,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14549/203307 [16:29:03<213:52:05,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14550/203307 [16:29:08<213:52:03,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14550/203307 [16:29:08<213:52:03,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14551/203307 [16:29:11<213:51:53,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14551/203307 [16:29:11<213:51:53,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14552/203307 [16:29:16<213:51:52,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14552/203307 [16:29:16<213:51:52,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14553/203307 [16:29:20<213:51:52,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14553/203307 [16:29:20<213:51:52,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14554/203307 [16:29:24<213:51:42,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14554/203307 [16:29:24<213:51:43,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14555/203307 [16:29:27<213:51:33,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14555/203307 [16:29:27<213:51:33,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14556/203307 [16:29:31<213:51:23,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14556/203307 [16:29:31<213:51:24,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14557/203307 [16:29:35<213:51:21,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14557/203307 [16:29:35<213:51:21,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14558/203307 [16:29:40<213:51:22,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14558/203307 [16:29:40<213:51:22,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14559/203307 [16:29:44<213:51:19,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14559/203307 [16:29:44<213:51:19,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14560/203307 [16:29:48<213:51:10,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14560/203307 [16:29:48<213:51:10,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14561/203307 [16:29:52<213:51:10,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 14561/203307 [16:29:52<213:51:10,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14562/203307 [16:29:56<213:51:01,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14562/203307 [16:29:56<213:51:01,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14563/203307 [16:29:59<213:50:52,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14563/203307 [16:29:59<213:50:52,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14564/203307 [16:30:03<213:50:42,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14564/203307 [16:30:03<213:50:42,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14565/203307 [16:30:07<213:50:33,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14565/203307 [16:30:07<213:50:33,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14566/203307 [16:30:11<213:50:34,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14566/203307 [16:30:11<213:50:34,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14567/203307 [16:30:15<213:50:32,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14567/203307 [16:30:15<213:50:33,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14568/203307 [16:30:19<213:50:25,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14568/203307 [16:30:19<213:50:25,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14569/203307 [16:30:24<213:50:24,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14569/203307 [16:30:24<213:50:24,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14570/203307 [16:30:28<213:50:24,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14570/203307 [16:30:28<213:50:24,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14571/203307 [16:30:32<213:50:15,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14571/203307 [16:30:32<213:50:15,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14572/203307 [16:30:35<213:50:06,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14572/203307 [16:30:35<213:50:06,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14573/203307 [16:30:39<213:49:57,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14573/203307 [16:30:39<213:49:57,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14574/203307 [16:30:43<213:49:49,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14574/203307 [16:30:43<213:49:50,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14575/203307 [16:30:47<213:49:51,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14575/203307 [16:30:47<213:49:51,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14576/203307 [16:30:51<213:49:42,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14576/203307 [16:30:51<213:49:42,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14577/203307 [16:30:55<213:49:39,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14577/203307 [16:30:55<213:49:39,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14578/203307 [16:31:00<213:49:40,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14578/203307 [16:31:00<213:49:40,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14579/203307 [16:31:03<213:49:30,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14579/203307 [16:31:03<213:49:30,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14580/203307 [16:31:07<213:49:20,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14580/203307 [16:31:07<213:49:20,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14581/203307 [16:31:11<213:49:12,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   7%|▋         | 14581/203307 [16:31:11<213:49:12,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14582/203307 [16:31:14<213:49:04,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14582/203307 [16:31:14<213:49:04,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14583/203307 [16:31:18<213:48:56,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14583/203307 [16:31:18<213:48:56,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14584/203307 [16:31:23<213:48:58,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14584/203307 [16:31:23<213:48:58,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14585/203307 [16:31:26<213:48:48,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14585/203307 [16:31:26<213:48:49,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14586/203307 [16:31:31<213:48:49,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14586/203307 [16:31:31<213:48:49,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14587/203307 [16:31:35<213:48:40,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14587/203307 [16:31:35<213:48:40,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14588/203307 [16:31:38<213:48:32,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14588/203307 [16:31:38<213:48:32,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14589/203307 [16:31:42<213:48:24,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14589/203307 [16:31:42<213:48:24,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14590/203307 [16:31:46<213:48:15,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14590/203307 [16:31:46<213:48:15,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14591/203307 [16:31:50<213:48:07,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14591/203307 [16:31:50<213:48:07,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14592/203307 [16:31:54<213:48:08,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14592/203307 [16:31:54<213:48:09,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14593/203307 [16:31:58<213:48:07,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14593/203307 [16:31:58<213:48:07,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14594/203307 [16:32:03<213:48:06,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14594/203307 [16:32:03<213:48:06,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14595/203307 [16:32:07<213:48:05,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14595/203307 [16:32:07<213:48:06,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14596/203307 [16:32:11<213:47:56,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14596/203307 [16:32:11<213:47:56,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14597/203307 [16:32:14<213:47:47,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14597/203307 [16:32:14<213:47:47,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14598/203307 [16:32:18<213:47:39,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14598/203307 [16:32:18<213:47:39,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14599/203307 [16:32:22<213:47:30,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14599/203307 [16:32:22<213:47:30,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14600/203307 [16:32:26<213:47:28,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14600/203307 [16:32:26<213:47:29,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14601/203307 [16:32:31<213:47:29,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14601/203307 [16:32:31<213:47:29,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14602/203307 [16:32:35<213:47:27,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14602/203307 [16:32:35<213:47:27,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14603/203307 [16:32:39<213:47:26,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14603/203307 [16:32:39<213:47:27,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14604/203307 [16:32:43<213:47:17,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14604/203307 [16:32:43<213:47:17,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14605/203307 [16:32:47<213:47:09,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14605/203307 [16:32:47<213:47:09,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14606/203307 [16:32:50<213:47:01,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14606/203307 [16:32:50<213:47:01,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14607/203307 [16:32:54<213:46:53,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14607/203307 [16:32:54<213:46:53,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14608/203307 [16:32:58<213:46:44,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14608/203307 [16:32:58<213:46:44,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14609/203307 [16:33:02<213:46:43,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14609/203307 [16:33:02<213:46:43,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14610/203307 [16:33:07<213:46:43,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14610/203307 [16:33:07<213:46:43,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14611/203307 [16:33:11<213:46:43,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14611/203307 [16:33:11<213:46:43,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14612/203307 [16:33:15<213:46:35,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14612/203307 [16:33:15<213:46:35,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14613/203307 [16:33:19<213:46:27,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14613/203307 [16:33:19<213:46:28,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14614/203307 [16:33:22<213:46:19,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14614/203307 [16:33:22<213:46:19,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14615/203307 [16:33:26<213:46:11,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14615/203307 [16:33:26<213:46:11,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14616/203307 [16:33:30<213:46:02,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14616/203307 [16:33:30<213:46:02,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14617/203307 [16:33:34<213:45:59,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14617/203307 [16:33:34<213:45:59,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14618/203307 [16:33:39<213:46:01,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14618/203307 [16:33:39<213:46:01,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14619/203307 [16:33:43<213:45:59,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14619/203307 [16:33:43<213:45:59,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14620/203307 [16:33:47<213:45:58,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14620/203307 [16:33:47<213:45:58,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14621/203307 [16:33:51<213:45:49,  0.25it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   7%|▋         | 14621/203307 [16:33:51<213:45:49,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14622/203307 [16:33:54<213:45:39,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14622/203307 [16:33:54<213:45:39,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14623/203307 [16:33:58<213:45:30,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14623/203307 [16:33:58<213:45:30,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14624/203307 [16:34:02<213:45:22,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14624/203307 [16:34:02<213:45:22,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14625/203307 [16:34:06<213:45:19,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14625/203307 [16:34:06<213:45:19,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14626/203307 [16:34:10<213:45:11,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14626/203307 [16:34:10<213:45:11,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14627/203307 [16:34:14<213:45:11,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14627/203307 [16:34:14<213:45:11,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14628/203307 [16:34:19<213:45:11,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14628/203307 [16:34:19<213:45:11,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14629/203307 [16:34:23<213:45:08,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14629/203307 [16:34:23<213:45:08,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14630/203307 [16:34:26<213:44:59,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14630/203307 [16:34:26<213:44:59,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14631/203307 [16:34:30<213:44:49,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14631/203307 [16:34:30<213:44:49,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14632/203307 [16:34:34<213:44:40,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14632/203307 [16:34:34<213:44:40,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14633/203307 [16:34:37<213:44:31,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14633/203307 [16:34:37<213:44:31,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14634/203307 [16:34:42<213:44:30,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14634/203307 [16:34:42<213:44:30,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14635/203307 [16:34:45<213:44:19,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14635/203307 [16:34:45<213:44:19,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14636/203307 [16:34:50<213:44:18,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14636/203307 [16:34:50<213:44:18,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14637/203307 [16:34:53<213:44:09,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14637/203307 [16:34:53<213:44:09,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14638/203307 [16:34:58<213:44:07,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14638/203307 [16:34:58<213:44:07,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14639/203307 [16:35:01<213:43:57,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14639/203307 [16:35:01<213:43:58,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14640/203307 [16:35:05<213:43:48,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14640/203307 [16:35:05<213:43:48,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14641/203307 [16:35:09<213:43:40,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14641/203307 [16:35:09<213:43:40,  0.25it/s, v_num=t5e6, training/loss=0.093] Epoch 0:   7%|▋         | 14642/203307 [16:35:13<213:43:38,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14642/203307 [16:35:13<213:43:38,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14643/203307 [16:35:17<213:43:29,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14643/203307 [16:35:17<213:43:29,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14644/203307 [16:35:21<213:43:30,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14644/203307 [16:35:21<213:43:30,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14645/203307 [16:35:25<213:43:30,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14645/203307 [16:35:25<213:43:30,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14646/203307 [16:35:29<213:43:21,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14646/203307 [16:35:29<213:43:21,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14647/203307 [16:35:33<213:43:18,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14647/203307 [16:35:33<213:43:18,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14648/203307 [16:35:37<213:43:09,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14648/203307 [16:35:37<213:43:10,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14649/203307 [16:35:41<213:43:00,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14649/203307 [16:35:41<213:43:00,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14650/203307 [16:35:45<213:42:59,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14650/203307 [16:35:45<213:42:59,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14651/203307 [16:35:49<213:42:51,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14651/203307 [16:35:49<213:42:51,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14652/203307 [16:35:53<213:42:49,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14652/203307 [16:35:53<213:42:49,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14653/203307 [16:35:57<213:42:49,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14653/203307 [16:35:57<213:42:50,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14654/203307 [16:36:01<213:42:40,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14654/203307 [16:36:01<213:42:40,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14655/203307 [16:36:05<213:42:31,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14655/203307 [16:36:05<213:42:31,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14656/203307 [16:36:09<213:42:29,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14656/203307 [16:36:09<213:42:29,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14657/203307 [16:36:13<213:42:19,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14657/203307 [16:36:13<213:42:19,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14658/203307 [16:36:16<213:42:10,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14658/203307 [16:36:16<213:42:10,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14659/203307 [16:36:21<213:42:10,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14659/203307 [16:36:21<213:42:10,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14660/203307 [16:36:24<213:42:01,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14660/203307 [16:36:24<213:42:02,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14661/203307 [16:36:29<213:42:02,  0.25it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   7%|▋         | 14661/203307 [16:36:29<213:42:02,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14662/203307 [16:36:33<213:42:02,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14662/203307 [16:36:33<213:42:02,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14663/203307 [16:36:37<213:41:52,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14663/203307 [16:36:37<213:41:52,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14664/203307 [16:36:41<213:41:42,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14664/203307 [16:36:41<213:41:43,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14665/203307 [16:36:45<213:41:39,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14665/203307 [16:36:45<213:41:39,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14666/203307 [16:36:48<213:41:30,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14666/203307 [16:36:48<213:41:30,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14667/203307 [16:36:53<213:41:28,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14667/203307 [16:36:53<213:41:28,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14668/203307 [16:36:56<213:41:20,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14668/203307 [16:36:56<213:41:20,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14669/203307 [16:37:01<213:41:19,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14669/203307 [16:37:01<213:41:19,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14670/203307 [16:37:05<213:41:18,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14670/203307 [16:37:05<213:41:18,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14671/203307 [16:37:09<213:41:09,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14671/203307 [16:37:09<213:41:09,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14672/203307 [16:37:12<213:41:00,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14672/203307 [16:37:12<213:41:00,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14673/203307 [16:37:16<213:40:51,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14673/203307 [16:37:16<213:40:51,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14674/203307 [16:37:20<213:40:48,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14674/203307 [16:37:20<213:40:48,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14675/203307 [16:37:25<213:40:48,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14675/203307 [16:37:25<213:40:48,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14676/203307 [16:37:28<213:40:39,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14676/203307 [16:37:28<213:40:39,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14677/203307 [16:37:33<213:40:38,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14677/203307 [16:37:33<213:40:38,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14678/203307 [16:37:37<213:40:39,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14678/203307 [16:37:37<213:40:39,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14679/203307 [16:37:42<213:40:39,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14679/203307 [16:37:42<213:40:39,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14680/203307 [16:37:45<213:40:30,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14680/203307 [16:37:45<213:40:30,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14681/203307 [16:37:49<213:40:22,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14681/203307 [16:37:49<213:40:22,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14682/203307 [16:37:53<213:40:13,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14682/203307 [16:37:53<213:40:13,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14683/203307 [16:37:57<213:40:11,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14683/203307 [16:37:57<213:40:11,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14684/203307 [16:38:01<213:40:08,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14684/203307 [16:38:01<213:40:09,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14685/203307 [16:38:05<213:39:59,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14685/203307 [16:38:05<213:40:00,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14686/203307 [16:38:09<213:40:00,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14686/203307 [16:38:09<213:40:00,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14687/203307 [16:38:13<213:39:52,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14687/203307 [16:38:13<213:39:53,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14688/203307 [16:38:18<213:39:53,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14688/203307 [16:38:18<213:39:53,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14689/203307 [16:38:21<213:39:45,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14689/203307 [16:38:21<213:39:45,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14690/203307 [16:38:25<213:39:36,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14690/203307 [16:38:25<213:39:36,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14691/203307 [16:38:29<213:39:27,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14691/203307 [16:38:29<213:39:27,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14692/203307 [16:38:33<213:39:27,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14692/203307 [16:38:33<213:39:27,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14693/203307 [16:38:37<213:39:18,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14693/203307 [16:38:37<213:39:18,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14694/203307 [16:38:41<213:39:17,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14694/203307 [16:38:41<213:39:17,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14695/203307 [16:38:46<213:39:18,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14695/203307 [16:38:46<213:39:18,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14696/203307 [16:38:50<213:39:17,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14696/203307 [16:38:50<213:39:17,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14697/203307 [16:38:54<213:39:09,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14697/203307 [16:38:54<213:39:09,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14698/203307 [16:38:57<213:39:00,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14698/203307 [16:38:57<213:39:00,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14699/203307 [16:39:01<213:38:51,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14699/203307 [16:39:01<213:38:51,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14700/203307 [16:39:05<213:38:50,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14700/203307 [16:39:05<213:38:50,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14701/203307 [16:39:10<213:38:48,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   7%|▋         | 14701/203307 [16:39:10<213:38:48,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14702/203307 [16:39:14<213:38:46,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14702/203307 [16:39:14<213:38:46,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14703/203307 [16:39:18<213:38:49,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14703/203307 [16:39:18<213:38:49,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14704/203307 [16:39:22<213:38:42,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14704/203307 [16:39:22<213:38:42,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14705/203307 [16:39:27<213:38:42,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14705/203307 [16:39:27<213:38:43,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14706/203307 [16:39:31<213:38:34,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14706/203307 [16:39:31<213:38:34,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14707/203307 [16:39:34<213:38:27,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14707/203307 [16:39:34<213:38:27,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14708/203307 [16:39:38<213:38:17,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14708/203307 [16:39:38<213:38:17,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14709/203307 [16:39:42<213:38:16,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14709/203307 [16:39:42<213:38:16,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14710/203307 [16:39:47<213:38:13,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14710/203307 [16:39:47<213:38:13,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14711/203307 [16:39:51<213:38:14,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14711/203307 [16:39:51<213:38:14,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14712/203307 [16:39:55<213:38:05,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14712/203307 [16:39:55<213:38:05,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14713/203307 [16:39:58<213:37:56,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14713/203307 [16:39:58<213:37:56,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14714/203307 [16:40:03<213:37:57,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14714/203307 [16:40:03<213:37:57,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14715/203307 [16:40:07<213:37:49,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14715/203307 [16:40:07<213:37:49,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14716/203307 [16:40:10<213:37:40,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14716/203307 [16:40:10<213:37:40,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14717/203307 [16:40:15<213:37:38,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14717/203307 [16:40:15<213:37:38,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14718/203307 [16:40:18<213:37:31,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14718/203307 [16:40:18<213:37:31,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14719/203307 [16:40:23<213:37:30,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14719/203307 [16:40:23<213:37:30,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14720/203307 [16:40:27<213:37:30,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14720/203307 [16:40:27<213:37:30,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14721/203307 [16:40:31<213:37:21,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   7%|▋         | 14721/203307 [16:40:31<213:37:21,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14722/203307 [16:40:35<213:37:20,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14722/203307 [16:40:35<213:37:20,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14723/203307 [16:40:39<213:37:12,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14723/203307 [16:40:39<213:37:12,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14724/203307 [16:40:43<213:37:04,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14724/203307 [16:40:43<213:37:04,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14725/203307 [16:40:47<213:37:02,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14725/203307 [16:40:47<213:37:02,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14726/203307 [16:40:51<213:36:53,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14726/203307 [16:40:51<213:36:53,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14727/203307 [16:40:55<213:36:51,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14727/203307 [16:40:55<213:36:52,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14728/203307 [16:40:59<213:36:51,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14728/203307 [16:40:59<213:36:51,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14729/203307 [16:41:03<213:36:42,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14729/203307 [16:41:03<213:36:42,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14730/203307 [16:41:07<213:36:33,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14730/203307 [16:41:07<213:36:33,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14731/203307 [16:41:11<213:36:35,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14731/203307 [16:41:11<213:36:35,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14732/203307 [16:41:15<213:36:25,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14732/203307 [16:41:15<213:36:25,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14733/203307 [16:41:19<213:36:18,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14733/203307 [16:41:19<213:36:18,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14734/203307 [16:41:23<213:36:17,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14734/203307 [16:41:23<213:36:17,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14735/203307 [16:41:27<213:36:08,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14735/203307 [16:41:27<213:36:08,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14736/203307 [16:41:31<213:36:09,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14736/203307 [16:41:31<213:36:09,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14737/203307 [16:41:35<213:36:08,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14737/203307 [16:41:35<213:36:08,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14738/203307 [16:41:39<213:35:59,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14738/203307 [16:41:39<213:35:59,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14739/203307 [16:41:43<213:35:50,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14739/203307 [16:41:43<213:35:50,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14740/203307 [16:41:47<213:35:52,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14740/203307 [16:41:47<213:35:52,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14741/203307 [16:41:51<213:35:43,  0.25it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:   7%|▋         | 14741/203307 [16:41:51<213:35:43,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14742/203307 [16:41:55<213:35:41,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14742/203307 [16:41:55<213:35:41,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14743/203307 [16:41:59<213:35:34,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14743/203307 [16:41:59<213:35:34,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14744/203307 [16:42:03<213:35:33,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14744/203307 [16:42:03<213:35:33,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14745/203307 [16:42:08<213:35:33,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14745/203307 [16:42:08<213:35:33,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14746/203307 [16:42:12<213:35:31,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14746/203307 [16:42:12<213:35:31,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14747/203307 [16:42:16<213:35:22,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14747/203307 [16:42:16<213:35:22,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14748/203307 [16:42:20<213:35:22,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14748/203307 [16:42:20<213:35:22,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14749/203307 [16:42:24<213:35:15,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14749/203307 [16:42:24<213:35:15,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14750/203307 [16:42:28<213:35:14,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14750/203307 [16:42:28<213:35:14,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14751/203307 [16:42:32<213:35:06,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14751/203307 [16:42:32<213:35:06,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14752/203307 [16:42:37<213:35:06,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14752/203307 [16:42:37<213:35:06,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14753/203307 [16:42:41<213:35:06,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14753/203307 [16:42:41<213:35:07,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14754/203307 [16:42:45<213:34:59,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14754/203307 [16:42:45<213:35:00,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14755/203307 [16:42:49<213:34:57,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14755/203307 [16:42:49<213:34:57,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14756/203307 [16:42:53<213:34:49,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14756/203307 [16:42:53<213:34:49,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14757/203307 [16:42:57<213:34:51,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14757/203307 [16:42:57<213:34:51,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14758/203307 [16:43:01<213:34:42,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14758/203307 [16:43:01<213:34:42,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14759/203307 [16:43:05<213:34:41,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14759/203307 [16:43:05<213:34:41,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14760/203307 [16:43:09<213:34:32,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14760/203307 [16:43:09<213:34:32,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14761/203307 [16:43:13<213:34:32,  0.25it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 14761/203307 [16:43:13<213:34:32,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14762/203307 [16:43:17<213:34:24,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14762/203307 [16:43:17<213:34:24,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14763/203307 [16:43:21<213:34:17,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14763/203307 [16:43:21<213:34:17,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14764/203307 [16:43:25<213:34:14,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14764/203307 [16:43:25<213:34:14,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14765/203307 [16:43:29<213:34:06,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14765/203307 [16:43:29<213:34:06,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14766/203307 [16:43:33<213:34:06,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14766/203307 [16:43:33<213:34:06,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14767/203307 [16:43:38<213:34:04,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14767/203307 [16:43:38<213:34:04,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14768/203307 [16:43:41<213:33:55,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14768/203307 [16:43:41<213:33:55,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14769/203307 [16:43:46<213:33:55,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14769/203307 [16:43:46<213:33:55,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14770/203307 [16:43:50<213:33:54,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14770/203307 [16:43:50<213:33:54,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14771/203307 [16:43:54<213:33:45,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14771/203307 [16:43:54<213:33:45,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14772/203307 [16:43:57<213:33:35,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14772/203307 [16:43:57<213:33:35,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14773/203307 [16:44:02<213:33:32,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14773/203307 [16:44:02<213:33:32,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14774/203307 [16:44:06<213:33:32,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14774/203307 [16:44:06<213:33:32,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14775/203307 [16:44:10<213:33:30,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14775/203307 [16:44:10<213:33:30,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14776/203307 [16:44:14<213:33:21,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14776/203307 [16:44:14<213:33:21,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14777/203307 [16:44:18<213:33:20,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14777/203307 [16:44:18<213:33:20,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14778/203307 [16:44:23<213:33:20,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14778/203307 [16:44:23<213:33:20,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14779/203307 [16:44:26<213:33:11,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14779/203307 [16:44:26<213:33:11,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14780/203307 [16:44:30<213:33:01,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14780/203307 [16:44:30<213:33:02,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14781/203307 [16:44:34<213:32:52,  0.25it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 14781/203307 [16:44:34<213:32:53,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14782/203307 [16:44:38<213:32:51,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14782/203307 [16:44:38<213:32:51,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14783/203307 [16:44:42<213:32:52,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14783/203307 [16:44:42<213:32:52,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14784/203307 [16:44:47<213:32:49,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14784/203307 [16:44:47<213:32:49,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14785/203307 [16:44:50<213:32:40,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14785/203307 [16:44:50<213:32:40,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14786/203307 [16:44:55<213:32:40,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14786/203307 [16:44:55<213:32:40,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14787/203307 [16:44:58<213:32:31,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14787/203307 [16:44:58<213:32:31,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14788/203307 [16:45:02<213:32:22,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14788/203307 [16:45:02<213:32:22,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14789/203307 [16:45:06<213:32:13,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14789/203307 [16:45:06<213:32:14,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14790/203307 [16:45:09<213:32:04,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14790/203307 [16:45:09<213:32:05,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14791/203307 [16:45:14<213:32:02,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14791/203307 [16:45:14<213:32:02,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14792/203307 [16:45:18<213:32:03,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14792/203307 [16:45:18<213:32:04,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14793/203307 [16:45:22<213:31:55,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14793/203307 [16:45:22<213:31:55,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14794/203307 [16:45:26<213:31:54,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14794/203307 [16:45:26<213:31:54,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14795/203307 [16:45:31<213:31:54,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14795/203307 [16:45:31<213:31:54,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14796/203307 [16:45:34<213:31:45,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14796/203307 [16:45:34<213:31:46,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14797/203307 [16:45:38<213:31:37,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14797/203307 [16:45:38<213:31:37,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14798/203307 [16:45:42<213:31:29,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14798/203307 [16:45:42<213:31:29,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14799/203307 [16:45:46<213:31:21,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14799/203307 [16:45:46<213:31:21,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14800/203307 [16:45:50<213:31:23,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14800/203307 [16:45:50<213:31:23,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14801/203307 [16:45:54<213:31:14,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   7%|▋         | 14801/203307 [16:45:54<213:31:15,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14802/203307 [16:45:58<213:31:13,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14802/203307 [16:45:58<213:31:13,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14803/203307 [16:46:03<213:31:13,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14803/203307 [16:46:03<213:31:13,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14804/203307 [16:46:06<213:31:04,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14804/203307 [16:46:06<213:31:05,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14805/203307 [16:46:10<213:30:59,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14805/203307 [16:46:10<213:30:59,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14806/203307 [16:46:14<213:30:54,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14806/203307 [16:46:14<213:30:54,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14807/203307 [16:46:18<213:30:47,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14807/203307 [16:46:18<213:30:47,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14808/203307 [16:46:22<213:30:41,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14808/203307 [16:46:22<213:30:41,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14809/203307 [16:46:27<213:30:48,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14809/203307 [16:46:27<213:30:48,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14810/203307 [16:46:31<213:30:38,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14810/203307 [16:46:31<213:30:38,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14811/203307 [16:46:35<213:30:39,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14811/203307 [16:46:35<213:30:39,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14812/203307 [16:46:39<213:30:33,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14812/203307 [16:46:39<213:30:33,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14813/203307 [16:46:43<213:30:25,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14813/203307 [16:46:43<213:30:25,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14814/203307 [16:46:46<213:30:16,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14814/203307 [16:46:46<213:30:16,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14815/203307 [16:46:50<213:30:07,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14815/203307 [16:46:50<213:30:07,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14816/203307 [16:46:54<213:29:58,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14816/203307 [16:46:54<213:29:58,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14817/203307 [16:46:58<213:29:57,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14817/203307 [16:46:58<213:29:57,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14818/203307 [16:47:03<213:29:58,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14818/203307 [16:47:03<213:29:58,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14819/203307 [16:47:07<213:29:56,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14819/203307 [16:47:07<213:29:56,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14820/203307 [16:47:11<213:29:55,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14820/203307 [16:47:11<213:29:56,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14821/203307 [16:47:15<213:29:46,  0.25it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   7%|▋         | 14821/203307 [16:47:15<213:29:46,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14822/203307 [16:47:19<213:29:37,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14822/203307 [16:47:19<213:29:37,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14823/203307 [16:47:22<213:29:29,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14823/203307 [16:47:22<213:29:29,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14824/203307 [16:47:26<213:29:20,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14824/203307 [16:47:26<213:29:20,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14825/203307 [16:47:30<213:29:18,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14825/203307 [16:47:30<213:29:18,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14826/203307 [16:47:35<213:29:17,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14826/203307 [16:47:35<213:29:17,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14827/203307 [16:47:39<213:29:16,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14827/203307 [16:47:39<213:29:16,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14828/203307 [16:47:43<213:29:15,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14828/203307 [16:47:43<213:29:15,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14829/203307 [16:47:47<213:29:05,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14829/203307 [16:47:47<213:29:05,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14830/203307 [16:47:50<213:28:55,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14830/203307 [16:47:50<213:28:56,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14831/203307 [16:47:54<213:28:47,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14831/203307 [16:47:54<213:28:47,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14832/203307 [16:47:58<213:28:38,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14832/203307 [16:47:58<213:28:38,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14833/203307 [16:48:02<213:28:29,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14833/203307 [16:48:02<213:28:29,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14834/203307 [16:48:06<213:28:27,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14834/203307 [16:48:06<213:28:27,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14835/203307 [16:48:10<213:28:27,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14835/203307 [16:48:10<213:28:27,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14836/203307 [16:48:15<213:28:26,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14836/203307 [16:48:15<213:28:26,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14837/203307 [16:48:18<213:28:17,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14837/203307 [16:48:18<213:28:17,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14838/203307 [16:48:22<213:28:07,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14838/203307 [16:48:22<213:28:07,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14839/203307 [16:48:26<213:27:58,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14839/203307 [16:48:26<213:27:58,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14840/203307 [16:48:29<213:27:49,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14840/203307 [16:48:29<213:27:49,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14841/203307 [16:48:33<213:27:40,  0.25it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   7%|▋         | 14841/203307 [16:48:33<213:27:40,  0.25it/s, v_num=t5e6, training/loss=0.075] Epoch 0:   7%|▋         | 14842/203307 [16:48:37<213:27:38,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14842/203307 [16:48:37<213:27:39,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14843/203307 [16:48:41<213:27:29,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14843/203307 [16:48:41<213:27:29,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14844/203307 [16:48:45<213:27:29,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14844/203307 [16:48:45<213:27:29,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14845/203307 [16:48:50<213:27:28,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14845/203307 [16:48:50<213:27:28,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14846/203307 [16:48:53<213:27:18,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14846/203307 [16:48:53<213:27:18,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14847/203307 [16:48:57<213:27:08,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14847/203307 [16:48:57<213:27:09,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14848/203307 [16:49:01<213:26:59,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14848/203307 [16:49:01<213:27:00,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14849/203307 [16:49:04<213:26:50,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14849/203307 [16:49:04<213:26:50,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14850/203307 [16:49:08<213:26:47,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14850/203307 [16:49:08<213:26:47,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14851/203307 [16:49:12<213:26:38,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14851/203307 [16:49:12<213:26:38,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14852/203307 [16:49:16<213:26:37,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14852/203307 [16:49:16<213:26:37,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14853/203307 [16:49:21<213:26:37,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14853/203307 [16:49:21<213:26:37,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14854/203307 [16:49:25<213:26:33,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14854/203307 [16:49:25<213:26:33,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14855/203307 [16:49:29<213:26:24,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14855/203307 [16:49:29<213:26:24,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14856/203307 [16:49:32<213:26:15,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14856/203307 [16:49:32<213:26:15,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14857/203307 [16:49:36<213:26:06,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14857/203307 [16:49:36<213:26:06,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14858/203307 [16:49:40<213:25:57,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14858/203307 [16:49:40<213:25:57,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14859/203307 [16:49:44<213:25:55,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14859/203307 [16:49:44<213:25:55,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14860/203307 [16:49:48<213:25:46,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14860/203307 [16:49:48<213:25:46,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14861/203307 [16:49:52<213:25:46,  0.25it/s, v_num=t5e6, training/loss=0.075]Epoch 0:   7%|▋         | 14861/203307 [16:49:52<213:25:46,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14862/203307 [16:49:56<213:25:36,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14862/203307 [16:49:56<213:25:36,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14863/203307 [16:50:00<213:25:33,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14863/203307 [16:50:00<213:25:33,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14864/203307 [16:50:03<213:25:22,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14864/203307 [16:50:03<213:25:23,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14865/203307 [16:50:07<213:25:13,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14865/203307 [16:50:07<213:25:13,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14866/203307 [16:50:11<213:25:04,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14866/203307 [16:50:11<213:25:04,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14867/203307 [16:50:15<213:25:02,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14867/203307 [16:50:15<213:25:02,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14868/203307 [16:50:19<213:24:53,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14868/203307 [16:50:19<213:24:53,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14869/203307 [16:50:23<213:24:52,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14869/203307 [16:50:23<213:24:52,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14870/203307 [16:50:27<213:24:52,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14870/203307 [16:50:27<213:24:52,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14871/203307 [16:50:31<213:24:42,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14871/203307 [16:50:31<213:24:43,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14872/203307 [16:50:35<213:24:39,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14872/203307 [16:50:35<213:24:39,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14873/203307 [16:50:39<213:24:29,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14873/203307 [16:50:39<213:24:29,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14874/203307 [16:50:42<213:24:19,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14874/203307 [16:50:42<213:24:19,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14875/203307 [16:50:47<213:24:18,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14875/203307 [16:50:47<213:24:18,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14876/203307 [16:50:50<213:24:09,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14876/203307 [16:50:50<213:24:09,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14877/203307 [16:50:54<213:24:07,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14877/203307 [16:50:54<213:24:07,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14878/203307 [16:50:59<213:24:06,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14878/203307 [16:50:59<213:24:06,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14879/203307 [16:51:02<213:23:57,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14879/203307 [16:51:02<213:23:57,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14880/203307 [16:51:06<213:23:48,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14880/203307 [16:51:06<213:23:48,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14881/203307 [16:51:10<213:23:46,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   7%|▋         | 14881/203307 [16:51:10<213:23:46,  0.25it/s, v_num=t5e6, training/loss=0.083] Epoch 0:   7%|▋         | 14882/203307 [16:51:14<213:23:37,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14882/203307 [16:51:14<213:23:37,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14883/203307 [16:51:18<213:23:28,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14883/203307 [16:51:18<213:23:28,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14884/203307 [16:51:22<213:23:26,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14884/203307 [16:51:22<213:23:26,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14885/203307 [16:51:26<213:23:16,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14885/203307 [16:51:26<213:23:16,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14886/203307 [16:51:30<213:23:16,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14886/203307 [16:51:30<213:23:16,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14887/203307 [16:51:34<213:23:16,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14887/203307 [16:51:34<213:23:16,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14888/203307 [16:51:38<213:23:06,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14888/203307 [16:51:38<213:23:06,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14889/203307 [16:51:42<213:22:57,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14889/203307 [16:51:42<213:22:57,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14890/203307 [16:51:46<213:22:54,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14890/203307 [16:51:46<213:22:54,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14891/203307 [16:51:50<213:22:45,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14891/203307 [16:51:50<213:22:45,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14892/203307 [16:51:54<213:22:43,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14892/203307 [16:51:54<213:22:43,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14893/203307 [16:51:58<213:22:34,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14893/203307 [16:51:58<213:22:34,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14894/203307 [16:52:02<213:22:32,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14894/203307 [16:52:02<213:22:33,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14895/203307 [16:52:06<213:22:32,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14895/203307 [16:52:06<213:22:32,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14896/203307 [16:52:11<213:22:32,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14896/203307 [16:52:11<213:22:32,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14897/203307 [16:52:14<213:22:23,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14897/203307 [16:52:14<213:22:23,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14898/203307 [16:52:18<213:22:14,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14898/203307 [16:52:18<213:22:14,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14899/203307 [16:52:22<213:22:11,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14899/203307 [16:52:22<213:22:11,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14900/203307 [16:52:26<213:22:09,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14900/203307 [16:52:26<213:22:09,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14901/203307 [16:52:30<213:21:59,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   7%|▋         | 14901/203307 [16:52:30<213:21:59,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14902/203307 [16:52:34<213:21:57,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14902/203307 [16:52:34<213:21:57,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14903/203307 [16:52:39<213:21:56,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14903/203307 [16:52:39<213:21:56,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14904/203307 [16:52:43<213:21:56,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14904/203307 [16:52:43<213:21:56,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14905/203307 [16:52:47<213:21:47,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14905/203307 [16:52:47<213:21:47,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14906/203307 [16:52:50<213:21:37,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14906/203307 [16:52:50<213:21:37,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14907/203307 [16:52:54<213:21:28,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14907/203307 [16:52:54<213:21:28,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14908/203307 [16:52:58<213:21:25,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14908/203307 [16:52:58<213:21:25,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14909/203307 [16:53:02<213:21:23,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14909/203307 [16:53:02<213:21:23,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14910/203307 [16:53:06<213:21:13,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14910/203307 [16:53:06<213:21:13,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14911/203307 [16:53:10<213:21:13,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14911/203307 [16:53:10<213:21:13,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14912/203307 [16:53:14<213:21:04,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14912/203307 [16:53:14<213:21:04,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14913/203307 [16:53:18<213:21:05,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14913/203307 [16:53:18<213:21:05,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14914/203307 [16:53:22<213:20:56,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14914/203307 [16:53:22<213:20:57,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14915/203307 [16:53:26<213:20:48,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14915/203307 [16:53:26<213:20:49,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14916/203307 [16:53:30<213:20:40,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14916/203307 [16:53:30<213:20:40,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14917/203307 [16:53:34<213:20:39,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14917/203307 [16:53:34<213:20:39,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14918/203307 [16:53:38<213:20:31,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14918/203307 [16:53:38<213:20:31,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14919/203307 [16:53:42<213:20:29,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14919/203307 [16:53:42<213:20:29,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14920/203307 [16:53:46<213:20:29,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14920/203307 [16:53:46<213:20:29,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14921/203307 [16:53:50<213:20:21,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   7%|▋         | 14921/203307 [16:53:50<213:20:21,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14922/203307 [16:53:55<213:20:21,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14922/203307 [16:53:55<213:20:21,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14923/203307 [16:53:58<213:20:12,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14923/203307 [16:53:58<213:20:12,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14924/203307 [16:54:02<213:20:03,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14924/203307 [16:54:02<213:20:03,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14925/203307 [16:54:06<213:20:02,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14925/203307 [16:54:06<213:20:02,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14926/203307 [16:54:10<213:19:59,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14926/203307 [16:54:10<213:19:59,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14927/203307 [16:54:15<213:19:57,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14927/203307 [16:54:15<213:19:57,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14928/203307 [16:54:19<213:19:57,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14928/203307 [16:54:19<213:19:57,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14929/203307 [16:54:23<213:19:49,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14929/203307 [16:54:23<213:19:49,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14930/203307 [16:54:27<213:19:51,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14930/203307 [16:54:27<213:19:51,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14931/203307 [16:54:31<213:19:43,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14931/203307 [16:54:31<213:19:43,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14932/203307 [16:54:35<213:19:34,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14932/203307 [16:54:35<213:19:34,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14933/203307 [16:54:39<213:19:26,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14933/203307 [16:54:39<213:19:26,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14934/203307 [16:54:43<213:19:26,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14934/203307 [16:54:43<213:19:26,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14935/203307 [16:54:47<213:19:24,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14935/203307 [16:54:47<213:19:24,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14936/203307 [16:54:52<213:19:24,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14936/203307 [16:54:52<213:19:24,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14937/203307 [16:54:55<213:19:17,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14937/203307 [16:54:55<213:19:17,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14938/203307 [16:54:59<213:19:09,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14938/203307 [16:54:59<213:19:09,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14939/203307 [16:55:04<213:19:11,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14939/203307 [16:55:04<213:19:11,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14940/203307 [16:55:08<213:19:03,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14940/203307 [16:55:08<213:19:03,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14941/203307 [16:55:11<213:18:55,  0.25it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   7%|▋         | 14941/203307 [16:55:11<213:18:55,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14942/203307 [16:55:16<213:18:54,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14942/203307 [16:55:16<213:18:54,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14943/203307 [16:55:20<213:18:47,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14943/203307 [16:55:20<213:18:47,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14944/203307 [16:55:24<213:18:46,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14944/203307 [16:55:24<213:18:47,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14945/203307 [16:55:28<213:18:47,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14945/203307 [16:55:28<213:18:47,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14946/203307 [16:55:32<213:18:38,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14946/203307 [16:55:32<213:18:38,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14947/203307 [16:55:36<213:18:30,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14947/203307 [16:55:36<213:18:30,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14948/203307 [16:55:40<213:18:31,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14948/203307 [16:55:40<213:18:31,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14949/203307 [16:55:44<213:18:22,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14949/203307 [16:55:44<213:18:22,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14950/203307 [16:55:48<213:18:20,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14950/203307 [16:55:48<213:18:20,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14951/203307 [16:55:52<213:18:11,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14951/203307 [16:55:52<213:18:11,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14952/203307 [16:55:56<213:18:10,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14952/203307 [16:55:56<213:18:10,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14953/203307 [16:56:01<213:18:10,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14953/203307 [16:56:01<213:18:10,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14954/203307 [16:56:04<213:18:03,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14954/203307 [16:56:04<213:18:03,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14955/203307 [16:56:08<213:17:54,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14955/203307 [16:56:08<213:17:54,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14956/203307 [16:56:13<213:17:55,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14956/203307 [16:56:13<213:17:56,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14957/203307 [16:56:16<213:17:46,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14957/203307 [16:56:16<213:17:47,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14958/203307 [16:56:20<213:17:38,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14958/203307 [16:56:20<213:17:38,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14959/203307 [16:56:24<213:17:37,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14959/203307 [16:56:24<213:17:37,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14960/203307 [16:56:28<213:17:28,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14960/203307 [16:56:28<213:17:28,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14961/203307 [16:56:32<213:17:28,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   7%|▋         | 14961/203307 [16:56:32<213:17:28,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14962/203307 [16:56:37<213:17:25,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14962/203307 [16:56:37<213:17:25,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14963/203307 [16:56:40<213:17:15,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14963/203307 [16:56:40<213:17:15,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14964/203307 [16:56:44<213:17:06,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14964/203307 [16:56:44<213:17:06,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14965/203307 [16:56:48<213:17:07,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14965/203307 [16:56:48<213:17:07,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14966/203307 [16:56:52<213:16:57,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14966/203307 [16:56:52<213:16:57,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14967/203307 [16:56:56<213:16:55,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14967/203307 [16:56:56<213:16:55,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14968/203307 [16:57:00<213:16:45,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14968/203307 [16:57:00<213:16:46,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14969/203307 [16:57:04<213:16:44,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14969/203307 [16:57:04<213:16:44,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14970/203307 [16:57:09<213:16:43,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14970/203307 [16:57:09<213:16:43,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14971/203307 [16:57:13<213:16:40,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14971/203307 [16:57:13<213:16:40,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14972/203307 [16:57:16<213:16:31,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14972/203307 [16:57:16<213:16:31,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14973/203307 [16:57:20<213:16:23,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14973/203307 [16:57:20<213:16:23,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14974/203307 [16:57:25<213:16:23,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14974/203307 [16:57:25<213:16:23,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14975/203307 [16:57:29<213:16:21,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14975/203307 [16:57:29<213:16:21,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14976/203307 [16:57:32<213:16:11,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14976/203307 [16:57:32<213:16:12,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14977/203307 [16:57:37<213:16:11,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14977/203307 [16:57:37<213:16:11,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14978/203307 [16:57:41<213:16:12,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14978/203307 [16:57:41<213:16:12,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14979/203307 [16:57:45<213:16:03,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14979/203307 [16:57:45<213:16:03,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14980/203307 [16:57:49<213:16:01,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14980/203307 [16:57:49<213:16:01,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14981/203307 [16:57:53<213:15:52,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   7%|▋         | 14981/203307 [16:57:53<213:15:52,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14982/203307 [16:57:57<213:15:52,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14982/203307 [16:57:57<213:15:52,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14983/203307 [16:58:01<213:15:45,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14983/203307 [16:58:01<213:15:45,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14984/203307 [16:58:05<213:15:43,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14984/203307 [16:58:05<213:15:43,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14985/203307 [16:58:09<213:15:34,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14985/203307 [16:58:09<213:15:34,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14986/203307 [16:58:14<213:15:35,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14986/203307 [16:58:14<213:15:35,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14987/203307 [16:58:17<213:15:27,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14987/203307 [16:58:17<213:15:27,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14988/203307 [16:58:21<213:15:18,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14988/203307 [16:58:21<213:15:18,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14989/203307 [16:58:25<213:15:15,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14989/203307 [16:58:25<213:15:15,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14990/203307 [16:58:29<213:15:06,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14990/203307 [16:58:29<213:15:06,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14991/203307 [16:58:33<213:15:06,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14991/203307 [16:58:33<213:15:06,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14992/203307 [16:58:37<213:15:04,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14992/203307 [16:58:37<213:15:04,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14993/203307 [16:58:41<213:14:55,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14993/203307 [16:58:41<213:14:56,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14994/203307 [16:58:45<213:14:54,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14994/203307 [16:58:45<213:14:54,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14995/203307 [16:58:50<213:14:54,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14995/203307 [16:58:50<213:14:54,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14996/203307 [16:58:54<213:14:45,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14996/203307 [16:58:54<213:14:45,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14997/203307 [16:58:57<213:14:36,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14997/203307 [16:58:57<213:14:36,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14998/203307 [16:59:01<213:14:34,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14998/203307 [16:59:01<213:14:34,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14999/203307 [16:59:05<213:14:25,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 14999/203307 [16:59:05<213:14:25,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 15000/203307 [16:59:10<213:14:26,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 15000/203307 [16:59:10<213:14:26,  0.25it/s, v_num=t5e6, training/loss=0.0875]
Validation: |          | 0/? [00:00<?, ?it/s][A
Validation:   0%|          | 0/1 [00:00<?, ?it/s][A


Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s][A[A

Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:25,  1.16it/s][A[A

Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:23,  1.17it/s][A[A

Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:22,  1.17it/s][A[A

Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:22,  1.17it/s][A[A

Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:21,  1.16it/s][A[A

Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:21,  1.16it/s][A[A

Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:20,  1.15it/s][A[A

Sampling (mamba memory):  54%|█████▍    | 108/200 [00:06<01:19,  1.15it/s][A[A

Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:18,  1.15it/s][A[A

Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:17,  1.16it/s][A[A

Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:24,  1.16it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:24,  1.17it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:23,  1.16it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:22,  1.16it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:22,  1.15it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:21,  1.15it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:20,  1.15it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:06<01:20,  1.14it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:19,  1.14it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:18,  1.14it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:17,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:26,  1.14it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:25,  1.14it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:25,  1.14it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:23,  1.14it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:22,  1.14it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:21,  1.15it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:21,  1.15it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:06<01:20,  1.15it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:19,  1.15it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:18,  1.15it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:17,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:28,  1.11it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:26,  1.13it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:25,  1.14it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:24,  1.14it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:23,  1.14it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:22,  1.14it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:22,  1.13it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:21,  1.13it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:20,  1.13it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:19,  1.13it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:18,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:28,  1.11it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:27,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:26,  1.13it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:24,  1.13it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:23,  1.13it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:22,  1.13it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:22,  1.13it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:21,  1.13it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:20,  1.13it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:19,  1.13it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:19,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:29,  1.11it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:28,  1.11it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:26,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:25,  1.12it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:25,  1.12it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:23,  1.12it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:23,  1.12it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:22,  1.12it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:21,  1.12it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:20,  1.12it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:19,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:28,  1.12it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:27,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:27,  1.11it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:25,  1.12it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:25,  1.12it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:24,  1.12it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:23,  1.12it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:22,  1.12it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:21,  1.11it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:20,  1.11it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:20,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:31,  1.08it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:29,  1.10it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:28,  1.10it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:27,  1.10it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:26,  1.10it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:24,  1.11it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:24,  1.11it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:23,  1.11it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:22,  1.11it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:09<01:21,  1.11it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:20,  1.1Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:16,  1.16it/s][A[A

Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:16,  1.16it/s][A[A

Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:15,  1.15it/s][A[A

Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:14,  1.15it/s][A[A

Sampling (mamba memory):  57%|█████▊    | 115/200 [00:12<01:14,  1.15it/s][A[A

Sampling (mamba memory):  58%|█████▊    | 116/200 [00:13<01:13,  1.15it/s][A[A

Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:12,  1.15it/s][A[A

Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:11,  1.14it/s][A[A

Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:10,  1.14it/s][A[A

Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:10,  1.14it/s][A[A

Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:09,  1.13it/s][A[A

Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:08,  1.13it/s][A[A

5it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:16,  1.15it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:15,  1.15it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:14,  1.15it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:13,  1.16it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:13<01:12,  1.15it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:12,  1.15it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:11,  1.14it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:11,  1.14it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:10,  1.13it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:09,  1.13it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:09,  1.13it/s]Sampling (mamba memory):  62%|██████▏   | 123/4it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:17,  1.14it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:16,  1.14it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:15,  1.14it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:14,  1.14it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:14,  1.13it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:13,  1.13it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:12,  1.13it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:11,  1.13it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:11,  1.12it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:10,  1.12it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:09,  1.12it/s]Sampling (mamba memory):  62%|██████▏   | 123/3it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:18,  1.13it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:17,  1.13it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:16,  1.13it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:15,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:14,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:14,  1.12it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:13,  1.12it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:12,  1.11it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:12,  1.11it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:11,  1.11it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:10,  1.10it/s]Sampling (mamba memory):  62%|██████▏   | 123/2it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:18,  1.12it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:18,  1.11it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:17,  1.11it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:16,  1.11it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:15,  1.11it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:14,  1.11it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:13,  1.11it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:13,  1.11it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:12,  1.11it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:11,  1.11it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:10,  1.10it/s]Sampling (mamba memory):  62%|██████▏   | 123/1it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:19,  1.11it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:18,  1.11it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:16,  1.12it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:16,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:15,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:14,  1.12it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:13,  1.12it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:12,  1.12it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:11,  1.12it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:10,  1.11it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:10,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 123/1it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:19,  1.11it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:18,  1.11it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:17,  1.10it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:17,  1.10it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:16,  1.10it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:15,  1.10it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:14,  1.10it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:13,  1.10it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:13,  1.09it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:12,  1.09it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:11,  1.09it/s]Sampling (mamba memory):  62%|██████▏   | 123/Sampling (mamba memory):  62%|██████▏   | 123/200 [00:20<01:08,  1.13it/s][A[A

0it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:19,  1.10it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:19,  1.10it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:18,  1.10it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:17,  1.09it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:16,  1.09it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:15,  1.09it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:15,  1.09it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:14,  1.09it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:13,  1.09it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:19<01:12,  1.08it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:20<01:12,  1.08it/s]Sampling (mamba memory):  62%|██████▏   | 123/Sampling (mamba memory):  62%|██████▏   | 124/200 [00:20<01:07,  1.13it/s][A[A

Sampling (mamba memory):  62%|██████▎   | 125/200 [00:21<01:06,  1.12it/s][A[A

Sampling (mamba memory):  63%|██████▎   | 126/200 [00:22<01:05,  1.12it/s][A[A

Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:04,  1.13it/s][A[A

Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:03,  1.13it/s][A[A

Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:02,  1.13it/s][A[A

Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:01,  1.14it/s][A[A

Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:00,  1.13it/s][A[A

Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:00,  1.13it/s][A[A

Sampling (mamba memory):  66%|██████▋   | 133/200 [00:28<00:59,  1.13it/s][A[A

Sampling (mamba memory):  67%|██████▋   | 134/200 [00:29<00:58,  1.13it/s][A[A

200 [00:20<01:08,  1.12it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:07,  1.12it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:21<01:07,  1.12it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:22<01:06,  1.11it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:05,  1.11it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:04,  1.11it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:03,  1.11it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:03,  1.11it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:02,  1.11it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:01,  1.10it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:00,  1.10it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:00,  1.10it/s]Sampling (mamba 200 [00:20<01:09,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:08,  1.12it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:07,  1.11it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:22<01:06,  1.11it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:06,  1.11it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:05,  1.11it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:04,  1.11it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:03,  1.10it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:02,  1.10it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:01,  1.10it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:01,  1.10it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:00,  1.09it/s]Sampling (mamba Sampling (mamba memory):  68%|██████▊   | 135/200 [00:30<00:57,  1.13it/s][A[A

200 [00:20<01:09,  1.10it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:08,  1.10it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:08,  1.10it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:07,  1.10it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:06,  1.10it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:05,  1.10it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:04,  1.10it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:04,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:03,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:02,  1.09it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:01,  1.08it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:01,  1.08it/s]Sampling (mamba 200 [00:20<01:09,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:08,  1.10it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:07,  1.10it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:07,  1.10it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:06,  1.10it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:05,  1.10it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:04,  1.10it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:03,  1.10it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:03,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:02,  1.09it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:01,  1.08it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:00,  1.09it/s]Sampling (mamba 200 [00:20<01:09,  1.10it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:09,  1.10it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:08,  1.09it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:07,  1.09it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:07,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:06,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:05,  1.09it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:04,  1.08it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:03,  1.08it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:03,  1.08it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:02,  1.07it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:01,  1.07it/s]Sampling (mamba 200 [00:20<01:10,  1.09it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:10,  1.08it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:09,  1.08it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:08,  1.08it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:07,  1.08it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:06,  1.08it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:06,  1.08it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:05,  1.08it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:04,  1.07it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:03,  1.07it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:02,  1.07it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<01:01,  1.07it/s]Sampling (mamba 200 [00:21<01:11,  1.08it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:10,  1.08it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:09,  1.08it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:08,  1.07it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:08,  1.07it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:07,  1.07it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:06,  1.07it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:05,  1.07it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:04,  1.06it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:04,  1.06it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:03,  1.06it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<01:02,  1.06it/s]Sampling (mamba Sampling (mamba memory):  68%|██████▊   | 136/200 [00:31<00:56,  1.13it/s][A[A

Sampling (mamba memory):  68%|██████▊   | 137/200 [00:32<00:55,  1.13it/s][A[A

Sampling (mamba memory):  69%|██████▉   | 138/200 [00:33<00:55,  1.13it/s][A[A

Sampling (mamba memory):  70%|██████▉   | 139/200 [00:34<00:54,  1.13it/s][A[A

Sampling (mamba memory):  70%|███████   | 140/200 [00:35<00:53,  1.12it/s][A[A

Sampling (mamba memory):  70%|███████   | 141/200 [00:36<00:52,  1.12it/s][A[A

Sampling (mamba memory):  71%|███████   | 142/200 [00:36<00:52,  1.11it/s][A[A

Sampling (mamba memory):  72%|███████▏  | 143/200 [00:37<00:51,  1.11it/s][A[A

Sampling (mamba memory):  72%|███████▏  | 144/200 [00:38<00:50,  1.11it/s][A[A

Sampling (mamba memory):  72%|███████▎  | 145/200 [00:39<00:49,  1.11it/s][A[A

memory):  68%|██████▊   | 135/200 [00:30<00:58,  1.10it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:31<00:57,  1.11it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:32<00:56,  1.11it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:33<00:55,  1.11it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:34<00:55,  1.10it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:35<00:54,  1.10it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:36<00:54,  1.09it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:37<00:53,  1.09it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:38<00:52,  1.09it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:51,  1.09it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:50,  1.09it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  73%|███████▎  | 146/200 [00:40<00:48,  1.11it/s][A[A

memory):  68%|██████▊   | 135/200 [00:31<00:59,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:58,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:57,  1.09it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:33<00:56,  1.09it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:34<00:56,  1.08it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:35<00:55,  1.08it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:36<00:54,  1.07it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:37<00:54,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:38<00:53,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:52,  1.07it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:51,  1.07it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:31<01:00,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:59,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:58,  1.08it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:57,  1.07it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:57,  1.07it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:56,  1.06it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:55,  1.06it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:54,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:53,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:52,  1.06it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:51,  1.06it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:31<00:59,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:59,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:58,  1.08it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:57,  1.08it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:56,  1.08it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:55,  1.07it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:55,  1.07it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:54,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:53,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:52,  1.07it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:51,  1.06it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:31<01:00,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:59,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:59,  1.06it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:58,  1.06it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:57,  1.05it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:57,  1.05it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:56,  1.05it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:55,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:54,  1.04it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:53,  1.04it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:52,  1.04it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▎  | 147/200 [00:41<00:47,  1.11it/s][A[A

memory):  68%|██████▊   | 135/200 [00:32<01:01,  1.06it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:33<01:00,  1.06it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:59,  1.06it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:58,  1.06it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:57,  1.05it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:57,  1.05it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:56,  1.05it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:55,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:54,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:53,  1.05it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:52,  1.04it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:32<01:01,  1.05it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:33<01:00,  1.05it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:34<00:59,  1.05it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:35<00:59,  1.05it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:36<00:58,  1.04it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:37<00:57,  1.04it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:38<00:56,  1.04it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:39<00:55,  1.04it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:40<00:54,  1.04it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:54,  1.04it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:53,  1.03it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▍  | 148/200 [00:42<00:47,  1.11it/s][A[A

Sampling (mamba memory):  74%|███████▍  | 149/200 [00:43<00:46,  1.10it/s][A[A

Sampling (mamba memory):  75%|███████▌  | 150/200 [00:44<00:45,  1.10it/s][A[A

Sampling (mamba memory):  76%|███████▌  | 151/200 [00:45<00:44,  1.09it/s][A[A

Sampling (mamba memory):  76%|███████▌  | 152/200 [00:46<00:43,  1.09it/s][A[A

Sampling (mamba memory):  76%|███████▋  | 153/200 [00:46<00:43,  1.09it/s][A[A

Sampling (mamba memory):  77%|███████▋  | 154/200 [00:47<00:42,  1.09it/s][A[A

Sampling (mamba memory):  78%|███████▊  | 155/200 [00:48<00:41,  1.08it/s][A[A

Sampling (mamba memory):  78%|███████▊  | 156/200 [00:49<00:40,  1.08it/s][A[A

 | 146/200 [00:41<00:49,  1.08it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:41<00:49,  1.08it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:42<00:48,  1.07it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:43<00:47,  1.07it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:44<00:46,  1.07it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:45<00:46,  1.06it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:46<00:45,  1.06it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:47<00:44,  1.06it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:48<00:43,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:49<00:42,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:50<00:41,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:51<00:40Sampling (mamba memory):  78%|███████▊  | 157/200 [00:50<00:40,  1.07it/s][A[A

 | 146/200 [00:41<00:50,  1.06it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:50,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:49,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:48,  1.06it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:47,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:46,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:45,  1.05it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:44,  1.06it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:43,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:42,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:50<00:41,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:51<00:40 | 146/200 [00:41<00:51,  1.06it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:50,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:49,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:48,  1.05it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:47,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:46,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:45,  1.05it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:44,  1.05it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:44,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:43,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:42,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:41Sampling (mamba memory):  79%|███████▉  | 158/200 [00:51<00:39,  1.07it/s][A[A

 | 146/200 [00:41<00:50,  1.06it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:50,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:49,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:48,  1.04it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:48,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:47,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:46,  1.04it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:45,  1.03it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:44,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:43,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:42,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:42 | 146/200 [00:42<00:51,  1.04it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:51,  1.04it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:50,  1.04it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:49,  1.04it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:48,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:47,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:48<00:46,  1.03it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:49<00:45,  1.03it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:50<00:44,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:51<00:43,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:42,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:42 | 146/200 [00:42<00:51,  1.04it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:50,  1.04it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:50,  1.04it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:49,  1.03it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:48,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:47,  1.03it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:48<00:46,  1.03it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:49<00:45,  1.03it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:50<00:44,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:51<00:43,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:52<00:42,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:53<00:41Sampling (mamba memory):  80%|███████▉  | 159/200 [00:52<00:38,  1.06it/s][A[A

 | 146/200 [00:42<00:52,  1.03it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:51,  1.02it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:50,  1.02it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:49,  1.02it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:49,  1.02it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:48,  1.02it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:48<00:47,  1.02it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:49<00:46,  1.01it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:50<00:45,  1.01it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:51<00:44,  1.00it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:52<00:44,  1.00s/it]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:53<00:43Sampling (mamba memory):  80%|████████  | 160/200 [00:53<00:37,  1.06it/s][A[A

Sampling (mamba memory):  80%|████████  | 161/200 [00:54<00:36,  1.06it/s][A[A

Sampling (mamba memory):  81%|████████  | 162/200 [00:55<00:35,  1.06it/s][A[A

Sampling (mamba memory):  82%|████████▏ | 163/200 [00:56<00:34,  1.06it/s][A[A

Sampling (mamba memory):  82%|████████▏ | 164/200 [00:57<00:34,  1.06it/s][A[A

Sampling (mamba memory):  82%|████████▎ | 165/200 [00:58<00:33,  1.05it/s][A[A

Sampling (mamba memory):  83%|████████▎ | 166/200 [00:59<00:32,  1.05it/s][A[A

Sampling (mamba memory):  84%|████████▎ | 167/200 [01:00<00:31,  1.05it/s][A[A

,  1.06it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:52<00:39,  1.07it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:53<00:38,  1.07it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:54<00:37,  1.07it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:55<00:36,  1.07it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:56<00:35,  1.07it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:57<00:34,  1.06it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:57<00:33,  1.06it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [00:58<00:33,  1.05it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [00:59<00:32,  1.05it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:00<00:31,  1.05it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:01<00:30,  1.04it/sSampling (mamba memory):  84%|████████▍ | 168/200 [01:01<00:30,  1.04it/s][A[A

,  1.06it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:52<00:39,  1.05it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:53<00:38,  1.05it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:54<00:37,  1.05it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:55<00:37,  1.05it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:56<00:36,  1.05it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:57<00:35,  1.05it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:58<00:34,  1.05it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [00:59<00:33,  1.05it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:00<00:32,  1.04it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:01<00:31,  1.04it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:02<00:30,  1.04it/sSampling (mamba memory):  84%|████████▍ | 169/200 [01:02<00:29,  1.04it/s][A[A

,  1.03it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:53<00:41,  1.02it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:54<00:40,  1.02it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:55<00:39,  1.02it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:56<00:38,  1.02it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:57<00:37,  1.01it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:36,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:35,  1.02it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:34,  1.01it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:33,  1.01it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:02<00:32,  1.01it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:03<00:31,  1.01it/s,  1.02it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:53<00:41,  1.02it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:54<00:40,  1.02it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:55<00:39,  1.02it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:56<00:38,  1.02it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:57<00:37,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:36,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:35,  1.02it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:34,  1.02it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:33,  1.01it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:02<00:32,  1.01it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:03<00:31,  1.01it/s,  1.02it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:53<00:41,  1.02it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:54<00:40,  1.02it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:55<00:39,  1.02it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:56<00:38,  1.02it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:57<00:37,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:36,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:35,  1.02it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:34,  1.01it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:33,  1.01it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:02<00:32,  1.01it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:03<00:31,  1.01it/sSampling (mamba memory):  85%|████████▌ | 170/200 [01:03<00:28,  1.04it/s][A[A

,  1.02it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:54<00:41,  1.02it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:55<00:40,  1.02it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:56<00:39,  1.02it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:57<00:38,  1.02it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:58<00:37,  1.01it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:59<00:36,  1.01it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:00<00:35,  1.01it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:01<00:34,  1.00it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:02<00:34,  1.00s/it]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:03<00:33,  1.00s/it]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:04<00:32,  1.00s/itSampling (mamba memory):  86%|████████▌ | 171/200 [01:04<00:27,  1.04it/s][A[A

,  1.00s/it]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:54<00:42,  1.01s/it]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:55<00:41,  1.01s/it]Sampling (mamba memory):  80%|████████  | 160/200 [00:56<00:40,  1.01s/it]Sampling (mamba memory):  80%|████████  | 161/200 [00:57<00:39,  1.01s/it]Sampling (mamba memory):  81%|████████  | 162/200 [00:58<00:38,  1.01s/it]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:59<00:37,  1.02s/it]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:00<00:36,  1.02s/it]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:01<00:35,  1.01s/it]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:03<00:34,  1.01s/it]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:04<00:33,  1.01s/it]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:05<00:32,  1.01s/itSampling (mamba memory):  86%|████████▌ | 172/200 [01:04<00:26,  1.05it/s][A[A

Sampling (mamba memory):  86%|████████▋ | 173/200 [01:05<00:25,  1.04it/s][A[A

Sampling (mamba memory):  87%|████████▋ | 174/200 [01:06<00:24,  1.04it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 175/200 [01:07<00:24,  1.04it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 176/200 [01:08<00:23,  1.04it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 177/200 [01:09<00:22,  1.04it/s][A[A

Sampling (mamba memory):  89%|████████▉ | 178/200 [01:10<00:21,  1.04it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:02<00:29,  1.04it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:03<00:28,  1.04it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:04<00:27,  1.04it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:05<00:26,  1.04it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:06<00:26,  1.04it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:07<00:25,  1.03it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:08<00:24,  1.03it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:09<00:23,  1.03it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:10<00:22,  1.03it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:11<00:21,  1.03it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:12<00:20,  1.02it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:11<00:20,  1.04it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:03<00:29,  1.04it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:04<00:28,  1.04it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:05<00:27,  1.04it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:06<00:27,  1.03it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:07<00:26,  1.03it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:08<00:25,  1.03it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:09<00:24,  1.03it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:10<00:23,  1.03it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:11<00:22,  1.03it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:12<00:21,  1.03it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:13<00:20,  1.03it/s]Sampling (mamba memory):  90%|█████████ | 180/200 [01:12<00:19,  1.04it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:04<00:30,  1.01it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:05<00:29,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:06<00:28,  1.01it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:07<00:27,  1.01it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:08<00:26,  1.01it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:09<00:25,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:10<00:24,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:11<00:23,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:12<00:22,  1.02it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:13<00:21,  1.02it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:14<00:20,  1.01it/s]]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:04<00:30,  1.01it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:05<00:29,  1.01it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:06<00:28,  1.01it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:07<00:27,  1.01it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:08<00:26,  1.01it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:09<00:25,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:10<00:24,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:11<00:23,  1.00it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:12<00:22,  1.00it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:13<00:22,  1.00s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:14<00:21,  1.00s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:13<00:18,  1.04it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:04<00:30,  1.00it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:05<00:29,  1.00it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:06<00:29,  1.00s/it]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:07<00:28,  1.00s/it]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:08<00:27,  1.00s/it]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:09<00:26,  1.00s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:10<00:25,  1.00s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:11<00:24,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:12<00:23,  1.01s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:13<00:22,  1.01s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:14<00:21,  1.02s/it]]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:05<00:31,  1.00s/it]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:06<00:30,  1.01s/it]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:07<00:29,  1.01s/it]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:08<00:28,  1.01s/it]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:09<00:27,  1.01s/it]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:10<00:26,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:11<00:25,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:12<00:24,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:13<00:23,  1.01s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:14<00:22,  1.02s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:15<00:21,  1.02s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:14<00:17,  1.04it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:06<00:31,  1.01s/it]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:07<00:30,  1.01s/it]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:08<00:29,  1.01s/it]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:09<00:28,  1.01s/it]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:10<00:27,  1.01s/it]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:11<00:26,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:12<00:25,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:13<00:24,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:14<00:23,  1.02s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:15<00:22,  1.02s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:16<00:21,  1.02s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:15<00:16,  1.03it/s][A[A

Sampling (mamba memory):  92%|█████████▏| 184/200 [01:16<00:15,  1.03it/s][A[A

Sampling (mamba memory):  92%|█████████▎| 185/200 [01:17<00:14,  1.03it/s][A[A

Sampling (mamba memory):  93%|█████████▎| 186/200 [01:18<00:13,  1.02it/s][A[A

Sampling (mamba memory):  94%|█████████▎| 187/200 [01:19<00:12,  1.02it/s][A[A

Sampling (mamba memory):  94%|█████████▍| 188/200 [01:20<00:11,  1.02it/s][A[A

Sampling (mamba memory):  94%|█████████▍| 189/200 [01:21<00:10,  1.01it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:13<00:19,  1.02it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:14<00:18,  1.02it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:15<00:17,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:16<00:16,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:17<00:15,  1.01it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:18<00:14,  1.01it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:19<00:13,  1.01it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:20<00:12,  1.01it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:21<00:11,  1.00it/s]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:22<00:10,  1.00it/s]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:23<00Sampling (mamba memory):  95%|█████████▌| 190/200 [01:22<00:09,  1.01it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:14<00:19,  1.02it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:15<00:18,  1.02it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:16<00:17,  1.02it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:17<00:16,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:18<00:15,  1.01it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:19<00:14,  1.01it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:20<00:13,  1.01it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:21<00:12,  1.01it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:22<00:11,  1.00it/s]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:23<00:10,  1.00it/s]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:24<00Sampling (mamba memory):  96%|█████████▌| 191/200 [01:23<00:08,  1.01it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:15<00:19,  1.01it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:16<00:18,  1.01it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:17<00:17,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:18<00:16,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:19<00:15,  1.00it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:20<00:15,  1.00s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:21<00:14,  1.01s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:22<00:13,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:23<00:12,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:24<00:11,  1.01s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:25<00Sampling (mamba memory):  96%|█████████▌| 192/200 [01:24<00:07,  1.01it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:15<00:20,  1.01s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:16<00:19,  1.01s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:17<00:18,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:18<00:17,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:19<00:16,  1.02s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:20<00:15,  1.02s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:21<00:14,  1.02s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:22<00:13,  1.03s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:23<00:12,  1.02s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:24<00:11,  1.03s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:25<00Sampling (mamba memory):  90%|█████████ | 180/200 [01:15<00:20,  1.02s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:16<00:19,  1.02s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:18<00:18,  1.02s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:19<00:17,  1.03s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:20<00:16,  1.03s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:21<00:15,  1.03s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:22<00:14,  1.03s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:23<00:13,  1.03s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:24<00:12,  1.03s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:25<00:11,  1.03s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:26<00Sampling (mamba memory):  96%|█████████▋| 193/200 [01:25<00:06,  1.01it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:16<00:20,  1.02s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:17<00:19,  1.03s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:18<00:18,  1.03s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:19<00:17,  1.03s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:20<00:16,  1.03s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:21<00:15,  1.04s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:22<00:14,  1.04s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:23<00:13,  1.04s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:24<00:12,  1.04s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:25<00:11,  1.04s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:26<00Sampling (mamba memory):  97%|█████████▋| 194/200 [01:26<00:05,  1.01it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:17<00:20,  1.02s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:18<00:19,  1.02s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:19<00:18,  1.03s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:20<00:17,  1.03s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:21<00:16,  1.04s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:22<00:15,  1.04s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:23<00:14,  1.04s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:24<00:13,  1.04s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:25<00:12,  1.04s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:26<00:11,  1.04s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:27<00Sampling (mamba memory):  98%|█████████▊| 195/200 [01:27<00:04,  1.01it/s][A[A

Sampling (mamba memory):  98%|█████████▊| 196/200 [01:28<00:03,  1.01it/s][A[A

Sampling (mamba memory):  98%|█████████▊| 197/200 [01:29<00:02,  1.01it/s][A[A

Sampling (mamba memory):  99%|█████████▉| 198/200 [01:30<00:01,  1.01it/s][A[A

Sampling (mamba memory): 100%|█████████▉| 199/200 [01:31<00:00,  1.00it/s][A[A

Sampling (mamba memory): 100%|██████████| 200/200 [01:32<00:00,  1.00it/s][A[ASampling (mamba memory): 100%|██████████| 200/200 [01:37<00:00,  1.03it/s]
Validation DataLoader 0:   0%|          | 0/1 [00:00<?, ?it/s][A
:09,  1.00it/s]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:24<00:08,  1.00it/s]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:25<00:08,  1.00s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:26<00:07,  1.00s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:27<00:06,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:28<00:05,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:29<00:04,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:30<00:03,  1.01s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:31<00:02,  1.01s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:32<00:01,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:33<00:00,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:38<00:00,  1.02it/s]
:09,  1.00it/s]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:25<00:08,  1.00it/s]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:26<00:08,  1.00s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:27<00:07,  1.01s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:28<00:06,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:29<00:05,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:30<00:04,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:31<00:03,  1.01s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:32<00:02,  1.01s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:33<00:01,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:34<00:00,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:38<00:00,  1.01it/s]
:10,  1.01s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:26<00:09,  1.01s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:27<00:08,  1.01s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:28<00:07,  1.01s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:29<00:06,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:30<00:05,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:31<00:04,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:32<00:03,  1.02s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:33<00:02,  1.01s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:34<00:01,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:35<00:00,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:40<00:00,  1.00s/it]
:10,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:26<00:09,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:27<00:08,  1.03s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:28<00:07,  1.03s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:29<00:06,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:30<00:05,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:31<00:04,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:32<00:03,  1.03s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:33<00:02,  1.02s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:34<00:01,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:35<00:00,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:40<00:00,  1.01s/it]
:10,  1.04s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:27<00:09,  1.04s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:28<00:08,  1.04s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:29<00:07,  1.04s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:30<00:06,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:31<00:05,  1.05s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:32<00:04,  1.05s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:33<00:03,  1.05s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:34<00:02,  1.04s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:35<00:01,  1.04s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:36<00:00,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:41<00:00,  1.01s/it]
:10,  1.05s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:27<00:09,  1.05s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:28<00:08,  1.05s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:29<00:07,  1.05s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:31<00:06,  1.05s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:32<00:05,  1.05s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:33<00:04,  1.06s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:34<00:03,  1.05s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:35<00:02,  1.05s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:36<00:01,  1.05s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:37<00:00,  1.05s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:42<00:00,  1.02s/it]
:10,  1.04s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:28<00:09,  1.04s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:29<00:08,  1.05s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:30<00:07,  1.05s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:31<00:06,  1.05s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:32<00:05,  1.05s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:33<00:04,  1.05s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:34<00:03,  1.05s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:36<00:02,  1.06s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:37<00:01,  1.06s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:38<00:00,  1.06s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:42<00:00,  1.03s/it]
Validation DataLoader 0: 100%|██████████| 1/1 [01:37<00:00,  0.01it/s][A
                                                                      [AEpoch 0:   7%|▋         | 15000/203307 [17:01:04<213:38:20,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 15001/203307 [17:01:08<213:38:21,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   7%|▋         | 15001/203307 [17:01:08<213:38:21,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15002/203307 [17:01:13<213:38:18,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15002/203307 [17:01:13<213:38:18,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15003/203307 [17:01:17<213:38:18,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15003/203307 [17:01:17<213:38:18,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15004/203307 [17:01:21<213:38:10,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15004/203307 [17:01:21<213:38:10,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15005/203307 [17:01:24<213:38:01,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15005/203307 [17:01:24<213:38:01,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15006/203307 [17:01:28<213:37:53,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15006/203307 [17:01:28<213:37:53,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15007/203307 [17:01:32<213:37:49,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15007/203307 [17:01:32<213:37:49,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15008/203307 [17:01:36<213:37:44,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15008/203307 [17:01:36<213:37:44,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15009/203307 [17:01:41<213:37:46,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15009/203307 [17:01:41<213:37:46,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15010/203307 [17:01:45<213:37:45,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15010/203307 [17:01:45<213:37:45,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15011/203307 [17:01:50<213:37:46,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15011/203307 [17:01:50<213:37:46,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15012/203307 [17:01:53<213:37:38,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15012/203307 [17:01:53<213:37:38,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15013/203307 [17:01:57<213:37:29,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15013/203307 [17:01:57<213:37:29,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15014/203307 [17:02:01<213:37:19,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15014/203307 [17:02:01<213:37:19,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15015/203307 [17:02:05<213:37:18,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15015/203307 [17:02:05<213:37:18,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15016/203307 [17:02:09<213:37:16,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15016/203307 [17:02:09<213:37:16,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15017/203307 [17:02:13<213:37:07,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15017/203307 [17:02:13<213:37:07,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15018/203307 [17:02:17<213:37:08,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15018/203307 [17:02:17<213:37:08,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15019/203307 [17:02:22<213:37:07,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15019/203307 [17:02:22<213:37:07,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15020/203307 [17:02:25<213:36:57,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15020/203307 [17:02:25<213:36:58,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15021/203307 [17:02:29<213:36:49,  0.24it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   7%|▋         | 15021/203307 [17:02:29<213:36:49,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15022/203307 [17:02:33<213:36:41,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15022/203307 [17:02:33<213:36:41,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15023/203307 [17:02:37<213:36:33,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15023/203307 [17:02:37<213:36:33,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15024/203307 [17:02:41<213:36:31,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15024/203307 [17:02:41<213:36:31,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15025/203307 [17:02:45<213:36:30,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15025/203307 [17:02:45<213:36:30,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15026/203307 [17:02:50<213:36:29,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15026/203307 [17:02:50<213:36:29,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15027/203307 [17:02:54<213:36:29,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15027/203307 [17:02:54<213:36:29,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15028/203307 [17:02:59<213:36:30,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15028/203307 [17:02:59<213:36:30,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15029/203307 [17:03:02<213:36:21,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15029/203307 [17:03:02<213:36:21,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15030/203307 [17:03:06<213:36:12,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15030/203307 [17:03:06<213:36:12,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15031/203307 [17:03:10<213:36:03,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15031/203307 [17:03:10<213:36:03,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15032/203307 [17:03:13<213:35:54,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15032/203307 [17:03:13<213:35:54,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15033/203307 [17:03:18<213:35:53,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15033/203307 [17:03:18<213:35:53,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15034/203307 [17:03:21<213:35:45,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15034/203307 [17:03:21<213:35:45,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15035/203307 [17:03:26<213:35:45,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15035/203307 [17:03:26<213:35:45,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15036/203307 [17:03:30<213:35:45,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15036/203307 [17:03:30<213:35:45,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15037/203307 [17:03:34<213:35:38,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15037/203307 [17:03:34<213:35:38,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15038/203307 [17:03:38<213:35:28,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15038/203307 [17:03:38<213:35:28,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15039/203307 [17:03:41<213:35:20,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15039/203307 [17:03:41<213:35:20,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15040/203307 [17:03:45<213:35:11,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15040/203307 [17:03:45<213:35:11,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15041/203307 [17:03:50<213:35:20,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   7%|▋         | 15041/203307 [17:03:50<213:35:20,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15042/203307 [17:03:54<213:35:07,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15042/203307 [17:03:54<213:35:07,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15043/203307 [17:03:57<213:35:00,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15043/203307 [17:03:57<213:35:00,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15044/203307 [17:04:02<213:35:01,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15044/203307 [17:04:02<213:35:01,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15045/203307 [17:04:06<213:34:53,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15045/203307 [17:04:06<213:34:53,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15046/203307 [17:04:10<213:34:45,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15046/203307 [17:04:10<213:34:45,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15047/203307 [17:04:13<213:34:38,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15047/203307 [17:04:13<213:34:38,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15048/203307 [17:04:17<213:34:30,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15048/203307 [17:04:17<213:34:30,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15049/203307 [17:04:21<213:34:21,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15049/203307 [17:04:21<213:34:21,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15050/203307 [17:04:25<213:34:21,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15050/203307 [17:04:25<213:34:21,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15051/203307 [17:04:29<213:34:12,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15051/203307 [17:04:29<213:34:12,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15052/203307 [17:04:33<213:34:12,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15052/203307 [17:04:33<213:34:12,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15053/203307 [17:04:38<213:34:13,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15053/203307 [17:04:38<213:34:13,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15054/203307 [17:04:42<213:34:04,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15054/203307 [17:04:42<213:34:04,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15055/203307 [17:04:45<213:33:56,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15055/203307 [17:04:45<213:33:56,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15056/203307 [17:04:49<213:33:48,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15056/203307 [17:04:49<213:33:48,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15057/203307 [17:04:53<213:33:42,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15057/203307 [17:04:53<213:33:42,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15058/203307 [17:04:57<213:33:42,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15058/203307 [17:04:57<213:33:42,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15059/203307 [17:05:02<213:33:39,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15059/203307 [17:05:02<213:33:40,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15060/203307 [17:05:06<213:33:36,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15060/203307 [17:05:06<213:33:36,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15061/203307 [17:05:10<213:33:37,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:   7%|▋         | 15061/203307 [17:05:10<213:33:37,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15062/203307 [17:05:14<213:33:31,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15062/203307 [17:05:14<213:33:31,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15063/203307 [17:05:18<213:33:23,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15063/203307 [17:05:18<213:33:23,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15064/203307 [17:05:22<213:33:15,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15064/203307 [17:05:22<213:33:15,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15065/203307 [17:05:26<213:33:07,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15065/203307 [17:05:26<213:33:07,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15066/203307 [17:05:30<213:33:05,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15066/203307 [17:05:30<213:33:05,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15067/203307 [17:05:33<213:32:56,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15067/203307 [17:05:33<213:32:56,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15068/203307 [17:05:37<213:32:47,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15068/203307 [17:05:37<213:32:48,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15069/203307 [17:05:42<213:32:49,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15069/203307 [17:05:42<213:32:49,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15070/203307 [17:05:46<213:32:49,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15070/203307 [17:05:46<213:32:49,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15071/203307 [17:05:50<213:32:40,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15071/203307 [17:05:50<213:32:40,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15072/203307 [17:05:54<213:32:31,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15072/203307 [17:05:54<213:32:31,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15073/203307 [17:05:57<213:32:22,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15073/203307 [17:05:57<213:32:22,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15074/203307 [17:06:01<213:32:13,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15074/203307 [17:06:01<213:32:13,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15075/203307 [17:06:05<213:32:13,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15075/203307 [17:06:05<213:32:13,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15076/203307 [17:06:09<213:32:03,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15076/203307 [17:06:09<213:32:03,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15077/203307 [17:06:13<213:32:02,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15077/203307 [17:06:13<213:32:02,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15078/203307 [17:06:18<213:32:04,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15078/203307 [17:06:18<213:32:04,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15079/203307 [17:06:22<213:31:57,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15079/203307 [17:06:22<213:31:57,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15080/203307 [17:06:25<213:31:49,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15080/203307 [17:06:25<213:31:49,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15081/203307 [17:06:29<213:31:41,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   7%|▋         | 15081/203307 [17:06:29<213:31:41,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15082/203307 [17:06:33<213:31:32,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15082/203307 [17:06:33<213:31:32,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15083/203307 [17:06:37<213:31:31,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15083/203307 [17:06:37<213:31:31,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15084/203307 [17:06:41<213:31:23,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15084/203307 [17:06:41<213:31:23,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15085/203307 [17:06:45<213:31:21,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15085/203307 [17:06:45<213:31:21,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15086/203307 [17:06:50<213:31:21,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15086/203307 [17:06:50<213:31:21,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15087/203307 [17:06:54<213:31:21,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15087/203307 [17:06:54<213:31:21,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15088/203307 [17:06:58<213:31:12,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15088/203307 [17:06:58<213:31:12,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15089/203307 [17:07:01<213:31:03,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15089/203307 [17:07:01<213:31:03,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15090/203307 [17:07:05<213:30:55,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15090/203307 [17:07:05<213:30:55,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15091/203307 [17:07:10<213:30:53,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15091/203307 [17:07:10<213:30:53,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15092/203307 [17:07:13<213:30:45,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15092/203307 [17:07:13<213:30:45,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15093/203307 [17:07:17<213:30:36,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15093/203307 [17:07:17<213:30:36,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15094/203307 [17:07:21<213:30:37,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15094/203307 [17:07:21<213:30:37,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15095/203307 [17:07:25<213:30:29,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15095/203307 [17:07:25<213:30:29,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15096/203307 [17:07:30<213:30:30,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15096/203307 [17:07:30<213:30:30,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15097/203307 [17:07:33<213:30:22,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15097/203307 [17:07:33<213:30:22,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15098/203307 [17:07:37<213:30:13,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15098/203307 [17:07:37<213:30:13,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15099/203307 [17:07:41<213:30:05,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15099/203307 [17:07:41<213:30:05,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15100/203307 [17:07:45<213:30:04,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15100/203307 [17:07:45<213:30:04,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15101/203307 [17:07:49<213:29:55,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   7%|▋         | 15101/203307 [17:07:49<213:29:55,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15102/203307 [17:07:53<213:29:54,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15102/203307 [17:07:53<213:29:54,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15103/203307 [17:07:58<213:29:53,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15103/203307 [17:07:58<213:29:54,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15104/203307 [17:08:02<213:29:53,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15104/203307 [17:08:02<213:29:53,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15105/203307 [17:08:06<213:29:49,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15105/203307 [17:08:06<213:29:49,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15106/203307 [17:08:10<213:29:41,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15106/203307 [17:08:10<213:29:41,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15107/203307 [17:08:14<213:29:33,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15107/203307 [17:08:14<213:29:33,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15108/203307 [17:08:18<213:29:33,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15108/203307 [17:08:18<213:29:33,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15109/203307 [17:08:22<213:29:25,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15109/203307 [17:08:22<213:29:25,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15110/203307 [17:08:26<213:29:25,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15110/203307 [17:08:26<213:29:25,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15111/203307 [17:08:31<213:29:25,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15111/203307 [17:08:31<213:29:25,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15112/203307 [17:08:34<213:29:17,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15112/203307 [17:08:34<213:29:17,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15113/203307 [17:08:39<213:29:19,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15113/203307 [17:08:39<213:29:19,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15114/203307 [17:08:43<213:29:16,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15114/203307 [17:08:43<213:29:16,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15115/203307 [17:08:47<213:29:08,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15115/203307 [17:08:47<213:29:08,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15116/203307 [17:08:51<213:29:06,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15116/203307 [17:08:51<213:29:06,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15117/203307 [17:08:55<213:28:57,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15117/203307 [17:08:55<213:28:57,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15118/203307 [17:08:59<213:28:48,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15118/203307 [17:08:59<213:28:48,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15119/203307 [17:09:03<213:28:49,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15119/203307 [17:09:03<213:28:49,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15120/203307 [17:09:07<213:28:41,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15120/203307 [17:09:07<213:28:41,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15121/203307 [17:09:11<213:28:34,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:   7%|▋         | 15121/203307 [17:09:11<213:28:34,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15122/203307 [17:09:15<213:28:34,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15122/203307 [17:09:15<213:28:34,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15123/203307 [17:09:19<213:28:32,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15123/203307 [17:09:19<213:28:32,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15124/203307 [17:09:23<213:28:23,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15124/203307 [17:09:23<213:28:23,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15125/203307 [17:09:27<213:28:22,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15125/203307 [17:09:27<213:28:22,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15126/203307 [17:09:31<213:28:13,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15126/203307 [17:09:31<213:28:13,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15127/203307 [17:09:35<213:28:12,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15127/203307 [17:09:35<213:28:12,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15128/203307 [17:09:40<213:28:12,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15128/203307 [17:09:40<213:28:13,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15129/203307 [17:09:43<213:28:03,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15129/203307 [17:09:44<213:28:03,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15130/203307 [17:09:48<213:28:03,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15130/203307 [17:09:48<213:28:03,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15131/203307 [17:09:52<213:27:54,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15131/203307 [17:09:52<213:27:54,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15132/203307 [17:09:56<213:27:52,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15132/203307 [17:09:56<213:27:52,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15133/203307 [17:10:00<213:27:50,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15133/203307 [17:10:00<213:27:50,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15134/203307 [17:10:04<213:27:42,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15134/203307 [17:10:04<213:27:42,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15135/203307 [17:10:08<213:27:41,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15135/203307 [17:10:08<213:27:41,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15136/203307 [17:10:13<213:27:41,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15136/203307 [17:10:13<213:27:41,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15137/203307 [17:10:16<213:27:32,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15137/203307 [17:10:16<213:27:32,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15138/203307 [17:10:20<213:27:24,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15138/203307 [17:10:20<213:27:24,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15139/203307 [17:10:25<213:27:25,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15139/203307 [17:10:25<213:27:25,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15140/203307 [17:10:28<213:27:17,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15140/203307 [17:10:28<213:27:17,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15141/203307 [17:10:33<213:27:16,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   7%|▋         | 15141/203307 [17:10:33<213:27:16,  0.24it/s, v_num=t5e6, training/loss=0.086] Epoch 0:   7%|▋         | 15142/203307 [17:10:36<213:27:07,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15142/203307 [17:10:36<213:27:07,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15143/203307 [17:10:40<213:26:58,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15143/203307 [17:10:40<213:26:58,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15144/203307 [17:10:45<213:26:59,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15144/203307 [17:10:45<213:26:59,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15145/203307 [17:10:48<213:26:50,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15145/203307 [17:10:48<213:26:50,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15146/203307 [17:10:52<213:26:41,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15146/203307 [17:10:52<213:26:42,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15147/203307 [17:10:56<213:26:32,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15147/203307 [17:10:56<213:26:32,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15148/203307 [17:11:00<213:26:33,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15148/203307 [17:11:00<213:26:33,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15149/203307 [17:11:04<213:26:24,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15149/203307 [17:11:04<213:26:24,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15150/203307 [17:11:08<213:26:22,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15150/203307 [17:11:08<213:26:22,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15151/203307 [17:11:12<213:26:13,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15151/203307 [17:11:12<213:26:13,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15152/203307 [17:11:16<213:26:13,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15152/203307 [17:11:16<213:26:13,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15153/203307 [17:11:21<213:26:13,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15153/203307 [17:11:21<213:26:13,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15154/203307 [17:11:24<213:26:04,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15154/203307 [17:11:24<213:26:05,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15155/203307 [17:11:28<213:25:55,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15155/203307 [17:11:28<213:25:55,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15156/203307 [17:11:32<213:25:56,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15156/203307 [17:11:32<213:25:56,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15157/203307 [17:11:36<213:25:49,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15157/203307 [17:11:36<213:25:49,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15158/203307 [17:11:40<213:25:46,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15158/203307 [17:11:40<213:25:47,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15159/203307 [17:11:45<213:25:43,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15159/203307 [17:11:45<213:25:43,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15160/203307 [17:11:49<213:25:40,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15160/203307 [17:11:49<213:25:40,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15161/203307 [17:11:53<213:25:39,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:   7%|▋         | 15161/203307 [17:11:53<213:25:39,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15162/203307 [17:11:57<213:25:30,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15162/203307 [17:11:57<213:25:30,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15163/203307 [17:12:00<213:25:20,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15163/203307 [17:12:00<213:25:21,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15164/203307 [17:12:04<213:25:12,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15164/203307 [17:12:04<213:25:12,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15165/203307 [17:12:09<213:25:11,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15165/203307 [17:12:09<213:25:12,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15166/203307 [17:12:13<213:25:09,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15166/203307 [17:12:13<213:25:09,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15167/203307 [17:12:16<213:24:59,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15167/203307 [17:12:16<213:24:59,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15168/203307 [17:12:21<213:24:56,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15168/203307 [17:12:21<213:24:56,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15169/203307 [17:12:25<213:24:58,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15169/203307 [17:12:25<213:24:58,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15170/203307 [17:12:29<213:24:52,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15170/203307 [17:12:29<213:24:52,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15171/203307 [17:12:33<213:24:44,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15171/203307 [17:12:33<213:24:44,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15172/203307 [17:12:37<213:24:35,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15172/203307 [17:12:37<213:24:35,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15173/203307 [17:12:40<213:24:28,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15173/203307 [17:12:40<213:24:28,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15174/203307 [17:12:45<213:24:29,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15174/203307 [17:12:45<213:24:29,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15175/203307 [17:12:49<213:24:28,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15175/203307 [17:12:49<213:24:28,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15176/203307 [17:12:53<213:24:19,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15176/203307 [17:12:53<213:24:19,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15177/203307 [17:12:57<213:24:19,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15177/203307 [17:12:57<213:24:19,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15178/203307 [17:13:02<213:24:19,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15178/203307 [17:13:02<213:24:19,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15179/203307 [17:13:05<213:24:10,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15179/203307 [17:13:05<213:24:10,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15180/203307 [17:13:09<213:24:01,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15180/203307 [17:13:09<213:24:01,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15181/203307 [17:13:13<213:23:53,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   7%|▋         | 15181/203307 [17:13:13<213:23:53,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15182/203307 [17:13:17<213:23:54,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15182/203307 [17:13:17<213:23:54,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15183/203307 [17:13:22<213:23:53,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15183/203307 [17:13:22<213:23:53,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15184/203307 [17:13:25<213:23:43,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15184/203307 [17:13:25<213:23:43,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15185/203307 [17:13:29<213:23:41,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15185/203307 [17:13:30<213:23:41,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15186/203307 [17:13:34<213:23:40,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15186/203307 [17:13:34<213:23:40,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15187/203307 [17:13:37<213:23:31,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15187/203307 [17:13:37<213:23:31,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15188/203307 [17:13:41<213:23:21,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15188/203307 [17:13:41<213:23:21,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15189/203307 [17:13:45<213:23:12,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15189/203307 [17:13:45<213:23:13,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15190/203307 [17:13:49<213:23:03,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15190/203307 [17:13:49<213:23:04,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15191/203307 [17:13:53<213:23:04,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15191/203307 [17:13:53<213:23:04,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15192/203307 [17:13:57<213:22:54,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15192/203307 [17:13:57<213:22:54,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15193/203307 [17:14:00<213:22:45,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15193/203307 [17:14:00<213:22:45,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15194/203307 [17:14:05<213:22:45,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15194/203307 [17:14:05<213:22:45,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15195/203307 [17:14:09<213:22:43,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15195/203307 [17:14:09<213:22:43,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15196/203307 [17:14:13<213:22:34,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15196/203307 [17:14:13<213:22:34,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15197/203307 [17:14:16<213:22:25,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15197/203307 [17:14:16<213:22:25,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15198/203307 [17:14:20<213:22:17,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15198/203307 [17:14:20<213:22:17,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15199/203307 [17:14:24<213:22:08,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15199/203307 [17:14:24<213:22:08,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15200/203307 [17:14:28<213:22:09,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15200/203307 [17:14:28<213:22:09,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15201/203307 [17:14:32<213:22:01,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   7%|▋         | 15201/203307 [17:14:32<213:22:01,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15202/203307 [17:14:36<213:21:58,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15202/203307 [17:14:36<213:21:59,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15203/203307 [17:14:41<213:21:57,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15203/203307 [17:14:41<213:21:58,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15204/203307 [17:14:45<213:21:54,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15204/203307 [17:14:45<213:21:55,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15205/203307 [17:14:48<213:21:45,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15205/203307 [17:14:48<213:21:45,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15206/203307 [17:14:52<213:21:37,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15206/203307 [17:14:52<213:21:37,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15207/203307 [17:14:56<213:21:28,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15207/203307 [17:14:56<213:21:28,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15208/203307 [17:15:00<213:21:29,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15208/203307 [17:15:00<213:21:29,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15209/203307 [17:15:04<213:21:20,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15209/203307 [17:15:04<213:21:20,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15210/203307 [17:15:08<213:21:18,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15210/203307 [17:15:08<213:21:18,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15211/203307 [17:15:13<213:21:17,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15211/203307 [17:15:13<213:21:18,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15212/203307 [17:15:16<213:21:09,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15212/203307 [17:15:16<213:21:09,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15213/203307 [17:15:21<213:21:06,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15213/203307 [17:15:21<213:21:06,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15214/203307 [17:15:24<213:20:58,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15214/203307 [17:15:24<213:20:58,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15215/203307 [17:15:28<213:20:49,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15215/203307 [17:15:28<213:20:49,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15216/203307 [17:15:32<213:20:48,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15216/203307 [17:15:32<213:20:49,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15217/203307 [17:15:37<213:20:49,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15217/203307 [17:15:37<213:20:49,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15218/203307 [17:15:41<213:20:41,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15218/203307 [17:15:41<213:20:41,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15219/203307 [17:15:45<213:20:42,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15219/203307 [17:15:45<213:20:42,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15220/203307 [17:15:49<213:20:34,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15220/203307 [17:15:49<213:20:34,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15221/203307 [17:15:53<213:20:26,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:   7%|▋         | 15221/203307 [17:15:53<213:20:26,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15222/203307 [17:15:57<213:20:23,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15222/203307 [17:15:57<213:20:24,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15223/203307 [17:16:01<213:20:15,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15223/203307 [17:16:01<213:20:15,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15224/203307 [17:16:04<213:20:06,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15224/203307 [17:16:04<213:20:06,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15225/203307 [17:16:09<213:20:05,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15225/203307 [17:16:09<213:20:05,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15226/203307 [17:16:13<213:20:06,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15226/203307 [17:16:13<213:20:06,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15227/203307 [17:16:17<213:20:06,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15227/203307 [17:16:17<213:20:06,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15228/203307 [17:16:22<213:20:05,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15228/203307 [17:16:22<213:20:05,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15229/203307 [17:16:26<213:19:56,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15229/203307 [17:16:26<213:19:56,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15230/203307 [17:16:29<213:19:47,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15230/203307 [17:16:29<213:19:47,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15231/203307 [17:16:33<213:19:46,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15231/203307 [17:16:33<213:19:46,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15232/203307 [17:16:37<213:19:38,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15232/203307 [17:16:37<213:19:38,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15233/203307 [17:16:41<213:19:35,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15233/203307 [17:16:42<213:19:36,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15234/203307 [17:16:46<213:19:36,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15234/203307 [17:16:46<213:19:36,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15235/203307 [17:16:50<213:19:34,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15235/203307 [17:16:50<213:19:34,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15236/203307 [17:16:55<213:19:33,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15236/203307 [17:16:55<213:19:33,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15237/203307 [17:16:58<213:19:24,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15237/203307 [17:16:58<213:19:24,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15238/203307 [17:17:02<213:19:16,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15238/203307 [17:17:02<213:19:16,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15239/203307 [17:17:06<213:19:07,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15239/203307 [17:17:06<213:19:08,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15240/203307 [17:17:10<213:19:05,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15240/203307 [17:17:10<213:19:05,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15241/203307 [17:17:14<213:19:03,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:   7%|▋         | 15241/203307 [17:17:14<213:19:03,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 15242/203307 [17:17:18<213:18:54,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 15242/203307 [17:17:18<213:18:55,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 15243/203307 [17:17:22<213:18:55,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 15243/203307 [17:17:22<213:18:55,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 15244/203307 [17:17:27<213:18:55,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 15244/203307 [17:17:27<213:18:56,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 15245/203307 [17:17:31<213:18:47,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 15245/203307 [17:17:31<213:18:47,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 15246/203307 [17:17:34<213:18:38,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 15246/203307 [17:17:34<213:18:38,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 15247/203307 [17:17:38<213:18:30,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 15247/203307 [17:17:38<213:18:30,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 15248/203307 [17:17:42<213:18:21,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   7%|▋         | 15248/203307 [17:17:42<213:18:21,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15249/203307 [17:17:46<213:18:20,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15249/203307 [17:17:46<213:18:20,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15250/203307 [17:17:50<213:18:18,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15250/203307 [17:17:50<213:18:18,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15251/203307 [17:17:54<213:18:09,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15251/203307 [17:17:54<213:18:09,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15252/203307 [17:17:58<213:18:09,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15252/203307 [17:17:58<213:18:09,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15253/203307 [17:18:03<213:18:09,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15253/203307 [17:18:03<213:18:09,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15254/203307 [17:18:06<213:18:00,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15254/203307 [17:18:06<213:18:01,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15255/203307 [17:18:10<213:17:51,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15255/203307 [17:18:10<213:17:51,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15256/203307 [17:18:14<213:17:43,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15256/203307 [17:18:14<213:17:43,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15257/203307 [17:18:18<213:17:35,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15257/203307 [17:18:18<213:17:35,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15258/203307 [17:18:22<213:17:34,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15258/203307 [17:18:22<213:17:34,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15259/203307 [17:18:26<213:17:25,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15259/203307 [17:18:26<213:17:25,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15260/203307 [17:18:30<213:17:24,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15260/203307 [17:18:30<213:17:24,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15261/203307 [17:18:34<213:17:24,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15261/203307 [17:18:34<213:17:24,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15262/203307 [17:18:38<213:17:15,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15262/203307 [17:18:38<213:17:15,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15263/203307 [17:18:42<213:17:05,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15263/203307 [17:18:42<213:17:05,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15264/203307 [17:18:46<213:16:58,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15264/203307 [17:18:46<213:16:58,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15265/203307 [17:18:49<213:16:51,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15265/203307 [17:18:49<213:16:51,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15266/203307 [17:18:54<213:16:50,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15266/203307 [17:18:54<213:16:50,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15267/203307 [17:18:58<213:16:47,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15267/203307 [17:18:58<213:16:47,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15268/203307 [17:19:02<213:16:38,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15268/203307 [17:19:02<213:16:38,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15269/203307 [17:19:06<213:16:38,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15269/203307 [17:19:06<213:16:38,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15270/203307 [17:19:10<213:16:30,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15270/203307 [17:19:10<213:16:30,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15271/203307 [17:19:13<213:16:21,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15271/203307 [17:19:13<213:16:21,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15272/203307 [17:19:17<213:16:12,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15272/203307 [17:19:17<213:16:12,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15273/203307 [17:19:21<213:16:04,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15273/203307 [17:19:21<213:16:04,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15274/203307 [17:19:25<213:15:56,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15274/203307 [17:19:25<213:15:56,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15275/203307 [17:19:29<213:15:54,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15275/203307 [17:19:29<213:15:54,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15276/203307 [17:19:33<213:15:52,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15276/203307 [17:19:33<213:15:52,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15277/203307 [17:19:37<213:15:50,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15277/203307 [17:19:37<213:15:50,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15278/203307 [17:19:42<213:15:50,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15278/203307 [17:19:42<213:15:50,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15279/203307 [17:19:46<213:15:41,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15279/203307 [17:19:46<213:15:41,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15280/203307 [17:19:49<213:15:32,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15280/203307 [17:19:49<213:15:32,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15281/203307 [17:19:53<213:15:24,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 15281/203307 [17:19:53<213:15:24,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15282/203307 [17:19:57<213:15:16,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15282/203307 [17:19:57<213:15:16,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15283/203307 [17:20:01<213:15:14,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15283/203307 [17:20:01<213:15:14,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15284/203307 [17:20:05<213:15:05,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15284/203307 [17:20:05<213:15:05,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15285/203307 [17:20:09<213:15:04,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15285/203307 [17:20:09<213:15:04,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15286/203307 [17:20:13<213:15:04,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15286/203307 [17:20:13<213:15:04,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15287/203307 [17:20:17<213:14:56,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15287/203307 [17:20:17<213:14:56,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15288/203307 [17:20:21<213:14:47,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15288/203307 [17:20:21<213:14:47,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15289/203307 [17:20:25<213:14:39,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15289/203307 [17:20:25<213:14:39,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15290/203307 [17:20:28<213:14:30,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15290/203307 [17:20:28<213:14:30,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15291/203307 [17:20:33<213:14:29,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15291/203307 [17:20:33<213:14:29,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15292/203307 [17:20:36<213:14:19,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15292/203307 [17:20:36<213:14:19,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15293/203307 [17:20:40<213:14:11,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15293/203307 [17:20:40<213:14:11,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15294/203307 [17:20:44<213:14:11,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15294/203307 [17:20:44<213:14:11,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15295/203307 [17:20:49<213:14:11,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15295/203307 [17:20:49<213:14:11,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15296/203307 [17:20:52<213:14:01,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15296/203307 [17:20:53<213:14:01,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15297/203307 [17:20:56<213:13:52,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15297/203307 [17:20:56<213:13:52,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15298/203307 [17:21:00<213:13:44,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15298/203307 [17:21:00<213:13:44,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15299/203307 [17:21:04<213:13:35,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15299/203307 [17:21:04<213:13:35,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15300/203307 [17:21:08<213:13:34,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15300/203307 [17:21:08<213:13:34,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15301/203307 [17:21:12<213:13:25,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 15301/203307 [17:21:12<213:13:25,  0.24it/s, v_num=t5e6, training/loss=0.093] Epoch 0:   8%|▊         | 15302/203307 [17:21:16<213:13:24,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15302/203307 [17:21:16<213:13:24,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15303/203307 [17:21:20<213:13:23,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15303/203307 [17:21:20<213:13:23,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15304/203307 [17:21:25<213:13:23,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15304/203307 [17:21:25<213:13:23,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15305/203307 [17:21:28<213:13:14,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15305/203307 [17:21:28<213:13:14,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15306/203307 [17:21:32<213:13:05,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15306/203307 [17:21:32<213:13:05,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15307/203307 [17:21:36<213:12:56,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15307/203307 [17:21:36<213:12:57,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15308/203307 [17:21:40<213:12:54,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15308/203307 [17:21:40<213:12:55,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15309/203307 [17:21:44<213:12:45,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15309/203307 [17:21:44<213:12:45,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15310/203307 [17:21:48<213:12:43,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15310/203307 [17:21:48<213:12:43,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15311/203307 [17:21:52<213:12:42,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15311/203307 [17:21:52<213:12:42,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15312/203307 [17:21:57<213:12:41,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15312/203307 [17:21:57<213:12:41,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15313/203307 [17:22:00<213:12:33,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15313/203307 [17:22:00<213:12:33,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15314/203307 [17:22:04<213:12:24,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15314/203307 [17:22:04<213:12:24,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15315/203307 [17:22:08<213:12:14,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15315/203307 [17:22:08<213:12:15,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15316/203307 [17:22:12<213:12:12,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15316/203307 [17:22:12<213:12:12,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15317/203307 [17:22:16<213:12:04,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15317/203307 [17:22:16<213:12:04,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15318/203307 [17:22:19<213:11:55,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15318/203307 [17:22:19<213:11:55,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15319/203307 [17:22:24<213:11:56,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15319/203307 [17:22:24<213:11:57,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15320/203307 [17:22:28<213:11:48,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15320/203307 [17:22:28<213:11:49,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15321/203307 [17:22:32<213:11:49,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:   8%|▊         | 15321/203307 [17:22:32<213:11:49,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15322/203307 [17:22:36<213:11:40,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15322/203307 [17:22:36<213:11:40,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15323/203307 [17:22:39<213:11:31,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15323/203307 [17:22:39<213:11:31,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15324/203307 [17:22:43<213:11:23,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15324/203307 [17:22:43<213:11:23,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15325/203307 [17:22:48<213:11:22,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15325/203307 [17:22:48<213:11:22,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15326/203307 [17:22:51<213:11:13,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15326/203307 [17:22:51<213:11:13,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15327/203307 [17:22:56<213:11:12,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15327/203307 [17:22:56<213:11:12,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15328/203307 [17:23:00<213:11:12,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15328/203307 [17:23:00<213:11:12,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15329/203307 [17:23:04<213:11:03,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15329/203307 [17:23:04<213:11:03,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15330/203307 [17:23:08<213:11:03,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15330/203307 [17:23:08<213:11:03,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15331/203307 [17:23:12<213:10:55,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15331/203307 [17:23:12<213:10:55,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15332/203307 [17:23:16<213:10:47,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15332/203307 [17:23:16<213:10:47,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15333/203307 [17:23:20<213:10:45,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15333/203307 [17:23:20<213:10:45,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15334/203307 [17:23:24<213:10:36,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15334/203307 [17:23:24<213:10:36,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15335/203307 [17:23:28<213:10:34,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15335/203307 [17:23:28<213:10:34,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15336/203307 [17:23:32<213:10:34,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15336/203307 [17:23:32<213:10:34,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15337/203307 [17:23:36<213:10:26,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15337/203307 [17:23:36<213:10:26,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15338/203307 [17:23:40<213:10:26,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15338/203307 [17:23:40<213:10:26,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15339/203307 [17:23:44<213:10:22,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15339/203307 [17:23:44<213:10:22,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15340/203307 [17:23:48<213:10:12,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15340/203307 [17:23:48<213:10:12,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15341/203307 [17:23:52<213:10:11,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:   8%|▊         | 15341/203307 [17:23:52<213:10:11,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15342/203307 [17:23:56<213:10:02,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15342/203307 [17:23:56<213:10:02,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15343/203307 [17:24:00<213:09:52,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15343/203307 [17:24:00<213:09:52,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15344/203307 [17:24:04<213:09:52,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15344/203307 [17:24:04<213:09:52,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15345/203307 [17:24:08<213:09:43,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15345/203307 [17:24:08<213:09:43,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15346/203307 [17:24:11<213:09:34,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15346/203307 [17:24:11<213:09:34,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15347/203307 [17:24:16<213:09:36,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15347/203307 [17:24:16<213:09:37,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15348/203307 [17:24:20<213:09:34,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15348/203307 [17:24:20<213:09:34,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15349/203307 [17:24:24<213:09:25,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15349/203307 [17:24:24<213:09:25,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15350/203307 [17:24:28<213:09:24,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15350/203307 [17:24:28<213:09:24,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15351/203307 [17:24:32<213:09:16,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15351/203307 [17:24:32<213:09:16,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15352/203307 [17:24:36<213:09:14,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15352/203307 [17:24:36<213:09:14,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15353/203307 [17:24:41<213:09:14,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15353/203307 [17:24:41<213:09:14,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15354/203307 [17:24:44<213:09:05,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15354/203307 [17:24:44<213:09:05,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15355/203307 [17:24:48<213:08:55,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15355/203307 [17:24:48<213:08:56,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15356/203307 [17:24:53<213:08:56,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15356/203307 [17:24:53<213:08:57,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15357/203307 [17:24:57<213:08:54,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15357/203307 [17:24:57<213:08:54,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15358/203307 [17:25:01<213:08:52,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15358/203307 [17:25:01<213:08:52,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15359/203307 [17:25:05<213:08:43,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15359/203307 [17:25:05<213:08:43,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15360/203307 [17:25:09<213:08:42,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15360/203307 [17:25:09<213:08:42,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15361/203307 [17:25:13<213:08:41,  0.24it/s, v_num=t5e6, training/loss=0.0968]Epoch 0:   8%|▊         | 15361/203307 [17:25:13<213:08:41,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15362/203307 [17:25:17<213:08:33,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15362/203307 [17:25:17<213:08:33,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15363/203307 [17:25:21<213:08:26,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15363/203307 [17:25:21<213:08:26,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15364/203307 [17:25:25<213:08:26,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15364/203307 [17:25:25<213:08:26,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15365/203307 [17:25:30<213:08:26,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15365/203307 [17:25:30<213:08:26,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15366/203307 [17:25:34<213:08:20,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15366/203307 [17:25:34<213:08:21,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15367/203307 [17:25:37<213:08:11,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15367/203307 [17:25:37<213:08:11,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15368/203307 [17:25:41<213:08:02,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15368/203307 [17:25:41<213:08:02,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15369/203307 [17:25:46<213:08:03,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15369/203307 [17:25:46<213:08:03,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15370/203307 [17:25:49<213:07:54,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15370/203307 [17:25:49<213:07:55,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15371/203307 [17:25:53<213:07:45,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15371/203307 [17:25:53<213:07:45,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15372/203307 [17:25:57<213:07:36,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15372/203307 [17:25:57<213:07:36,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15373/203307 [17:26:01<213:07:37,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15373/203307 [17:26:01<213:07:37,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15374/203307 [17:26:05<213:07:35,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15374/203307 [17:26:05<213:07:35,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15375/203307 [17:26:10<213:07:33,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15375/203307 [17:26:10<213:07:33,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15376/203307 [17:26:13<213:07:25,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15376/203307 [17:26:13<213:07:25,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15377/203307 [17:26:18<213:07:23,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15377/203307 [17:26:18<213:07:23,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15378/203307 [17:26:22<213:07:23,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15378/203307 [17:26:22<213:07:23,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15379/203307 [17:26:26<213:07:13,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15379/203307 [17:26:26<213:07:13,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15380/203307 [17:26:29<213:07:04,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15380/203307 [17:26:29<213:07:04,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15381/203307 [17:26:33<213:06:54,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:   8%|▊         | 15381/203307 [17:26:33<213:06:55,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15382/203307 [17:26:37<213:06:55,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15382/203307 [17:26:37<213:06:55,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15383/203307 [17:26:42<213:06:53,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15383/203307 [17:26:42<213:06:53,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15384/203307 [17:26:45<213:06:43,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15384/203307 [17:26:45<213:06:43,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15385/203307 [17:26:50<213:06:41,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15385/203307 [17:26:50<213:06:41,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15386/203307 [17:26:54<213:06:42,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15386/203307 [17:26:54<213:06:42,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15387/203307 [17:26:58<213:06:33,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15387/203307 [17:26:58<213:06:33,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15388/203307 [17:27:02<213:06:26,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15388/203307 [17:27:02<213:06:26,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15389/203307 [17:27:05<213:06:17,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15389/203307 [17:27:05<213:06:17,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15390/203307 [17:27:10<213:06:17,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15390/203307 [17:27:10<213:06:17,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15391/203307 [17:27:14<213:06:15,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15391/203307 [17:27:14<213:06:15,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15392/203307 [17:27:18<213:06:07,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15392/203307 [17:27:18<213:06:07,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15393/203307 [17:27:22<213:06:04,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15393/203307 [17:27:22<213:06:04,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15394/203307 [17:27:26<213:06:04,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15394/203307 [17:27:26<213:06:04,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15395/203307 [17:27:30<213:05:56,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15395/203307 [17:27:30<213:05:56,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15396/203307 [17:27:34<213:05:47,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15396/203307 [17:27:34<213:05:47,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15397/203307 [17:27:37<213:05:38,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15397/203307 [17:27:37<213:05:38,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15398/203307 [17:27:41<213:05:29,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15398/203307 [17:27:41<213:05:29,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15399/203307 [17:27:46<213:05:31,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15399/203307 [17:27:46<213:05:31,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15400/203307 [17:27:50<213:05:29,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15400/203307 [17:27:50<213:05:29,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15401/203307 [17:27:54<213:05:26,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   8%|▊         | 15401/203307 [17:27:54<213:05:26,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15402/203307 [17:27:58<213:05:25,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15402/203307 [17:27:58<213:05:25,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15403/203307 [17:28:03<213:05:23,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15403/203307 [17:28:03<213:05:23,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15404/203307 [17:28:06<213:05:14,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15404/203307 [17:28:06<213:05:14,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15405/203307 [17:28:10<213:05:06,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15405/203307 [17:28:10<213:05:06,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15406/203307 [17:28:14<213:04:58,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15406/203307 [17:28:14<213:04:58,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15407/203307 [17:28:18<213:04:49,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15407/203307 [17:28:18<213:04:49,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15408/203307 [17:28:22<213:04:50,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15408/203307 [17:28:22<213:04:50,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15409/203307 [17:28:26<213:04:40,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15409/203307 [17:28:26<213:04:40,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15410/203307 [17:28:30<213:04:39,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15410/203307 [17:28:30<213:04:39,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15411/203307 [17:28:34<213:04:37,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15411/203307 [17:28:34<213:04:38,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15412/203307 [17:28:38<213:04:28,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15412/203307 [17:28:38<213:04:28,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15413/203307 [17:28:42<213:04:18,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15413/203307 [17:28:42<213:04:18,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15414/203307 [17:28:45<213:04:09,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15414/203307 [17:28:45<213:04:09,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15415/203307 [17:28:49<213:04:00,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15415/203307 [17:28:49<213:04:01,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15416/203307 [17:28:53<213:04:01,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15416/203307 [17:28:53<213:04:01,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15417/203307 [17:28:57<213:03:53,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15417/203307 [17:28:57<213:03:53,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15418/203307 [17:29:01<213:03:44,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15418/203307 [17:29:01<213:03:44,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15419/203307 [17:29:05<213:03:43,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15419/203307 [17:29:05<213:03:44,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15420/203307 [17:29:09<213:03:42,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15420/203307 [17:29:09<213:03:42,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15421/203307 [17:29:13<213:03:32,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:   8%|▊         | 15421/203307 [17:29:13<213:03:33,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15422/203307 [17:29:17<213:03:24,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15422/203307 [17:29:17<213:03:24,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15423/203307 [17:29:21<213:03:16,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15423/203307 [17:29:21<213:03:16,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15424/203307 [17:29:24<213:03:08,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15424/203307 [17:29:24<213:03:08,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15425/203307 [17:29:29<213:03:10,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15425/203307 [17:29:29<213:03:10,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15426/203307 [17:29:33<213:03:01,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15426/203307 [17:29:33<213:03:01,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15427/203307 [17:29:37<213:02:59,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15427/203307 [17:29:37<213:02:59,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15428/203307 [17:29:41<213:02:59,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15428/203307 [17:29:41<213:02:59,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15429/203307 [17:29:46<213:02:57,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15429/203307 [17:29:46<213:02:57,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15430/203307 [17:29:49<213:02:49,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15430/203307 [17:29:49<213:02:49,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15431/203307 [17:29:53<213:02:40,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15431/203307 [17:29:53<213:02:40,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15432/203307 [17:29:57<213:02:32,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15432/203307 [17:29:57<213:02:32,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15433/203307 [17:30:01<213:02:30,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15433/203307 [17:30:01<213:02:30,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15434/203307 [17:30:05<213:02:30,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15434/203307 [17:30:05<213:02:30,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15435/203307 [17:30:10<213:02:28,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15435/203307 [17:30:10<213:02:28,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15436/203307 [17:30:14<213:02:27,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15436/203307 [17:30:14<213:02:27,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15437/203307 [17:30:18<213:02:19,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15437/203307 [17:30:18<213:02:19,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15438/203307 [17:30:22<213:02:18,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15438/203307 [17:30:22<213:02:19,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15439/203307 [17:30:26<213:02:10,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15439/203307 [17:30:26<213:02:10,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15440/203307 [17:30:30<213:02:02,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15440/203307 [17:30:30<213:02:02,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15441/203307 [17:30:34<213:02:01,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15441/203307 [17:30:34<213:02:01,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15442/203307 [17:30:38<213:02:01,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15442/203307 [17:30:38<213:02:01,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15443/203307 [17:30:42<213:01:53,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15443/203307 [17:30:42<213:01:53,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15444/203307 [17:30:47<213:01:54,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15444/203307 [17:30:47<213:01:54,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15445/203307 [17:30:50<213:01:46,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15445/203307 [17:30:50<213:01:46,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15446/203307 [17:30:54<213:01:37,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15446/203307 [17:30:54<213:01:38,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15447/203307 [17:30:58<213:01:35,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15447/203307 [17:30:58<213:01:35,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15448/203307 [17:31:02<213:01:26,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15448/203307 [17:31:02<213:01:26,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15449/203307 [17:31:06<213:01:18,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15449/203307 [17:31:06<213:01:18,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15450/203307 [17:31:10<213:01:17,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15450/203307 [17:31:10<213:01:17,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15451/203307 [17:31:15<213:01:18,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15451/203307 [17:31:15<213:01:18,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15452/203307 [17:31:19<213:01:16,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15452/203307 [17:31:19<213:01:16,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15453/203307 [17:31:23<213:01:17,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15453/203307 [17:31:23<213:01:17,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15454/203307 [17:31:27<213:01:08,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15454/203307 [17:31:27<213:01:08,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15455/203307 [17:31:31<213:00:59,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15455/203307 [17:31:31<213:00:59,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15456/203307 [17:31:35<213:00:58,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15456/203307 [17:31:35<213:00:58,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15457/203307 [17:31:39<213:00:49,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15457/203307 [17:31:39<213:00:49,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15458/203307 [17:31:43<213:00:46,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15458/203307 [17:31:43<213:00:47,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15459/203307 [17:31:47<213:00:38,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15459/203307 [17:31:47<213:00:39,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15460/203307 [17:31:51<213:00:38,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15460/203307 [17:31:51<213:00:38,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15461/203307 [17:31:56<213:00:38,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:   8%|▊         | 15461/203307 [17:31:56<213:00:38,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15462/203307 [17:31:59<213:00:30,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15462/203307 [17:31:59<213:00:30,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15463/203307 [17:32:03<213:00:21,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15463/203307 [17:32:03<213:00:21,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15464/203307 [17:32:07<213:00:13,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15464/203307 [17:32:07<213:00:13,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15465/203307 [17:32:11<213:00:12,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15465/203307 [17:32:11<213:00:12,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15466/203307 [17:32:15<213:00:10,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15466/203307 [17:32:15<213:00:10,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15467/203307 [17:32:19<213:00:02,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15467/203307 [17:32:19<213:00:02,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15468/203307 [17:32:23<213:00:01,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15468/203307 [17:32:23<213:00:01,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15469/203307 [17:32:28<213:00:01,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15469/203307 [17:32:28<213:00:01,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15470/203307 [17:32:32<212:59:53,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15470/203307 [17:32:32<212:59:53,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15471/203307 [17:32:35<212:59:44,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15471/203307 [17:32:35<212:59:44,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15472/203307 [17:32:39<212:59:35,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15472/203307 [17:32:39<212:59:35,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15473/203307 [17:32:43<212:59:26,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15473/203307 [17:32:43<212:59:26,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15474/203307 [17:32:47<212:59:25,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15474/203307 [17:32:47<212:59:25,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15475/203307 [17:32:51<212:59:23,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15475/203307 [17:32:51<212:59:23,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15476/203307 [17:32:55<212:59:13,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15476/203307 [17:32:55<212:59:13,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15477/203307 [17:32:59<212:59:13,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15477/203307 [17:32:59<212:59:13,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15478/203307 [17:33:04<212:59:13,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15478/203307 [17:33:04<212:59:13,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15479/203307 [17:33:07<212:59:03,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15479/203307 [17:33:07<212:59:03,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15480/203307 [17:33:11<212:58:54,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15480/203307 [17:33:11<212:58:54,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15481/203307 [17:33:15<212:58:46,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   8%|▊         | 15481/203307 [17:33:15<212:58:47,  0.24it/s, v_num=t5e6, training/loss=0.089] Epoch 0:   8%|▊         | 15482/203307 [17:33:19<212:58:39,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15482/203307 [17:33:19<212:58:40,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15483/203307 [17:33:23<212:58:38,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15483/203307 [17:33:23<212:58:38,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15484/203307 [17:33:26<212:58:29,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15484/203307 [17:33:27<212:58:29,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15485/203307 [17:33:31<212:58:27,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15485/203307 [17:33:31<212:58:27,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15486/203307 [17:33:35<212:58:27,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15486/203307 [17:33:35<212:58:27,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15487/203307 [17:33:39<212:58:19,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15487/203307 [17:33:39<212:58:19,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15488/203307 [17:33:43<212:58:11,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15488/203307 [17:33:43<212:58:11,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15489/203307 [17:33:47<212:58:04,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15489/203307 [17:33:47<212:58:04,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15490/203307 [17:33:50<212:57:56,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15490/203307 [17:33:50<212:57:56,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15491/203307 [17:33:55<212:57:55,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15491/203307 [17:33:55<212:57:55,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15492/203307 [17:33:59<212:57:53,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15492/203307 [17:33:59<212:57:53,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15493/203307 [17:34:03<212:57:45,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15493/203307 [17:34:03<212:57:45,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15494/203307 [17:34:07<212:57:47,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15494/203307 [17:34:07<212:57:47,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15495/203307 [17:34:11<212:57:39,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15495/203307 [17:34:11<212:57:39,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15496/203307 [17:34:15<212:57:31,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15496/203307 [17:34:15<212:57:31,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15497/203307 [17:34:18<212:57:23,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15497/203307 [17:34:19<212:57:23,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15498/203307 [17:34:22<212:57:15,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15498/203307 [17:34:22<212:57:15,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15499/203307 [17:34:26<212:57:07,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15499/203307 [17:34:26<212:57:07,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15500/203307 [17:34:30<212:57:06,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15500/203307 [17:34:30<212:57:06,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15501/203307 [17:34:35<212:57:04,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   8%|▊         | 15501/203307 [17:34:35<212:57:04,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15502/203307 [17:34:39<212:57:03,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15502/203307 [17:34:39<212:57:03,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15503/203307 [17:34:43<212:57:02,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15503/203307 [17:34:43<212:57:02,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15504/203307 [17:34:47<212:56:53,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15504/203307 [17:34:47<212:56:53,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15505/203307 [17:34:51<212:56:44,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15505/203307 [17:34:51<212:56:44,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15506/203307 [17:34:54<212:56:37,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15506/203307 [17:34:54<212:56:37,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15507/203307 [17:34:58<212:56:28,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15507/203307 [17:34:58<212:56:28,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15508/203307 [17:35:02<212:56:27,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15508/203307 [17:35:02<212:56:27,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15509/203307 [17:35:06<212:56:19,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15509/203307 [17:35:06<212:56:19,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15510/203307 [17:35:11<212:56:17,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15510/203307 [17:35:11<212:56:17,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15511/203307 [17:35:15<212:56:17,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15511/203307 [17:35:15<212:56:17,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15512/203307 [17:35:19<212:56:16,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15512/203307 [17:35:19<212:56:16,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15513/203307 [17:35:23<212:56:08,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15513/203307 [17:35:23<212:56:08,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15514/203307 [17:35:27<212:55:59,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15514/203307 [17:35:27<212:55:59,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15515/203307 [17:35:30<212:55:51,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15515/203307 [17:35:30<212:55:51,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15516/203307 [17:35:35<212:55:49,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15516/203307 [17:35:35<212:55:49,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15517/203307 [17:35:38<212:55:41,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15517/203307 [17:35:38<212:55:41,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15518/203307 [17:35:42<212:55:32,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15518/203307 [17:35:42<212:55:32,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15519/203307 [17:35:47<212:55:32,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15519/203307 [17:35:47<212:55:32,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15520/203307 [17:35:51<212:55:32,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15520/203307 [17:35:51<212:55:32,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15521/203307 [17:35:55<212:55:23,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:   8%|▊         | 15521/203307 [17:35:55<212:55:23,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15522/203307 [17:35:58<212:55:14,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15522/203307 [17:35:58<212:55:14,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15523/203307 [17:36:02<212:55:06,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15523/203307 [17:36:02<212:55:06,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15524/203307 [17:36:06<212:54:57,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15524/203307 [17:36:06<212:54:57,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15525/203307 [17:36:10<212:54:56,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15525/203307 [17:36:10<212:54:56,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15526/203307 [17:36:14<212:54:47,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15526/203307 [17:36:14<212:54:47,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15527/203307 [17:36:18<212:54:45,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15527/203307 [17:36:18<212:54:46,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15528/203307 [17:36:22<212:54:45,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15528/203307 [17:36:22<212:54:45,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15529/203307 [17:36:27<212:54:45,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15529/203307 [17:36:27<212:54:45,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15530/203307 [17:36:31<212:54:36,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15530/203307 [17:36:31<212:54:36,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15531/203307 [17:36:34<212:54:28,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15531/203307 [17:36:34<212:54:28,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15532/203307 [17:36:38<212:54:20,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15532/203307 [17:36:38<212:54:20,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15533/203307 [17:36:42<212:54:17,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15533/203307 [17:36:42<212:54:17,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15534/203307 [17:36:46<212:54:10,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15534/203307 [17:36:46<212:54:10,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15535/203307 [17:36:50<212:54:07,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15535/203307 [17:36:50<212:54:07,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15536/203307 [17:36:55<212:54:08,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15536/203307 [17:36:55<212:54:08,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15537/203307 [17:36:59<212:54:06,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15537/203307 [17:36:59<212:54:06,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15538/203307 [17:37:03<212:54:06,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15538/203307 [17:37:03<212:54:06,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15539/203307 [17:37:07<212:53:58,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15539/203307 [17:37:07<212:53:58,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15540/203307 [17:37:11<212:53:49,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15540/203307 [17:37:11<212:53:49,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15541/203307 [17:37:15<212:53:48,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   8%|▊         | 15541/203307 [17:37:15<212:53:48,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15542/203307 [17:37:19<212:53:40,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15542/203307 [17:37:19<212:53:40,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15543/203307 [17:37:23<212:53:31,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15543/203307 [17:37:23<212:53:31,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15544/203307 [17:37:27<212:53:33,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15544/203307 [17:37:27<212:53:33,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15545/203307 [17:37:31<212:53:26,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15545/203307 [17:37:31<212:53:26,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15546/203307 [17:37:35<212:53:26,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15546/203307 [17:37:35<212:53:26,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15547/203307 [17:37:39<212:53:17,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15547/203307 [17:37:39<212:53:17,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15548/203307 [17:37:43<212:53:08,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15548/203307 [17:37:43<212:53:09,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15549/203307 [17:37:47<212:53:00,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15549/203307 [17:37:47<212:53:00,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15550/203307 [17:37:51<212:53:00,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15550/203307 [17:37:51<212:53:00,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15551/203307 [17:37:55<212:52:52,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15551/203307 [17:37:55<212:52:52,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15552/203307 [17:37:59<212:52:51,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15552/203307 [17:37:59<212:52:51,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15553/203307 [17:38:03<212:52:50,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15553/203307 [17:38:03<212:52:50,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15554/203307 [17:38:07<212:52:41,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15554/203307 [17:38:07<212:52:41,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15555/203307 [17:38:12<212:52:42,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15555/203307 [17:38:12<212:52:42,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15556/203307 [17:38:15<212:52:33,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15556/203307 [17:38:15<212:52:33,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15557/203307 [17:38:19<212:52:25,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15557/203307 [17:38:19<212:52:25,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15558/203307 [17:38:23<212:52:24,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15558/203307 [17:38:23<212:52:24,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15559/203307 [17:38:27<212:52:17,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15559/203307 [17:38:27<212:52:17,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15560/203307 [17:38:31<212:52:15,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15560/203307 [17:38:32<212:52:16,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15561/203307 [17:38:36<212:52:17,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 15561/203307 [17:38:36<212:52:17,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15562/203307 [17:38:40<212:52:09,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15562/203307 [17:38:40<212:52:09,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15563/203307 [17:38:44<212:52:01,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15563/203307 [17:38:44<212:52:01,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15564/203307 [17:38:48<212:52:02,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15564/203307 [17:38:48<212:52:02,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15565/203307 [17:38:52<212:51:53,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15565/203307 [17:38:52<212:51:53,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15566/203307 [17:38:56<212:51:52,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15566/203307 [17:38:56<212:51:52,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15567/203307 [17:39:00<212:51:43,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15567/203307 [17:39:00<212:51:43,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15568/203307 [17:39:03<212:51:34,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15568/203307 [17:39:03<212:51:34,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15569/203307 [17:39:08<212:51:34,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15569/203307 [17:39:08<212:51:34,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15570/203307 [17:39:12<212:51:26,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15570/203307 [17:39:12<212:51:26,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15571/203307 [17:39:15<212:51:18,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15571/203307 [17:39:15<212:51:18,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15572/203307 [17:39:20<212:51:20,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15572/203307 [17:39:20<212:51:20,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15573/203307 [17:39:24<212:51:16,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15573/203307 [17:39:24<212:51:16,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15574/203307 [17:39:28<212:51:07,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15574/203307 [17:39:28<212:51:07,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15575/203307 [17:39:32<212:51:06,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15575/203307 [17:39:32<212:51:06,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15576/203307 [17:39:36<212:50:56,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15576/203307 [17:39:36<212:50:56,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15577/203307 [17:39:40<212:50:54,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15577/203307 [17:39:40<212:50:55,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15578/203307 [17:39:44<212:50:54,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15578/203307 [17:39:44<212:50:54,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15579/203307 [17:39:48<212:50:45,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15579/203307 [17:39:48<212:50:45,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15580/203307 [17:39:52<212:50:35,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15580/203307 [17:39:52<212:50:35,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15581/203307 [17:39:56<212:50:34,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:   8%|▊         | 15581/203307 [17:39:56<212:50:35,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15582/203307 [17:40:00<212:50:31,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15582/203307 [17:40:00<212:50:31,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15583/203307 [17:40:04<212:50:29,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15583/203307 [17:40:04<212:50:29,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15584/203307 [17:40:08<212:50:20,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15584/203307 [17:40:08<212:50:20,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15585/203307 [17:40:12<212:50:17,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15585/203307 [17:40:12<212:50:18,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15586/203307 [17:40:17<212:50:17,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15586/203307 [17:40:17<212:50:17,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15587/203307 [17:40:20<212:50:09,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15587/203307 [17:40:20<212:50:09,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15588/203307 [17:40:24<212:50:00,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15588/203307 [17:40:24<212:50:00,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15589/203307 [17:40:28<212:49:52,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15589/203307 [17:40:28<212:49:52,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15590/203307 [17:40:32<212:49:52,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15590/203307 [17:40:32<212:49:52,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15591/203307 [17:40:36<212:49:50,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15591/203307 [17:40:36<212:49:50,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15592/203307 [17:40:40<212:49:41,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15592/203307 [17:40:40<212:49:41,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15593/203307 [17:40:44<212:49:30,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15593/203307 [17:40:44<212:49:30,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15594/203307 [17:40:48<212:49:31,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15594/203307 [17:40:48<212:49:31,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15595/203307 [17:40:52<212:49:22,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15595/203307 [17:40:52<212:49:22,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15596/203307 [17:40:55<212:49:13,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15596/203307 [17:40:55<212:49:13,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15597/203307 [17:40:59<212:49:03,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15597/203307 [17:40:59<212:49:03,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15598/203307 [17:41:04<212:49:04,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15598/203307 [17:41:04<212:49:04,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15599/203307 [17:41:07<212:48:54,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15599/203307 [17:41:07<212:48:54,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15600/203307 [17:41:11<212:48:52,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15600/203307 [17:41:11<212:48:53,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15601/203307 [17:41:15<212:48:45,  0.25it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   8%|▊         | 15601/203307 [17:41:15<212:48:45,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15602/203307 [17:41:20<212:48:44,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15602/203307 [17:41:20<212:48:44,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15603/203307 [17:41:24<212:48:44,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15603/203307 [17:41:24<212:48:44,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15604/203307 [17:41:28<212:48:35,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15604/203307 [17:41:28<212:48:35,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15605/203307 [17:41:31<212:48:25,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15605/203307 [17:41:31<212:48:25,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15606/203307 [17:41:35<212:48:18,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15606/203307 [17:41:35<212:48:18,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15607/203307 [17:41:40<212:48:18,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15607/203307 [17:41:40<212:48:18,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15608/203307 [17:41:44<212:48:15,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15608/203307 [17:41:44<212:48:15,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15609/203307 [17:41:48<212:48:12,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15609/203307 [17:41:48<212:48:12,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15610/203307 [17:41:52<212:48:10,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15610/203307 [17:41:52<212:48:10,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15611/203307 [17:41:56<212:48:09,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15611/203307 [17:41:57<212:48:09,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15612/203307 [17:42:00<212:48:00,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15612/203307 [17:42:00<212:48:00,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15613/203307 [17:42:04<212:47:51,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15613/203307 [17:42:04<212:47:51,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15614/203307 [17:42:07<212:47:42,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15614/203307 [17:42:08<212:47:42,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15615/203307 [17:42:11<212:47:33,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15615/203307 [17:42:11<212:47:33,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15616/203307 [17:42:16<212:47:35,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15616/203307 [17:42:16<212:47:35,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15617/203307 [17:42:19<212:47:25,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15617/203307 [17:42:19<212:47:25,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15618/203307 [17:42:23<212:47:21,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15618/203307 [17:42:23<212:47:21,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15619/203307 [17:42:28<212:47:22,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15619/203307 [17:42:28<212:47:22,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15620/203307 [17:42:32<212:47:13,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15620/203307 [17:42:32<212:47:13,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15621/203307 [17:42:35<212:47:04,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   8%|▊         | 15621/203307 [17:42:35<212:47:04,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15622/203307 [17:42:39<212:46:55,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15622/203307 [17:42:39<212:46:55,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15623/203307 [17:42:43<212:46:47,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15623/203307 [17:42:43<212:46:47,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15624/203307 [17:42:47<212:46:48,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15624/203307 [17:42:47<212:46:48,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15625/203307 [17:42:51<212:46:46,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15625/203307 [17:42:51<212:46:46,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15626/203307 [17:42:55<212:46:37,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15626/203307 [17:42:55<212:46:37,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15627/203307 [17:42:59<212:46:36,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15627/203307 [17:42:59<212:46:36,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15628/203307 [17:43:04<212:46:36,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15628/203307 [17:43:04<212:46:36,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15629/203307 [17:43:08<212:46:27,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15629/203307 [17:43:08<212:46:27,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15630/203307 [17:43:11<212:46:19,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15630/203307 [17:43:11<212:46:19,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15631/203307 [17:43:15<212:46:10,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15631/203307 [17:43:15<212:46:10,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15632/203307 [17:43:19<212:46:03,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15632/203307 [17:43:19<212:46:03,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15633/203307 [17:43:23<212:46:03,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15633/203307 [17:43:23<212:46:04,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15634/203307 [17:43:27<212:45:55,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15634/203307 [17:43:27<212:45:55,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15635/203307 [17:43:31<212:45:53,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15635/203307 [17:43:31<212:45:53,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15636/203307 [17:43:36<212:45:53,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15636/203307 [17:43:36<212:45:53,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15637/203307 [17:43:39<212:45:44,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15637/203307 [17:43:39<212:45:44,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15638/203307 [17:43:43<212:45:37,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15638/203307 [17:43:43<212:45:37,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15639/203307 [17:43:47<212:45:28,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15639/203307 [17:43:47<212:45:29,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15640/203307 [17:43:51<212:45:20,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15640/203307 [17:43:51<212:45:20,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15641/203307 [17:43:55<212:45:19,  0.25it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   8%|▊         | 15641/203307 [17:43:55<212:45:19,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15642/203307 [17:43:59<212:45:19,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15642/203307 [17:43:59<212:45:19,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15643/203307 [17:44:03<212:45:09,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15643/203307 [17:44:03<212:45:10,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15644/203307 [17:44:07<212:45:09,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15644/203307 [17:44:07<212:45:09,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15645/203307 [17:44:12<212:45:07,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15645/203307 [17:44:12<212:45:07,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15646/203307 [17:44:15<212:44:58,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15646/203307 [17:44:15<212:44:58,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15647/203307 [17:44:19<212:44:50,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15647/203307 [17:44:19<212:44:50,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15648/203307 [17:44:23<212:44:41,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15648/203307 [17:44:23<212:44:41,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15649/203307 [17:44:26<212:44:32,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15649/203307 [17:44:26<212:44:32,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15650/203307 [17:44:31<212:44:33,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15650/203307 [17:44:31<212:44:33,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15651/203307 [17:44:35<212:44:24,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15651/203307 [17:44:35<212:44:24,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15652/203307 [17:44:39<212:44:22,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15652/203307 [17:44:39<212:44:22,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15653/203307 [17:44:43<212:44:21,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15653/203307 [17:44:43<212:44:21,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15654/203307 [17:44:47<212:44:17,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15654/203307 [17:44:47<212:44:17,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15655/203307 [17:44:51<212:44:08,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15655/203307 [17:44:51<212:44:08,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15656/203307 [17:44:55<212:43:59,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15656/203307 [17:44:55<212:43:59,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15657/203307 [17:44:58<212:43:50,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15657/203307 [17:44:58<212:43:50,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15658/203307 [17:45:03<212:43:48,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15658/203307 [17:45:03<212:43:48,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15659/203307 [17:45:07<212:43:48,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15659/203307 [17:45:07<212:43:48,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15660/203307 [17:45:11<212:43:45,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15660/203307 [17:45:11<212:43:45,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15661/203307 [17:45:15<212:43:44,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 15661/203307 [17:45:15<212:43:44,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15662/203307 [17:45:19<212:43:37,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15662/203307 [17:45:19<212:43:37,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15663/203307 [17:45:23<212:43:34,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15663/203307 [17:45:23<212:43:34,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15664/203307 [17:45:27<212:43:25,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15664/203307 [17:45:27<212:43:25,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15665/203307 [17:45:31<212:43:16,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15665/203307 [17:45:31<212:43:16,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15666/203307 [17:45:35<212:43:14,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15666/203307 [17:45:35<212:43:14,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15667/203307 [17:45:39<212:43:05,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15667/203307 [17:45:39<212:43:05,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15668/203307 [17:45:43<212:43:05,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15668/203307 [17:45:43<212:43:05,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15669/203307 [17:45:48<212:43:05,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15669/203307 [17:45:48<212:43:06,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15670/203307 [17:45:51<212:42:56,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15670/203307 [17:45:51<212:42:56,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15671/203307 [17:45:55<212:42:47,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15671/203307 [17:45:55<212:42:47,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15672/203307 [17:45:59<212:42:45,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15672/203307 [17:45:59<212:42:46,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15673/203307 [17:46:03<212:42:38,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15673/203307 [17:46:03<212:42:38,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15674/203307 [17:46:07<212:42:28,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15674/203307 [17:46:07<212:42:29,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15675/203307 [17:46:11<212:42:27,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15675/203307 [17:46:11<212:42:27,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15676/203307 [17:46:15<212:42:26,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15676/203307 [17:46:15<212:42:26,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15677/203307 [17:46:20<212:42:27,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15677/203307 [17:46:20<212:42:27,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15678/203307 [17:46:24<212:42:27,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15678/203307 [17:46:24<212:42:27,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15679/203307 [17:46:28<212:42:19,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15679/203307 [17:46:28<212:42:19,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15680/203307 [17:46:32<212:42:11,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15680/203307 [17:46:32<212:42:11,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15681/203307 [17:46:36<212:42:10,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   8%|▊         | 15681/203307 [17:46:36<212:42:10,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15682/203307 [17:46:40<212:42:02,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15682/203307 [17:46:40<212:42:02,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15683/203307 [17:46:44<212:42:00,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15683/203307 [17:46:44<212:42:00,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15684/203307 [17:46:48<212:41:54,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15684/203307 [17:46:48<212:41:54,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15685/203307 [17:46:52<212:41:55,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15685/203307 [17:46:52<212:41:55,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15686/203307 [17:46:57<212:41:55,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15686/203307 [17:46:57<212:41:55,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15687/203307 [17:47:01<212:41:48,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15687/203307 [17:47:01<212:41:48,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15688/203307 [17:47:05<212:41:40,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15688/203307 [17:47:05<212:41:40,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15689/203307 [17:47:08<212:41:32,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15689/203307 [17:47:08<212:41:32,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15690/203307 [17:47:13<212:41:30,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15690/203307 [17:47:13<212:41:30,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15691/203307 [17:47:17<212:41:30,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15691/203307 [17:47:17<212:41:30,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15692/203307 [17:47:21<212:41:22,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15692/203307 [17:47:21<212:41:22,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15693/203307 [17:47:25<212:41:15,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15693/203307 [17:47:25<212:41:15,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15694/203307 [17:47:29<212:41:18,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15694/203307 [17:47:29<212:41:18,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15695/203307 [17:47:33<212:41:10,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15695/203307 [17:47:33<212:41:11,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15696/203307 [17:47:37<212:41:03,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15696/203307 [17:47:37<212:41:03,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15697/203307 [17:47:41<212:40:55,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15697/203307 [17:47:41<212:40:55,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15698/203307 [17:47:44<212:40:47,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15698/203307 [17:47:44<212:40:47,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15699/203307 [17:47:49<212:40:46,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15699/203307 [17:47:49<212:40:46,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15700/203307 [17:47:53<212:40:45,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15700/203307 [17:47:53<212:40:45,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15701/203307 [17:47:57<212:40:37,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 15701/203307 [17:47:57<212:40:37,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15702/203307 [17:48:01<212:40:38,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15702/203307 [17:48:01<212:40:39,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15703/203307 [17:48:06<212:40:39,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15703/203307 [17:48:06<212:40:39,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15704/203307 [17:48:09<212:40:31,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15704/203307 [17:48:09<212:40:31,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15705/203307 [17:48:13<212:40:24,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15705/203307 [17:48:13<212:40:24,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15706/203307 [17:48:17<212:40:16,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15706/203307 [17:48:17<212:40:16,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15707/203307 [17:48:21<212:40:10,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15707/203307 [17:48:21<212:40:10,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15708/203307 [17:48:25<212:40:09,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15708/203307 [17:48:25<212:40:09,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15709/203307 [17:48:29<212:40:01,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15709/203307 [17:48:29<212:40:01,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15710/203307 [17:48:33<212:40:00,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15710/203307 [17:48:33<212:40:00,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15711/203307 [17:48:38<212:40:01,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15711/203307 [17:48:38<212:40:01,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15712/203307 [17:48:42<212:39:53,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15712/203307 [17:48:42<212:39:53,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15713/203307 [17:48:45<212:39:44,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15713/203307 [17:48:45<212:39:44,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15714/203307 [17:48:49<212:39:37,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15714/203307 [17:48:49<212:39:37,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15715/203307 [17:48:53<212:39:29,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15715/203307 [17:48:53<212:39:29,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15716/203307 [17:48:57<212:39:27,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15716/203307 [17:48:57<212:39:27,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15717/203307 [17:49:01<212:39:25,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15717/203307 [17:49:01<212:39:25,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15718/203307 [17:49:05<212:39:17,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15718/203307 [17:49:05<212:39:17,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15719/203307 [17:49:10<212:39:17,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15719/203307 [17:49:10<212:39:17,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15720/203307 [17:49:14<212:39:18,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15720/203307 [17:49:14<212:39:18,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15721/203307 [17:49:18<212:39:09,  0.25it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:   8%|▊         | 15721/203307 [17:49:18<212:39:10,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15722/203307 [17:49:22<212:39:01,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15722/203307 [17:49:22<212:39:01,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15723/203307 [17:49:25<212:38:53,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15723/203307 [17:49:25<212:38:53,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15724/203307 [17:49:29<212:38:44,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15724/203307 [17:49:29<212:38:44,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15725/203307 [17:49:33<212:38:42,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15725/203307 [17:49:33<212:38:42,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15726/203307 [17:49:37<212:38:40,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15726/203307 [17:49:38<212:38:40,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15727/203307 [17:49:42<212:38:38,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15727/203307 [17:49:42<212:38:38,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15728/203307 [17:49:46<212:38:37,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15728/203307 [17:49:46<212:38:38,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15729/203307 [17:49:50<212:38:29,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15729/203307 [17:49:50<212:38:29,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15730/203307 [17:49:53<212:38:20,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15730/203307 [17:49:54<212:38:20,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15731/203307 [17:49:57<212:38:11,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15731/203307 [17:49:57<212:38:11,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15732/203307 [17:50:01<212:38:03,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15732/203307 [17:50:01<212:38:04,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15733/203307 [17:50:05<212:38:02,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15733/203307 [17:50:05<212:38:02,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15734/203307 [17:50:09<212:37:54,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15734/203307 [17:50:09<212:37:54,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15735/203307 [17:50:13<212:37:52,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15735/203307 [17:50:13<212:37:52,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15736/203307 [17:50:18<212:37:54,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15736/203307 [17:50:18<212:37:54,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15737/203307 [17:50:22<212:37:54,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15737/203307 [17:50:22<212:37:54,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15738/203307 [17:50:26<212:37:46,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15738/203307 [17:50:26<212:37:46,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15739/203307 [17:50:30<212:37:38,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15739/203307 [17:50:30<212:37:38,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15740/203307 [17:50:34<212:37:30,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15740/203307 [17:50:34<212:37:30,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15741/203307 [17:50:38<212:37:30,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15741/203307 [17:50:38<212:37:31,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15742/203307 [17:50:42<212:37:23,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15742/203307 [17:50:42<212:37:23,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15743/203307 [17:50:46<212:37:14,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15743/203307 [17:50:46<212:37:14,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15744/203307 [17:50:50<212:37:15,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15744/203307 [17:50:50<212:37:15,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15745/203307 [17:50:54<212:37:08,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15745/203307 [17:50:54<212:37:08,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15746/203307 [17:50:58<212:37:09,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15746/203307 [17:50:58<212:37:09,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15747/203307 [17:51:02<212:37:00,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15747/203307 [17:51:02<212:37:01,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15748/203307 [17:51:06<212:36:53,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15748/203307 [17:51:06<212:36:53,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15749/203307 [17:51:10<212:36:45,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15749/203307 [17:51:10<212:36:45,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15750/203307 [17:51:14<212:36:43,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15750/203307 [17:51:14<212:36:43,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15751/203307 [17:51:18<212:36:36,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15751/203307 [17:51:18<212:36:36,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15752/203307 [17:51:22<212:36:35,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15752/203307 [17:51:22<212:36:35,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15753/203307 [17:51:26<212:36:35,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15753/203307 [17:51:26<212:36:35,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15754/203307 [17:51:31<212:36:35,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15754/203307 [17:51:31<212:36:35,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15755/203307 [17:51:35<212:36:27,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15755/203307 [17:51:35<212:36:27,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15756/203307 [17:51:38<212:36:19,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15756/203307 [17:51:38<212:36:19,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15757/203307 [17:51:42<212:36:11,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15757/203307 [17:51:42<212:36:11,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15758/203307 [17:51:46<212:36:09,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15758/203307 [17:51:46<212:36:10,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15759/203307 [17:51:50<212:36:01,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15759/203307 [17:51:50<212:36:02,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15760/203307 [17:51:54<212:35:59,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15760/203307 [17:51:54<212:35:59,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15761/203307 [17:51:59<212:35:59,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15761/203307 [17:51:59<212:35:59,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15762/203307 [17:52:03<212:35:56,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15762/203307 [17:52:03<212:35:56,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15763/203307 [17:52:07<212:35:56,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15763/203307 [17:52:07<212:35:56,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15764/203307 [17:52:11<212:35:48,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15764/203307 [17:52:11<212:35:48,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15765/203307 [17:52:15<212:35:39,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15765/203307 [17:52:15<212:35:39,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15766/203307 [17:52:19<212:35:38,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15766/203307 [17:52:19<212:35:38,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15767/203307 [17:52:23<212:35:29,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15767/203307 [17:52:23<212:35:29,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15768/203307 [17:52:26<212:35:20,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15768/203307 [17:52:26<212:35:20,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15769/203307 [17:52:31<212:35:21,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15769/203307 [17:52:31<212:35:21,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15770/203307 [17:52:35<212:35:13,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15770/203307 [17:52:35<212:35:13,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15771/203307 [17:52:39<212:35:11,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15771/203307 [17:52:39<212:35:11,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15772/203307 [17:52:43<212:35:11,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15772/203307 [17:52:43<212:35:11,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15773/203307 [17:52:47<212:35:02,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15773/203307 [17:52:47<212:35:02,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15774/203307 [17:52:51<212:34:54,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15774/203307 [17:52:51<212:34:54,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15775/203307 [17:52:55<212:34:54,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15775/203307 [17:52:55<212:34:54,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15776/203307 [17:52:59<212:34:45,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15776/203307 [17:52:59<212:34:45,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15777/203307 [17:53:03<212:34:43,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15777/203307 [17:53:03<212:34:43,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15778/203307 [17:53:08<212:34:43,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15778/203307 [17:53:08<212:34:43,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15779/203307 [17:53:11<212:34:34,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15779/203307 [17:53:11<212:34:34,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15780/203307 [17:53:16<212:34:35,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15780/203307 [17:53:16<212:34:35,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15781/203307 [17:53:20<212:34:27,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 15781/203307 [17:53:20<212:34:27,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15782/203307 [17:53:23<212:34:18,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15782/203307 [17:53:23<212:34:18,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15783/203307 [17:53:27<212:34:16,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15783/203307 [17:53:28<212:34:16,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15784/203307 [17:53:31<212:34:07,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15784/203307 [17:53:31<212:34:07,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15785/203307 [17:53:35<212:34:06,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15785/203307 [17:53:35<212:34:06,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15786/203307 [17:53:40<212:34:05,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15786/203307 [17:53:40<212:34:05,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15787/203307 [17:53:44<212:33:59,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15787/203307 [17:53:44<212:33:59,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15788/203307 [17:53:47<212:33:51,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15788/203307 [17:53:47<212:33:51,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15789/203307 [17:53:52<212:33:51,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15789/203307 [17:53:52<212:33:51,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15790/203307 [17:53:56<212:33:41,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15790/203307 [17:53:56<212:33:41,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15791/203307 [17:54:00<212:33:39,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15791/203307 [17:54:00<212:33:39,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15792/203307 [17:54:03<212:33:30,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15792/203307 [17:54:03<212:33:30,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15793/203307 [17:54:07<212:33:20,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15793/203307 [17:54:07<212:33:20,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15794/203307 [17:54:11<212:33:20,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15794/203307 [17:54:11<212:33:20,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15795/203307 [17:54:15<212:33:12,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15795/203307 [17:54:15<212:33:13,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15796/203307 [17:54:19<212:33:04,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15796/203307 [17:54:19<212:33:04,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15797/203307 [17:54:23<212:32:56,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15797/203307 [17:54:23<212:32:56,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15798/203307 [17:54:27<212:32:55,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15798/203307 [17:54:27<212:32:56,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15799/203307 [17:54:31<212:32:46,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15799/203307 [17:54:31<212:32:46,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15800/203307 [17:54:35<212:32:43,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15800/203307 [17:54:35<212:32:43,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15801/203307 [17:54:39<212:32:35,  0.25it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   8%|▊         | 15801/203307 [17:54:39<212:32:35,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15802/203307 [17:54:43<212:32:33,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15802/203307 [17:54:43<212:32:33,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15803/203307 [17:54:47<212:32:33,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15803/203307 [17:54:47<212:32:33,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15804/203307 [17:54:51<212:32:24,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15804/203307 [17:54:51<212:32:24,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15805/203307 [17:54:55<212:32:16,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15805/203307 [17:54:55<212:32:16,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15806/203307 [17:54:59<212:32:16,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15806/203307 [17:54:59<212:32:16,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15807/203307 [17:55:03<212:32:14,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15807/203307 [17:55:03<212:32:14,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15808/203307 [17:55:08<212:32:12,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15808/203307 [17:55:08<212:32:12,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15809/203307 [17:55:11<212:32:04,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15809/203307 [17:55:11<212:32:04,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15810/203307 [17:55:16<212:32:02,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15810/203307 [17:55:16<212:32:02,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15811/203307 [17:55:20<212:32:02,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15811/203307 [17:55:20<212:32:02,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15812/203307 [17:55:24<212:31:54,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15812/203307 [17:55:24<212:31:54,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15813/203307 [17:55:27<212:31:45,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15813/203307 [17:55:27<212:31:45,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15814/203307 [17:55:31<212:31:36,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15814/203307 [17:55:31<212:31:36,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15815/203307 [17:55:36<212:31:37,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15815/203307 [17:55:36<212:31:37,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15816/203307 [17:55:40<212:31:36,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15816/203307 [17:55:40<212:31:36,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15817/203307 [17:55:44<212:31:28,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15817/203307 [17:55:44<212:31:28,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15818/203307 [17:55:47<212:31:19,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15818/203307 [17:55:47<212:31:19,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15819/203307 [17:55:52<212:31:21,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15819/203307 [17:55:52<212:31:21,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15820/203307 [17:55:56<212:31:13,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15820/203307 [17:55:56<212:31:13,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15821/203307 [17:55:59<212:31:04,  0.25it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:   8%|▊         | 15821/203307 [17:55:59<212:31:04,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15822/203307 [17:56:03<212:30:55,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15822/203307 [17:56:03<212:30:55,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15823/203307 [17:56:07<212:30:47,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15823/203307 [17:56:07<212:30:47,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15824/203307 [17:56:11<212:30:49,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15824/203307 [17:56:11<212:30:49,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15825/203307 [17:56:16<212:30:48,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15825/203307 [17:56:16<212:30:48,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15826/203307 [17:56:19<212:30:39,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15826/203307 [17:56:19<212:30:39,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15827/203307 [17:56:24<212:30:38,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15827/203307 [17:56:24<212:30:38,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15828/203307 [17:56:28<212:30:38,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15828/203307 [17:56:28<212:30:38,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15829/203307 [17:56:32<212:30:29,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15829/203307 [17:56:32<212:30:30,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15830/203307 [17:56:36<212:30:21,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15830/203307 [17:56:36<212:30:21,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15831/203307 [17:56:39<212:30:12,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15831/203307 [17:56:39<212:30:12,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15832/203307 [17:56:44<212:30:13,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15832/203307 [17:56:44<212:30:13,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15833/203307 [17:56:48<212:30:11,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15833/203307 [17:56:48<212:30:11,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15834/203307 [17:56:52<212:30:09,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15834/203307 [17:56:52<212:30:09,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15835/203307 [17:56:57<212:30:07,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15835/203307 [17:56:57<212:30:07,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15836/203307 [17:57:01<212:30:06,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15836/203307 [17:57:01<212:30:06,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15837/203307 [17:57:05<212:29:58,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15837/203307 [17:57:05<212:29:58,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15838/203307 [17:57:08<212:29:50,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15838/203307 [17:57:08<212:29:50,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15839/203307 [17:57:12<212:29:43,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15839/203307 [17:57:12<212:29:43,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15840/203307 [17:57:16<212:29:35,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15840/203307 [17:57:16<212:29:35,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15841/203307 [17:57:20<212:29:35,  0.25it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:   8%|▊         | 15841/203307 [17:57:20<212:29:35,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15842/203307 [17:57:24<212:29:27,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15842/203307 [17:57:24<212:29:27,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15843/203307 [17:57:28<212:29:25,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15843/203307 [17:57:28<212:29:25,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15844/203307 [17:57:33<212:29:25,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15844/203307 [17:57:33<212:29:26,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15845/203307 [17:57:37<212:29:18,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15845/203307 [17:57:37<212:29:18,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15846/203307 [17:57:40<212:29:10,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15846/203307 [17:57:40<212:29:10,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15847/203307 [17:57:44<212:29:03,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15847/203307 [17:57:44<212:29:03,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15848/203307 [17:57:48<212:28:55,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15848/203307 [17:57:48<212:28:55,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15849/203307 [17:57:52<212:28:47,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15849/203307 [17:57:52<212:28:47,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15850/203307 [17:57:56<212:28:48,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15850/203307 [17:57:56<212:28:48,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15851/203307 [17:58:00<212:28:39,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15851/203307 [17:58:00<212:28:39,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15852/203307 [17:58:04<212:28:39,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15852/203307 [17:58:04<212:28:40,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15853/203307 [17:58:09<212:28:39,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15853/203307 [17:58:09<212:28:40,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15854/203307 [17:58:13<212:28:31,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15854/203307 [17:58:13<212:28:31,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15855/203307 [17:58:16<212:28:24,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15855/203307 [17:58:16<212:28:24,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15856/203307 [17:58:20<212:28:16,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15856/203307 [17:58:20<212:28:16,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15857/203307 [17:58:24<212:28:08,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15857/203307 [17:58:24<212:28:08,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15858/203307 [17:58:28<212:28:09,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15858/203307 [17:58:28<212:28:09,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15859/203307 [17:58:32<212:28:02,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15859/203307 [17:58:32<212:28:02,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15860/203307 [17:58:37<212:28:01,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15860/203307 [17:58:37<212:28:01,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15861/203307 [17:58:41<212:28:02,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 15861/203307 [17:58:41<212:28:02,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15862/203307 [17:58:45<212:27:55,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15862/203307 [17:58:45<212:27:55,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15863/203307 [17:58:49<212:27:47,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15863/203307 [17:58:49<212:27:47,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15864/203307 [17:58:52<212:27:39,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15864/203307 [17:58:52<212:27:39,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15865/203307 [17:58:56<212:27:31,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15865/203307 [17:58:56<212:27:32,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15866/203307 [17:59:01<212:27:31,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15866/203307 [17:59:01<212:27:31,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15867/203307 [17:59:05<212:27:32,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15867/203307 [17:59:05<212:27:32,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15868/203307 [17:59:09<212:27:23,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15868/203307 [17:59:09<212:27:23,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15869/203307 [17:59:13<212:27:24,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15869/203307 [17:59:13<212:27:24,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15870/203307 [17:59:18<212:27:23,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15870/203307 [17:59:18<212:27:23,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15871/203307 [17:59:21<212:27:16,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15871/203307 [17:59:21<212:27:16,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15872/203307 [17:59:25<212:27:08,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15872/203307 [17:59:25<212:27:08,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15873/203307 [17:59:29<212:27:00,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15873/203307 [17:59:29<212:27:00,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15874/203307 [17:59:33<212:26:52,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15874/203307 [17:59:33<212:26:52,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15875/203307 [17:59:37<212:26:52,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15875/203307 [17:59:37<212:26:52,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15876/203307 [17:59:42<212:26:53,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15876/203307 [17:59:42<212:26:53,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15877/203307 [17:59:46<212:26:51,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15877/203307 [17:59:46<212:26:51,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15878/203307 [17:59:50<212:26:50,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15878/203307 [17:59:50<212:26:50,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15879/203307 [17:59:54<212:26:48,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15879/203307 [17:59:54<212:26:48,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15880/203307 [17:59:58<212:26:39,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15880/203307 [17:59:58<212:26:39,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15881/203307 [18:00:02<212:26:32,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   8%|▊         | 15881/203307 [18:00:02<212:26:32,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15882/203307 [18:00:06<212:26:24,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15882/203307 [18:00:06<212:26:25,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15883/203307 [18:00:10<212:26:22,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15883/203307 [18:00:10<212:26:22,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15884/203307 [18:00:14<212:26:22,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15884/203307 [18:00:14<212:26:22,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15885/203307 [18:00:19<212:26:21,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15885/203307 [18:00:19<212:26:21,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15886/203307 [18:00:23<212:26:21,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15886/203307 [18:00:23<212:26:21,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15887/203307 [18:00:27<212:26:13,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15887/203307 [18:00:27<212:26:13,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15888/203307 [18:00:31<212:26:10,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15888/203307 [18:00:31<212:26:10,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15889/203307 [18:00:35<212:26:01,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15889/203307 [18:00:35<212:26:01,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15890/203307 [18:00:39<212:25:53,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15890/203307 [18:00:39<212:25:53,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15891/203307 [18:00:43<212:25:51,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15891/203307 [18:00:43<212:25:51,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15892/203307 [18:00:47<212:25:44,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15892/203307 [18:00:47<212:25:44,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15893/203307 [18:00:51<212:25:45,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15893/203307 [18:00:51<212:25:45,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15894/203307 [18:00:56<212:25:45,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15894/203307 [18:00:56<212:25:45,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15895/203307 [18:00:59<212:25:37,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15895/203307 [18:00:59<212:25:37,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15896/203307 [18:01:03<212:25:29,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15896/203307 [18:01:03<212:25:29,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15897/203307 [18:01:07<212:25:26,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15897/203307 [18:01:07<212:25:26,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15898/203307 [18:01:11<212:25:18,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15898/203307 [18:01:11<212:25:18,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15899/203307 [18:01:15<212:25:10,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15899/203307 [18:01:15<212:25:10,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15900/203307 [18:01:19<212:25:09,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15900/203307 [18:01:19<212:25:09,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15901/203307 [18:01:23<212:25:01,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 15901/203307 [18:01:23<212:25:01,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15902/203307 [18:01:27<212:25:02,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15902/203307 [18:01:27<212:25:02,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15903/203307 [18:01:32<212:25:02,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15903/203307 [18:01:32<212:25:02,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15904/203307 [18:01:35<212:24:54,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15904/203307 [18:01:35<212:24:54,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15905/203307 [18:01:39<212:24:46,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15905/203307 [18:01:39<212:24:46,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15906/203307 [18:01:43<212:24:44,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15906/203307 [18:01:43<212:24:44,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15907/203307 [18:01:47<212:24:36,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15907/203307 [18:01:47<212:24:36,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15908/203307 [18:01:52<212:24:35,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15908/203307 [18:01:52<212:24:35,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15909/203307 [18:01:55<212:24:28,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15909/203307 [18:01:55<212:24:28,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15910/203307 [18:02:00<212:24:28,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15910/203307 [18:02:00<212:24:28,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15911/203307 [18:02:04<212:24:29,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15911/203307 [18:02:04<212:24:29,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15912/203307 [18:02:08<212:24:22,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15912/203307 [18:02:08<212:24:22,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15913/203307 [18:02:12<212:24:14,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15913/203307 [18:02:12<212:24:14,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15914/203307 [18:02:16<212:24:07,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15914/203307 [18:02:16<212:24:07,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15915/203307 [18:02:20<212:24:05,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15915/203307 [18:02:20<212:24:05,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15916/203307 [18:02:24<212:24:03,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15916/203307 [18:02:24<212:24:04,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15917/203307 [18:02:28<212:23:55,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15917/203307 [18:02:28<212:23:55,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15918/203307 [18:02:32<212:23:47,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15918/203307 [18:02:32<212:23:47,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15919/203307 [18:02:36<212:23:48,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15919/203307 [18:02:36<212:23:48,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15920/203307 [18:02:40<212:23:39,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15920/203307 [18:02:40<212:23:40,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15921/203307 [18:02:44<212:23:31,  0.25it/s, v_num=t5e6, training/loss=0.0971]Epoch 0:   8%|▊         | 15921/203307 [18:02:44<212:23:31,  0.25it/s, v_num=t5e6, training/loss=0.091] Epoch 0:   8%|▊         | 15922/203307 [18:02:47<212:23:23,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15922/203307 [18:02:47<212:23:23,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15923/203307 [18:02:51<212:23:14,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15923/203307 [18:02:51<212:23:15,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15924/203307 [18:02:55<212:23:12,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15924/203307 [18:02:55<212:23:12,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15925/203307 [18:03:00<212:23:12,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15925/203307 [18:03:00<212:23:12,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15926/203307 [18:03:04<212:23:04,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15926/203307 [18:03:04<212:23:04,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15927/203307 [18:03:08<212:23:04,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15927/203307 [18:03:08<212:23:04,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15928/203307 [18:03:13<212:23:06,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15928/203307 [18:03:13<212:23:06,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15929/203307 [18:03:16<212:22:58,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15929/203307 [18:03:16<212:22:59,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15930/203307 [18:03:20<212:22:51,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15930/203307 [18:03:20<212:22:51,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15931/203307 [18:03:24<212:22:43,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15931/203307 [18:03:24<212:22:43,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15932/203307 [18:03:28<212:22:35,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15932/203307 [18:03:28<212:22:35,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15933/203307 [18:03:32<212:22:34,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15933/203307 [18:03:32<212:22:34,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15934/203307 [18:03:36<212:22:26,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15934/203307 [18:03:36<212:22:26,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15935/203307 [18:03:40<212:22:24,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15935/203307 [18:03:40<212:22:24,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15936/203307 [18:03:44<212:22:25,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15936/203307 [18:03:44<212:22:25,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15937/203307 [18:03:48<212:22:17,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15937/203307 [18:03:48<212:22:17,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15938/203307 [18:03:52<212:22:09,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15938/203307 [18:03:52<212:22:09,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15939/203307 [18:03:56<212:22:01,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15939/203307 [18:03:56<212:22:01,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15940/203307 [18:03:59<212:21:52,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15940/203307 [18:03:59<212:21:52,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15941/203307 [18:04:04<212:21:51,  0.25it/s, v_num=t5e6, training/loss=0.091]Epoch 0:   8%|▊         | 15941/203307 [18:04:04<212:21:51,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15942/203307 [18:04:08<212:21:48,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15942/203307 [18:04:08<212:21:48,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15943/203307 [18:04:12<212:21:38,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15943/203307 [18:04:12<212:21:38,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15944/203307 [18:04:16<212:21:38,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15944/203307 [18:04:16<212:21:38,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15945/203307 [18:04:20<212:21:39,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15945/203307 [18:04:20<212:21:39,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15946/203307 [18:04:24<212:21:30,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15946/203307 [18:04:24<212:21:30,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15947/203307 [18:04:28<212:21:21,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15947/203307 [18:04:28<212:21:21,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15948/203307 [18:04:32<212:21:14,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15948/203307 [18:04:32<212:21:14,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15949/203307 [18:04:35<212:21:05,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15949/203307 [18:04:35<212:21:05,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15950/203307 [18:04:40<212:21:04,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15950/203307 [18:04:40<212:21:04,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15951/203307 [18:04:44<212:21:02,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15951/203307 [18:04:44<212:21:02,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15952/203307 [18:04:48<212:21:00,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15952/203307 [18:04:48<212:21:00,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15953/203307 [18:04:52<212:20:59,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15953/203307 [18:04:52<212:20:59,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15954/203307 [18:04:57<212:20:59,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15954/203307 [18:04:57<212:20:59,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15955/203307 [18:05:00<212:20:49,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15955/203307 [18:05:00<212:20:49,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15956/203307 [18:05:04<212:20:40,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15956/203307 [18:05:04<212:20:41,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15957/203307 [18:05:08<212:20:32,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15957/203307 [18:05:08<212:20:32,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15958/203307 [18:05:12<212:20:30,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15958/203307 [18:05:12<212:20:30,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15959/203307 [18:05:16<212:20:21,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15959/203307 [18:05:16<212:20:21,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15960/203307 [18:05:20<212:20:20,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15960/203307 [18:05:20<212:20:20,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15961/203307 [18:05:24<212:20:19,  0.25it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:   8%|▊         | 15961/203307 [18:05:24<212:20:19,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15962/203307 [18:05:29<212:20:19,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15962/203307 [18:05:29<212:20:19,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15963/203307 [18:05:33<212:20:11,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15963/203307 [18:05:33<212:20:11,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15964/203307 [18:05:36<212:20:02,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15964/203307 [18:05:36<212:20:02,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15965/203307 [18:05:40<212:19:53,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15965/203307 [18:05:40<212:19:53,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15966/203307 [18:05:44<212:19:52,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15966/203307 [18:05:44<212:19:52,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15967/203307 [18:05:48<212:19:44,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15967/203307 [18:05:48<212:19:44,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15968/203307 [18:05:52<212:19:34,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15968/203307 [18:05:52<212:19:34,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15969/203307 [18:05:56<212:19:35,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15969/203307 [18:05:56<212:19:35,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15970/203307 [18:06:00<212:19:28,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15970/203307 [18:06:00<212:19:28,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15971/203307 [18:06:04<212:19:28,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15971/203307 [18:06:04<212:19:28,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15972/203307 [18:06:08<212:19:19,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15972/203307 [18:06:08<212:19:20,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15973/203307 [18:06:12<212:19:11,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15973/203307 [18:06:12<212:19:11,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15974/203307 [18:06:16<212:19:03,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15974/203307 [18:06:16<212:19:03,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15975/203307 [18:06:20<212:19:02,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15975/203307 [18:06:20<212:19:03,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15976/203307 [18:06:24<212:18:55,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15976/203307 [18:06:24<212:18:55,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15977/203307 [18:06:28<212:18:55,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15977/203307 [18:06:28<212:18:55,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15978/203307 [18:06:33<212:18:54,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15978/203307 [18:06:33<212:18:54,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15979/203307 [18:06:36<212:18:46,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15979/203307 [18:06:36<212:18:46,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15980/203307 [18:06:41<212:18:47,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15980/203307 [18:06:41<212:18:47,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15981/203307 [18:06:44<212:18:38,  0.25it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:   8%|▊         | 15981/203307 [18:06:44<212:18:39,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15982/203307 [18:06:48<212:18:31,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15982/203307 [18:06:48<212:18:31,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15983/203307 [18:06:53<212:18:30,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15983/203307 [18:06:53<212:18:30,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15984/203307 [18:06:56<212:18:22,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15984/203307 [18:06:56<212:18:22,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15985/203307 [18:07:01<212:18:20,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15985/203307 [18:07:01<212:18:20,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15986/203307 [18:07:05<212:18:21,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15986/203307 [18:07:05<212:18:21,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15987/203307 [18:07:09<212:18:18,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15987/203307 [18:07:09<212:18:18,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15988/203307 [18:07:14<212:18:18,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15988/203307 [18:07:14<212:18:18,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15989/203307 [18:07:18<212:18:11,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15989/203307 [18:07:18<212:18:11,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15990/203307 [18:07:21<212:18:03,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15990/203307 [18:07:21<212:18:03,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15991/203307 [18:07:26<212:18:02,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15991/203307 [18:07:26<212:18:02,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15992/203307 [18:07:29<212:17:54,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15992/203307 [18:07:29<212:17:54,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15993/203307 [18:07:33<212:17:46,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15993/203307 [18:07:33<212:17:46,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15994/203307 [18:07:38<212:17:47,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15994/203307 [18:07:38<212:17:47,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15995/203307 [18:07:41<212:17:39,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15995/203307 [18:07:41<212:17:39,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15996/203307 [18:07:46<212:17:37,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15996/203307 [18:07:46<212:17:37,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15997/203307 [18:07:50<212:17:38,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15997/203307 [18:07:50<212:17:38,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15998/203307 [18:07:54<212:17:29,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15998/203307 [18:07:54<212:17:29,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15999/203307 [18:07:58<212:17:21,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 15999/203307 [18:07:58<212:17:21,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16000/203307 [18:08:02<212:17:19,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16000/203307 [18:08:02<212:17:19,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16001/203307 [18:08:06<212:17:11,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16001/203307 [18:08:06<212:17:11,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16002/203307 [18:08:10<212:17:10,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16002/203307 [18:08:10<212:17:10,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16003/203307 [18:08:14<212:17:09,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16003/203307 [18:08:14<212:17:09,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16004/203307 [18:08:18<212:17:01,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16004/203307 [18:08:18<212:17:02,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16005/203307 [18:08:22<212:16:58,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16005/203307 [18:08:22<212:16:58,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16006/203307 [18:08:27<212:16:58,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16006/203307 [18:08:27<212:16:59,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16007/203307 [18:08:30<212:16:49,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16007/203307 [18:08:30<212:16:49,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16008/203307 [18:08:35<212:16:47,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16008/203307 [18:08:35<212:16:47,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16009/203307 [18:08:38<212:16:39,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16009/203307 [18:08:38<212:16:39,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16010/203307 [18:08:42<212:16:37,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16010/203307 [18:08:42<212:16:37,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16011/203307 [18:08:47<212:16:36,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16011/203307 [18:08:47<212:16:36,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16012/203307 [18:08:50<212:16:26,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16012/203307 [18:08:50<212:16:26,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16013/203307 [18:08:54<212:16:17,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16013/203307 [18:08:54<212:16:17,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16014/203307 [18:08:59<212:16:18,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16014/203307 [18:08:59<212:16:18,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16015/203307 [18:09:02<212:16:09,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16015/203307 [18:09:02<212:16:09,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16016/203307 [18:09:06<212:16:07,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16016/203307 [18:09:06<212:16:07,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16017/203307 [18:09:10<212:15:58,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16017/203307 [18:09:10<212:15:58,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16018/203307 [18:09:14<212:15:49,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16018/203307 [18:09:14<212:15:49,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16019/203307 [18:09:18<212:15:49,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16019/203307 [18:09:18<212:15:49,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16020/203307 [18:09:22<212:15:41,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16020/203307 [18:09:22<212:15:41,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16021/203307 [18:09:26<212:15:32,  0.25it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   8%|▊         | 16021/203307 [18:09:26<212:15:32,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16022/203307 [18:09:29<212:15:24,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16022/203307 [18:09:29<212:15:24,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16023/203307 [18:09:34<212:15:24,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16023/203307 [18:09:34<212:15:24,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16024/203307 [18:09:38<212:15:16,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16024/203307 [18:09:38<212:15:16,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16025/203307 [18:09:42<212:15:14,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16025/203307 [18:09:42<212:15:14,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16026/203307 [18:09:46<212:15:06,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16026/203307 [18:09:46<212:15:06,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16027/203307 [18:09:50<212:15:06,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16027/203307 [18:09:50<212:15:06,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16028/203307 [18:09:54<212:15:05,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16028/203307 [18:09:54<212:15:05,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16029/203307 [18:09:58<212:14:58,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16029/203307 [18:09:58<212:14:58,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16030/203307 [18:10:02<212:14:49,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16030/203307 [18:10:02<212:14:49,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16031/203307 [18:10:06<212:14:41,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16031/203307 [18:10:06<212:14:42,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16032/203307 [18:10:10<212:14:42,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16032/203307 [18:10:10<212:14:42,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16033/203307 [18:10:14<212:14:40,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16033/203307 [18:10:14<212:14:40,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16034/203307 [18:10:18<212:14:32,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16034/203307 [18:10:18<212:14:32,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16035/203307 [18:10:22<212:14:31,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16035/203307 [18:10:22<212:14:31,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16036/203307 [18:10:27<212:14:31,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16036/203307 [18:10:27<212:14:31,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16037/203307 [18:10:31<212:14:24,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16037/203307 [18:10:31<212:14:24,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16038/203307 [18:10:34<212:14:16,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16038/203307 [18:10:34<212:14:16,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16039/203307 [18:10:38<212:14:08,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16039/203307 [18:10:38<212:14:08,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16040/203307 [18:10:43<212:14:08,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16040/203307 [18:10:43<212:14:08,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16041/203307 [18:10:47<212:14:07,  0.25it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:   8%|▊         | 16041/203307 [18:10:47<212:14:07,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16042/203307 [18:10:51<212:13:59,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16042/203307 [18:10:51<212:13:59,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16043/203307 [18:10:55<212:13:52,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16043/203307 [18:10:55<212:13:52,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16044/203307 [18:10:59<212:13:53,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16044/203307 [18:10:59<212:13:54,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16045/203307 [18:11:03<212:13:46,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16045/203307 [18:11:03<212:13:46,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16046/203307 [18:11:07<212:13:38,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16046/203307 [18:11:07<212:13:38,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16047/203307 [18:11:10<212:13:30,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16047/203307 [18:11:10<212:13:30,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16048/203307 [18:11:14<212:13:23,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16048/203307 [18:11:14<212:13:23,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16049/203307 [18:11:19<212:13:25,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16049/203307 [18:11:19<212:13:25,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16050/203307 [18:11:23<212:13:23,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16050/203307 [18:11:23<212:13:23,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16051/203307 [18:11:27<212:13:15,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16051/203307 [18:11:27<212:13:15,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16052/203307 [18:11:31<212:13:14,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16052/203307 [18:11:31<212:13:14,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16053/203307 [18:11:36<212:13:13,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16053/203307 [18:11:36<212:13:13,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16054/203307 [18:11:39<212:13:05,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16054/203307 [18:11:39<212:13:05,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16055/203307 [18:11:43<212:12:57,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16055/203307 [18:11:43<212:12:57,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16056/203307 [18:11:47<212:12:49,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16056/203307 [18:11:47<212:12:49,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16057/203307 [18:11:50<212:12:41,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16057/203307 [18:11:50<212:12:41,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16058/203307 [18:11:55<212:12:42,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16058/203307 [18:11:55<212:12:42,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16059/203307 [18:11:59<212:12:40,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16059/203307 [18:11:59<212:12:40,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16060/203307 [18:12:04<212:12:38,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16060/203307 [18:12:04<212:12:39,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16061/203307 [18:12:08<212:12:38,  0.25it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:   8%|▊         | 16061/203307 [18:12:08<212:12:38,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16062/203307 [18:12:12<212:12:31,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16062/203307 [18:12:12<212:12:31,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16063/203307 [18:12:15<212:12:23,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16063/203307 [18:12:15<212:12:23,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16064/203307 [18:12:19<212:12:15,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16064/203307 [18:12:19<212:12:15,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16065/203307 [18:12:23<212:12:09,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16065/203307 [18:12:23<212:12:09,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16066/203307 [18:12:28<212:12:09,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16066/203307 [18:12:28<212:12:09,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16067/203307 [18:12:31<212:12:01,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16067/203307 [18:12:31<212:12:01,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16068/203307 [18:12:36<212:11:59,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16068/203307 [18:12:36<212:11:59,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16069/203307 [18:12:40<212:11:59,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16069/203307 [18:12:40<212:11:59,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16070/203307 [18:12:44<212:11:51,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16070/203307 [18:12:44<212:11:51,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16071/203307 [18:12:48<212:11:44,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16071/203307 [18:12:48<212:11:44,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16072/203307 [18:12:51<212:11:36,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16072/203307 [18:12:51<212:11:36,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16073/203307 [18:12:55<212:11:27,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16073/203307 [18:12:55<212:11:27,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16074/203307 [18:12:59<212:11:19,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16074/203307 [18:12:59<212:11:19,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16075/203307 [18:13:03<212:11:20,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16075/203307 [18:13:03<212:11:21,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16076/203307 [18:13:07<212:11:12,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16076/203307 [18:13:07<212:11:12,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16077/203307 [18:13:11<212:11:11,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16077/203307 [18:13:11<212:11:11,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16078/203307 [18:13:16<212:11:11,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16078/203307 [18:13:16<212:11:11,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16079/203307 [18:13:19<212:11:03,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16079/203307 [18:13:19<212:11:03,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16080/203307 [18:13:23<212:10:54,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16080/203307 [18:13:23<212:10:54,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16081/203307 [18:13:27<212:10:46,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16081/203307 [18:13:27<212:10:46,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16082/203307 [18:13:31<212:10:37,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16082/203307 [18:13:31<212:10:37,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16083/203307 [18:13:35<212:10:35,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16083/203307 [18:13:35<212:10:35,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16084/203307 [18:13:39<212:10:36,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16084/203307 [18:13:39<212:10:36,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16085/203307 [18:13:44<212:10:33,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16085/203307 [18:13:44<212:10:33,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16086/203307 [18:13:48<212:10:33,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16086/203307 [18:13:48<212:10:33,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16087/203307 [18:13:52<212:10:25,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16087/203307 [18:13:52<212:10:25,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16088/203307 [18:13:55<212:10:16,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16088/203307 [18:13:55<212:10:16,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16089/203307 [18:13:59<212:10:09,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16089/203307 [18:13:59<212:10:09,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16090/203307 [18:14:03<212:10:01,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16090/203307 [18:14:03<212:10:01,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16091/203307 [18:14:07<212:09:58,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16091/203307 [18:14:07<212:09:58,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16092/203307 [18:14:12<212:09:58,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16092/203307 [18:14:12<212:09:58,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16093/203307 [18:14:15<212:09:51,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16093/203307 [18:14:15<212:09:51,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16094/203307 [18:14:20<212:09:52,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16094/203307 [18:14:20<212:09:52,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16095/203307 [18:14:24<212:09:50,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16095/203307 [18:14:24<212:09:51,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16096/203307 [18:14:28<212:09:43,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16096/203307 [18:14:28<212:09:43,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16097/203307 [18:14:32<212:09:34,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16097/203307 [18:14:32<212:09:34,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16098/203307 [18:14:35<212:09:26,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16098/203307 [18:14:35<212:09:26,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16099/203307 [18:14:39<212:09:17,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16099/203307 [18:14:39<212:09:17,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16100/203307 [18:14:43<212:09:16,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16100/203307 [18:14:43<212:09:16,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16101/203307 [18:14:48<212:09:16,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   8%|▊         | 16101/203307 [18:14:48<212:09:16,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16102/203307 [18:14:52<212:09:14,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16102/203307 [18:14:52<212:09:14,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16103/203307 [18:14:56<212:09:14,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16103/203307 [18:14:56<212:09:14,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16104/203307 [18:15:01<212:09:12,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16104/203307 [18:15:01<212:09:12,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16105/203307 [18:15:04<212:09:03,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16105/203307 [18:15:04<212:09:03,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16106/203307 [18:15:08<212:08:56,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16106/203307 [18:15:08<212:08:56,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16107/203307 [18:15:12<212:08:49,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16107/203307 [18:15:12<212:08:49,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16108/203307 [18:15:16<212:08:46,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16108/203307 [18:15:16<212:08:47,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16109/203307 [18:15:20<212:08:39,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16109/203307 [18:15:20<212:08:39,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16110/203307 [18:15:24<212:08:39,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16110/203307 [18:15:25<212:08:39,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16111/203307 [18:15:29<212:08:38,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16111/203307 [18:15:29<212:08:38,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16112/203307 [18:15:33<212:08:31,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16112/203307 [18:15:33<212:08:31,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16113/203307 [18:15:37<212:08:28,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16113/203307 [18:15:37<212:08:28,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16114/203307 [18:15:41<212:08:20,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16114/203307 [18:15:41<212:08:20,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16115/203307 [18:15:44<212:08:12,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16115/203307 [18:15:44<212:08:12,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16116/203307 [18:15:49<212:08:11,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16116/203307 [18:15:49<212:08:11,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16117/203307 [18:15:52<212:08:03,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16117/203307 [18:15:52<212:08:04,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16118/203307 [18:15:57<212:08:04,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16118/203307 [18:15:57<212:08:04,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16119/203307 [18:16:01<212:08:05,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16119/203307 [18:16:01<212:08:05,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16120/203307 [18:16:05<212:07:57,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16120/203307 [18:16:05<212:07:57,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16121/203307 [18:16:09<212:07:49,  0.25it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   8%|▊         | 16121/203307 [18:16:09<212:07:49,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16122/203307 [18:16:13<212:07:47,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16122/203307 [18:16:13<212:07:47,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16123/203307 [18:16:17<212:07:40,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16123/203307 [18:16:17<212:07:40,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16124/203307 [18:16:21<212:07:33,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16124/203307 [18:16:21<212:07:33,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16125/203307 [18:16:25<212:07:32,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16125/203307 [18:16:25<212:07:32,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16126/203307 [18:16:29<212:07:24,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16126/203307 [18:16:29<212:07:24,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16127/203307 [18:16:34<212:07:26,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16127/203307 [18:16:34<212:07:26,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16128/203307 [18:16:38<212:07:26,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16128/203307 [18:16:38<212:07:26,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16129/203307 [18:16:42<212:07:19,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16129/203307 [18:16:42<212:07:19,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16130/203307 [18:16:46<212:07:11,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16130/203307 [18:16:46<212:07:11,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16131/203307 [18:16:50<212:07:11,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16131/203307 [18:16:50<212:07:11,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16132/203307 [18:16:54<212:07:03,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16132/203307 [18:16:54<212:07:03,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16133/203307 [18:16:58<212:07:01,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16133/203307 [18:16:58<212:07:01,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16134/203307 [18:17:02<212:06:54,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16134/203307 [18:17:02<212:06:54,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16135/203307 [18:17:06<212:06:53,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16135/203307 [18:17:06<212:06:53,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16136/203307 [18:17:11<212:06:54,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16136/203307 [18:17:11<212:06:54,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16137/203307 [18:17:14<212:06:47,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16137/203307 [18:17:14<212:06:47,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16138/203307 [18:17:18<212:06:38,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16138/203307 [18:17:18<212:06:38,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16139/203307 [18:17:22<212:06:30,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16139/203307 [18:17:22<212:06:31,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16140/203307 [18:17:26<212:06:28,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16140/203307 [18:17:26<212:06:28,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16141/203307 [18:17:30<212:06:27,  0.25it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:   8%|▊         | 16141/203307 [18:17:30<212:06:27,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16142/203307 [18:17:34<212:06:19,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16142/203307 [18:17:34<212:06:19,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16143/203307 [18:17:38<212:06:11,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16143/203307 [18:17:38<212:06:11,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16144/203307 [18:17:42<212:06:12,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16144/203307 [18:17:43<212:06:12,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16145/203307 [18:17:46<212:06:04,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16145/203307 [18:17:46<212:06:04,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16146/203307 [18:17:50<212:05:56,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16146/203307 [18:17:50<212:05:56,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16147/203307 [18:17:54<212:05:48,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16147/203307 [18:17:54<212:05:48,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16148/203307 [18:17:57<212:05:40,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16148/203307 [18:17:57<212:05:40,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16149/203307 [18:18:02<212:05:39,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16149/203307 [18:18:02<212:05:40,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16150/203307 [18:18:06<212:05:38,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16150/203307 [18:18:06<212:05:38,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16151/203307 [18:18:10<212:05:30,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16151/203307 [18:18:10<212:05:30,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16152/203307 [18:18:14<212:05:30,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16152/203307 [18:18:14<212:05:30,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16153/203307 [18:18:19<212:05:31,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16153/203307 [18:18:19<212:05:31,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16154/203307 [18:18:23<212:05:23,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16154/203307 [18:18:23<212:05:23,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16155/203307 [18:18:26<212:05:15,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16155/203307 [18:18:26<212:05:15,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16156/203307 [18:18:30<212:05:07,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16156/203307 [18:18:30<212:05:07,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16157/203307 [18:18:34<212:05:00,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16157/203307 [18:18:34<212:05:00,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16158/203307 [18:18:38<212:04:59,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16158/203307 [18:18:38<212:04:59,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16159/203307 [18:18:42<212:04:51,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16159/203307 [18:18:42<212:04:52,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16160/203307 [18:18:46<212:04:49,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16160/203307 [18:18:46<212:04:49,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16161/203307 [18:18:51<212:04:49,  0.25it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:   8%|▊         | 16161/203307 [18:18:51<212:04:49,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16162/203307 [18:18:55<212:04:48,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16162/203307 [18:18:55<212:04:48,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16163/203307 [18:18:59<212:04:40,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16163/203307 [18:18:59<212:04:40,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16164/203307 [18:19:03<212:04:32,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16164/203307 [18:19:03<212:04:32,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16165/203307 [18:19:06<212:04:24,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16165/203307 [18:19:06<212:04:25,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16166/203307 [18:19:11<212:04:23,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16166/203307 [18:19:11<212:04:23,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16167/203307 [18:19:15<212:04:21,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16167/203307 [18:19:15<212:04:21,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16168/203307 [18:19:18<212:04:12,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16168/203307 [18:19:18<212:04:12,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16169/203307 [18:19:23<212:04:12,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16169/203307 [18:19:23<212:04:12,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16170/203307 [18:19:27<212:04:12,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16170/203307 [18:19:27<212:04:12,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16171/203307 [18:19:31<212:04:04,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16171/203307 [18:19:31<212:04:04,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16172/203307 [18:19:35<212:03:55,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16172/203307 [18:19:35<212:03:55,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16173/203307 [18:19:38<212:03:47,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16173/203307 [18:19:38<212:03:47,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16174/203307 [18:19:42<212:03:38,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16174/203307 [18:19:42<212:03:38,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16175/203307 [18:19:46<212:03:37,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16175/203307 [18:19:46<212:03:37,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16176/203307 [18:19:51<212:03:34,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16176/203307 [18:19:51<212:03:35,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16177/203307 [18:19:55<212:03:34,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16177/203307 [18:19:55<212:03:34,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16178/203307 [18:20:00<212:03:34,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16178/203307 [18:20:00<212:03:34,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16179/203307 [18:20:04<212:03:34,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16179/203307 [18:20:04<212:03:34,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16180/203307 [18:20:08<212:03:25,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16180/203307 [18:20:08<212:03:25,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16181/203307 [18:20:11<212:03:17,  0.25it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:   8%|▊         | 16181/203307 [18:20:11<212:03:17,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16182/203307 [18:20:15<212:03:09,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16182/203307 [18:20:15<212:03:09,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16183/203307 [18:20:19<212:03:07,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16183/203307 [18:20:19<212:03:07,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16184/203307 [18:20:23<212:02:58,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16184/203307 [18:20:23<212:02:58,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16185/203307 [18:20:27<212:02:57,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16185/203307 [18:20:27<212:02:57,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16186/203307 [18:20:32<212:02:56,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16186/203307 [18:20:32<212:02:56,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16187/203307 [18:20:35<212:02:48,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16187/203307 [18:20:35<212:02:48,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16188/203307 [18:20:40<212:02:48,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16188/203307 [18:20:40<212:02:49,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16189/203307 [18:20:44<212:02:40,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16189/203307 [18:20:44<212:02:40,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16190/203307 [18:20:47<212:02:31,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16190/203307 [18:20:47<212:02:32,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16191/203307 [18:20:52<212:02:30,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16191/203307 [18:20:52<212:02:30,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16192/203307 [18:20:55<212:02:22,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16192/203307 [18:20:55<212:02:22,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16193/203307 [18:20:59<212:02:13,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16193/203307 [18:20:59<212:02:13,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16194/203307 [18:21:04<212:02:14,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16194/203307 [18:21:04<212:02:14,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16195/203307 [18:21:07<212:02:06,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16195/203307 [18:21:07<212:02:06,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16196/203307 [18:21:12<212:02:06,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16196/203307 [18:21:12<212:02:06,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16197/203307 [18:21:15<212:01:58,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16197/203307 [18:21:15<212:01:58,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16198/203307 [18:21:19<212:01:49,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16198/203307 [18:21:19<212:01:49,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16199/203307 [18:21:23<212:01:42,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16199/203307 [18:21:23<212:01:42,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16200/203307 [18:21:27<212:01:41,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16200/203307 [18:21:27<212:01:41,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16201/203307 [18:21:31<212:01:33,  0.25it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   8%|▊         | 16201/203307 [18:21:31<212:01:33,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16202/203307 [18:21:35<212:01:32,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16202/203307 [18:21:35<212:01:32,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16203/203307 [18:21:40<212:01:31,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16203/203307 [18:21:40<212:01:32,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16204/203307 [18:21:44<212:01:24,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16204/203307 [18:21:44<212:01:24,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16205/203307 [18:21:48<212:01:24,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16205/203307 [18:21:48<212:01:24,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16206/203307 [18:21:52<212:01:17,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16206/203307 [18:21:52<212:01:17,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16207/203307 [18:21:55<212:01:08,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16207/203307 [18:21:55<212:01:08,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16208/203307 [18:22:00<212:01:07,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16208/203307 [18:22:00<212:01:07,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16209/203307 [18:22:04<212:00:59,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16209/203307 [18:22:04<212:00:59,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16210/203307 [18:22:08<212:00:58,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16210/203307 [18:22:08<212:00:58,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16211/203307 [18:22:12<212:00:58,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16211/203307 [18:22:12<212:00:58,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16212/203307 [18:22:17<212:00:56,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16212/203307 [18:22:17<212:00:56,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16213/203307 [18:22:20<212:00:48,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16213/203307 [18:22:20<212:00:48,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16214/203307 [18:22:25<212:00:48,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16214/203307 [18:22:25<212:00:48,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16215/203307 [18:22:28<212:00:39,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16215/203307 [18:22:28<212:00:39,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16216/203307 [18:22:33<212:00:37,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16216/203307 [18:22:33<212:00:37,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16217/203307 [18:22:36<212:00:29,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16217/203307 [18:22:36<212:00:29,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16218/203307 [18:22:40<212:00:20,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16218/203307 [18:22:40<212:00:20,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16219/203307 [18:22:45<212:00:21,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16219/203307 [18:22:45<212:00:21,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16220/203307 [18:22:48<212:00:13,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16220/203307 [18:22:48<212:00:13,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16221/203307 [18:22:53<212:00:11,  0.25it/s, v_num=t5e6, training/loss=0.0997]Epoch 0:   8%|▊         | 16221/203307 [18:22:53<212:00:12,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16222/203307 [18:22:57<212:00:11,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16222/203307 [18:22:57<212:00:11,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16223/203307 [18:23:01<212:00:03,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16223/203307 [18:23:01<212:00:03,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16224/203307 [18:23:04<211:59:55,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16224/203307 [18:23:04<211:59:55,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16225/203307 [18:23:09<211:59:54,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16225/203307 [18:23:09<211:59:54,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16226/203307 [18:23:13<211:59:46,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16226/203307 [18:23:13<211:59:46,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16227/203307 [18:23:17<211:59:45,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16227/203307 [18:23:17<211:59:45,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16228/203307 [18:23:21<211:59:45,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16228/203307 [18:23:21<211:59:45,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16229/203307 [18:23:25<211:59:36,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16229/203307 [18:23:25<211:59:36,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16230/203307 [18:23:29<211:59:33,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16230/203307 [18:23:29<211:59:33,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16231/203307 [18:23:34<211:59:34,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16231/203307 [18:23:34<211:59:34,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16232/203307 [18:23:37<211:59:26,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16232/203307 [18:23:37<211:59:26,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16233/203307 [18:23:42<211:59:24,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16233/203307 [18:23:42<211:59:24,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16234/203307 [18:23:45<211:59:16,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16234/203307 [18:23:45<211:59:16,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16235/203307 [18:23:50<211:59:14,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16235/203307 [18:23:50<211:59:14,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16236/203307 [18:23:54<211:59:13,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16236/203307 [18:23:54<211:59:13,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16237/203307 [18:23:58<211:59:05,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16237/203307 [18:23:58<211:59:05,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16238/203307 [18:24:01<211:58:56,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16238/203307 [18:24:01<211:58:56,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16239/203307 [18:24:06<211:58:55,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16239/203307 [18:24:06<211:58:55,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16240/203307 [18:24:10<211:58:56,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16240/203307 [18:24:10<211:58:56,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16241/203307 [18:24:14<211:58:53,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16241/203307 [18:24:14<211:58:53,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16242/203307 [18:24:18<211:58:44,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16242/203307 [18:24:18<211:58:45,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16243/203307 [18:24:22<211:58:36,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16243/203307 [18:24:22<211:58:36,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16244/203307 [18:24:26<211:58:37,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16244/203307 [18:24:26<211:58:37,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16245/203307 [18:24:30<211:58:30,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16245/203307 [18:24:30<211:58:30,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16246/203307 [18:24:34<211:58:22,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16246/203307 [18:24:34<211:58:22,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16247/203307 [18:24:38<211:58:14,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16247/203307 [18:24:38<211:58:14,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16248/203307 [18:24:42<211:58:14,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16248/203307 [18:24:42<211:58:14,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16249/203307 [18:24:46<211:58:07,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16249/203307 [18:24:46<211:58:07,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16250/203307 [18:24:50<211:58:05,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16250/203307 [18:24:50<211:58:05,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16251/203307 [18:24:54<211:57:57,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16251/203307 [18:24:54<211:57:57,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16252/203307 [18:24:58<211:57:56,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16252/203307 [18:24:58<211:57:56,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16253/203307 [18:25:03<211:57:56,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16253/203307 [18:25:03<211:57:56,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16254/203307 [18:25:06<211:57:48,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16254/203307 [18:25:06<211:57:48,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16255/203307 [18:25:10<211:57:40,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16255/203307 [18:25:10<211:57:40,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16256/203307 [18:25:14<211:57:32,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16256/203307 [18:25:14<211:57:32,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16257/203307 [18:25:18<211:57:33,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16257/203307 [18:25:18<211:57:33,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16258/203307 [18:25:23<211:57:31,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16258/203307 [18:25:23<211:57:31,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16259/203307 [18:25:26<211:57:23,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16259/203307 [18:25:26<211:57:23,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16260/203307 [18:25:31<211:57:22,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16260/203307 [18:25:31<211:57:22,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16261/203307 [18:25:35<211:57:22,  0.25it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   8%|▊         | 16261/203307 [18:25:35<211:57:22,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16262/203307 [18:25:39<211:57:14,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16262/203307 [18:25:39<211:57:14,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16263/203307 [18:25:43<211:57:09,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16263/203307 [18:25:43<211:57:09,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16264/203307 [18:25:47<211:57:01,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16264/203307 [18:25:47<211:57:01,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16265/203307 [18:25:50<211:56:52,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16265/203307 [18:25:50<211:56:52,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16266/203307 [18:25:55<211:56:53,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16266/203307 [18:25:55<211:56:53,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16267/203307 [18:25:59<211:56:45,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16267/203307 [18:25:59<211:56:45,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16268/203307 [18:26:02<211:56:37,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16268/203307 [18:26:02<211:56:37,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16269/203307 [18:26:07<211:56:38,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16269/203307 [18:26:07<211:56:38,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16270/203307 [18:26:11<211:56:30,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16270/203307 [18:26:11<211:56:31,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16271/203307 [18:26:14<211:56:22,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16271/203307 [18:26:14<211:56:22,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16272/203307 [18:26:18<211:56:15,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16272/203307 [18:26:18<211:56:15,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16273/203307 [18:26:22<211:56:07,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16273/203307 [18:26:22<211:56:08,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16274/203307 [18:26:26<211:56:08,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16274/203307 [18:26:26<211:56:08,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16275/203307 [18:26:31<211:56:06,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16275/203307 [18:26:31<211:56:06,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16276/203307 [18:26:34<211:55:57,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16276/203307 [18:26:34<211:55:58,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16277/203307 [18:26:39<211:55:56,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16277/203307 [18:26:39<211:55:56,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16278/203307 [18:26:43<211:55:55,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16278/203307 [18:26:43<211:55:55,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16279/203307 [18:26:47<211:55:47,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16279/203307 [18:26:47<211:55:47,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16280/203307 [18:26:50<211:55:37,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16280/203307 [18:26:50<211:55:38,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16281/203307 [18:26:54<211:55:29,  0.25it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:   8%|▊         | 16281/203307 [18:26:54<211:55:30,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16282/203307 [18:26:58<211:55:22,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16282/203307 [18:26:58<211:55:22,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16283/203307 [18:27:02<211:55:22,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16283/203307 [18:27:02<211:55:22,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16284/203307 [18:27:07<211:55:19,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16284/203307 [18:27:07<211:55:19,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16285/203307 [18:27:11<211:55:17,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16285/203307 [18:27:11<211:55:17,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16286/203307 [18:27:15<211:55:16,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16286/203307 [18:27:15<211:55:17,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16287/203307 [18:27:19<211:55:08,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16287/203307 [18:27:19<211:55:08,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16288/203307 [18:27:23<211:55:01,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16288/203307 [18:27:23<211:55:01,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16289/203307 [18:27:27<211:54:54,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16289/203307 [18:27:27<211:54:54,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16290/203307 [18:27:30<211:54:47,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16290/203307 [18:27:30<211:54:47,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16291/203307 [18:27:35<211:54:45,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16291/203307 [18:27:35<211:54:45,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16292/203307 [18:27:39<211:54:46,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16292/203307 [18:27:39<211:54:46,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16293/203307 [18:27:43<211:54:43,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16293/203307 [18:27:43<211:54:43,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16294/203307 [18:27:48<211:54:45,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16294/203307 [18:27:48<211:54:45,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16295/203307 [18:27:52<211:54:37,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16295/203307 [18:27:52<211:54:37,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16296/203307 [18:27:55<211:54:29,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16296/203307 [18:27:55<211:54:29,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16297/203307 [18:27:59<211:54:21,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16297/203307 [18:27:59<211:54:21,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16298/203307 [18:28:03<211:54:14,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16298/203307 [18:28:03<211:54:14,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16299/203307 [18:28:07<211:54:05,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16299/203307 [18:28:07<211:54:05,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16300/203307 [18:28:11<211:54:06,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16300/203307 [18:28:11<211:54:06,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16301/203307 [18:28:15<211:53:59,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 16301/203307 [18:28:15<211:53:59,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16302/203307 [18:28:19<211:53:59,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16302/203307 [18:28:19<211:54:00,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16303/203307 [18:28:24<211:53:59,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16303/203307 [18:28:24<211:53:59,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16304/203307 [18:28:28<211:53:51,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16304/203307 [18:28:28<211:53:51,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16305/203307 [18:28:31<211:53:42,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16305/203307 [18:28:31<211:53:42,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16306/203307 [18:28:35<211:53:33,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16306/203307 [18:28:35<211:53:34,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16307/203307 [18:28:39<211:53:26,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16307/203307 [18:28:39<211:53:26,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16308/203307 [18:28:43<211:53:26,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16308/203307 [18:28:43<211:53:26,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16309/203307 [18:28:48<211:53:26,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16309/203307 [18:28:48<211:53:26,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16310/203307 [18:28:52<211:53:23,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16310/203307 [18:28:52<211:53:23,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16311/203307 [18:28:56<211:53:23,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16311/203307 [18:28:56<211:53:23,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16312/203307 [18:29:00<211:53:14,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16312/203307 [18:29:00<211:53:14,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16313/203307 [18:29:03<211:53:05,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16313/203307 [18:29:03<211:53:05,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16314/203307 [18:29:08<211:53:01,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16314/203307 [18:29:08<211:53:01,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16315/203307 [18:29:11<211:52:52,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16315/203307 [18:29:11<211:52:52,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16316/203307 [18:29:15<211:52:50,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16316/203307 [18:29:15<211:52:50,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16317/203307 [18:29:19<211:52:42,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16317/203307 [18:29:19<211:52:42,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16318/203307 [18:29:24<211:52:42,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16318/203307 [18:29:24<211:52:42,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16319/203307 [18:29:28<211:52:42,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16319/203307 [18:29:28<211:52:42,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16320/203307 [18:29:32<211:52:38,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16320/203307 [18:29:32<211:52:39,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16321/203307 [18:29:36<211:52:30,  0.25it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:   8%|▊         | 16321/203307 [18:29:36<211:52:30,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16322/203307 [18:29:40<211:52:21,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16322/203307 [18:29:40<211:52:21,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16323/203307 [18:29:43<211:52:12,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16323/203307 [18:29:43<211:52:12,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16324/203307 [18:29:47<211:52:04,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16324/203307 [18:29:47<211:52:04,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16325/203307 [18:29:51<211:52:02,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16325/203307 [18:29:51<211:52:02,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16326/203307 [18:29:56<211:52:02,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16326/203307 [18:29:56<211:52:02,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16327/203307 [18:30:00<211:52:00,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16327/203307 [18:30:00<211:52:00,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16328/203307 [18:30:04<211:51:58,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16328/203307 [18:30:04<211:51:59,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16329/203307 [18:30:08<211:51:55,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16329/203307 [18:30:08<211:51:55,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16330/203307 [18:30:12<211:51:47,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16330/203307 [18:30:12<211:51:47,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16331/203307 [18:30:16<211:51:39,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16331/203307 [18:30:16<211:51:39,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16332/203307 [18:30:20<211:51:32,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16332/203307 [18:30:20<211:51:32,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16333/203307 [18:30:24<211:51:29,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16333/203307 [18:30:24<211:51:29,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16334/203307 [18:30:28<211:51:21,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16334/203307 [18:30:28<211:51:21,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16335/203307 [18:30:32<211:51:21,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16335/203307 [18:30:32<211:51:21,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16336/203307 [18:30:36<211:51:19,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16336/203307 [18:30:36<211:51:19,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16337/203307 [18:30:40<211:51:10,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16337/203307 [18:30:40<211:51:11,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16338/203307 [18:30:44<211:51:09,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16338/203307 [18:30:44<211:51:09,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16339/203307 [18:30:48<211:51:00,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16339/203307 [18:30:48<211:51:00,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16340/203307 [18:30:51<211:50:51,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16340/203307 [18:30:51<211:50:51,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16341/203307 [18:30:56<211:50:49,  0.25it/s, v_num=t5e6, training/loss=0.0906]Epoch 0:   8%|▊         | 16341/203307 [18:30:56<211:50:49,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16342/203307 [18:30:59<211:50:41,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16342/203307 [18:30:59<211:50:41,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16343/203307 [18:31:03<211:50:31,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16343/203307 [18:31:03<211:50:31,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16344/203307 [18:31:08<211:50:31,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16344/203307 [18:31:08<211:50:31,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16345/203307 [18:31:11<211:50:22,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16345/203307 [18:31:11<211:50:22,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16346/203307 [18:31:15<211:50:13,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16346/203307 [18:31:15<211:50:13,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16347/203307 [18:31:19<211:50:11,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16347/203307 [18:31:19<211:50:11,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16348/203307 [18:31:23<211:50:02,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16348/203307 [18:31:23<211:50:02,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16349/203307 [18:31:26<211:49:53,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16349/203307 [18:31:26<211:49:53,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16350/203307 [18:31:31<211:49:51,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16350/203307 [18:31:31<211:49:52,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16351/203307 [18:31:34<211:49:43,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16351/203307 [18:31:34<211:49:43,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16352/203307 [18:31:39<211:49:42,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16352/203307 [18:31:39<211:49:42,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16353/203307 [18:31:43<211:49:41,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16353/203307 [18:31:43<211:49:41,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16354/203307 [18:31:47<211:49:31,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16354/203307 [18:31:47<211:49:32,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16355/203307 [18:31:50<211:49:22,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16355/203307 [18:31:50<211:49:22,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16356/203307 [18:31:54<211:49:19,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16356/203307 [18:31:54<211:49:20,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16357/203307 [18:31:58<211:49:10,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16357/203307 [18:31:58<211:49:10,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16358/203307 [18:32:02<211:49:08,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16358/203307 [18:32:02<211:49:08,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16359/203307 [18:32:06<211:48:59,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16359/203307 [18:32:06<211:48:59,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16360/203307 [18:32:10<211:48:58,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16360/203307 [18:32:10<211:48:58,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16361/203307 [18:32:15<211:48:57,  0.25it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:   8%|▊         | 16361/203307 [18:32:15<211:48:57,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16362/203307 [18:32:18<211:48:50,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16362/203307 [18:32:18<211:48:50,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16363/203307 [18:32:22<211:48:42,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16363/203307 [18:32:22<211:48:42,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16364/203307 [18:32:26<211:48:35,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16364/203307 [18:32:26<211:48:35,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16365/203307 [18:32:30<211:48:32,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16365/203307 [18:32:30<211:48:32,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16366/203307 [18:32:35<211:48:31,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16366/203307 [18:32:35<211:48:31,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16367/203307 [18:32:38<211:48:23,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16367/203307 [18:32:38<211:48:23,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16368/203307 [18:32:42<211:48:13,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16368/203307 [18:32:42<211:48:13,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16369/203307 [18:32:46<211:48:14,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16369/203307 [18:32:46<211:48:14,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16370/203307 [18:32:51<211:48:14,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16370/203307 [18:32:51<211:48:14,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16371/203307 [18:32:55<211:48:07,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16371/203307 [18:32:55<211:48:07,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16372/203307 [18:32:58<211:47:58,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16372/203307 [18:32:58<211:47:58,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16373/203307 [18:33:02<211:47:49,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16373/203307 [18:33:02<211:47:50,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16374/203307 [18:33:06<211:47:48,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16374/203307 [18:33:06<211:47:48,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16375/203307 [18:33:11<211:47:46,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16375/203307 [18:33:11<211:47:46,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16376/203307 [18:33:14<211:47:40,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16376/203307 [18:33:14<211:47:40,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16377/203307 [18:33:19<211:47:37,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16377/203307 [18:33:19<211:47:37,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16378/203307 [18:33:23<211:47:38,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16378/203307 [18:33:23<211:47:38,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16379/203307 [18:33:27<211:47:30,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16379/203307 [18:33:27<211:47:30,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16380/203307 [18:33:31<211:47:22,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16380/203307 [18:33:31<211:47:22,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16381/203307 [18:33:34<211:47:14,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16381/203307 [18:33:34<211:47:14,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16382/203307 [18:33:38<211:47:05,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16382/203307 [18:33:38<211:47:05,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16383/203307 [18:33:42<211:47:04,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16383/203307 [18:33:42<211:47:04,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16384/203307 [18:33:46<211:46:55,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16384/203307 [18:33:46<211:46:55,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16385/203307 [18:33:50<211:46:53,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16385/203307 [18:33:50<211:46:53,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16386/203307 [18:33:55<211:46:52,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16386/203307 [18:33:55<211:46:52,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16387/203307 [18:33:59<211:46:52,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16387/203307 [18:33:59<211:46:52,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16388/203307 [18:34:03<211:46:43,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16388/203307 [18:34:03<211:46:43,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16389/203307 [18:34:06<211:46:34,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16389/203307 [18:34:06<211:46:35,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16390/203307 [18:34:10<211:46:26,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16390/203307 [18:34:10<211:46:26,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16391/203307 [18:34:14<211:46:24,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16391/203307 [18:34:14<211:46:24,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16392/203307 [18:34:19<211:46:22,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16392/203307 [18:34:19<211:46:22,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16393/203307 [18:34:22<211:46:13,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16393/203307 [18:34:22<211:46:13,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16394/203307 [18:34:27<211:46:13,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16394/203307 [18:34:27<211:46:13,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16395/203307 [18:34:30<211:46:04,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16395/203307 [18:34:30<211:46:04,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16396/203307 [18:34:35<211:46:04,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16396/203307 [18:34:35<211:46:04,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16397/203307 [18:34:38<211:45:55,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16397/203307 [18:34:38<211:45:55,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16398/203307 [18:34:42<211:45:46,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16398/203307 [18:34:42<211:45:46,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16399/203307 [18:34:46<211:45:37,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16399/203307 [18:34:46<211:45:37,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16400/203307 [18:34:50<211:45:36,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16400/203307 [18:34:50<211:45:36,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16401/203307 [18:34:54<211:45:34,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16401/203307 [18:34:54<211:45:34,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16402/203307 [18:34:59<211:45:32,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16402/203307 [18:34:59<211:45:32,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16403/203307 [18:35:03<211:45:31,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16403/203307 [18:35:03<211:45:31,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16404/203307 [18:35:07<211:45:30,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16404/203307 [18:35:07<211:45:30,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16405/203307 [18:35:11<211:45:21,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16405/203307 [18:35:11<211:45:21,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16406/203307 [18:35:15<211:45:14,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16406/203307 [18:35:15<211:45:14,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16407/203307 [18:35:19<211:45:07,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16407/203307 [18:35:19<211:45:07,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16408/203307 [18:35:23<211:45:06,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16408/203307 [18:35:23<211:45:06,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16409/203307 [18:35:27<211:44:59,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16409/203307 [18:35:27<211:44:59,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16410/203307 [18:35:31<211:44:57,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16410/203307 [18:35:31<211:44:57,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16411/203307 [18:35:35<211:44:56,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16411/203307 [18:35:35<211:44:56,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16412/203307 [18:35:39<211:44:48,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16412/203307 [18:35:39<211:44:48,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16413/203307 [18:35:44<211:44:50,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16413/203307 [18:35:44<211:44:50,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16414/203307 [18:35:47<211:44:42,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16414/203307 [18:35:47<211:44:42,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16415/203307 [18:35:51<211:44:33,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16415/203307 [18:35:51<211:44:33,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16416/203307 [18:35:55<211:44:32,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16416/203307 [18:35:55<211:44:32,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16417/203307 [18:35:59<211:44:24,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16417/203307 [18:35:59<211:44:24,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16418/203307 [18:36:03<211:44:15,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16418/203307 [18:36:03<211:44:16,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16419/203307 [18:36:07<211:44:16,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16419/203307 [18:36:07<211:44:17,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16420/203307 [18:36:11<211:44:09,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16420/203307 [18:36:11<211:44:09,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16421/203307 [18:36:15<211:44:01,  0.25it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:   8%|▊         | 16421/203307 [18:36:15<211:44:01,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16422/203307 [18:36:20<211:44:03,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16422/203307 [18:36:20<211:44:03,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16423/203307 [18:36:23<211:43:55,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16423/203307 [18:36:23<211:43:55,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16424/203307 [18:36:27<211:43:47,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16424/203307 [18:36:27<211:43:47,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16425/203307 [18:36:31<211:43:47,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16425/203307 [18:36:31<211:43:47,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16426/203307 [18:36:35<211:43:38,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16426/203307 [18:36:35<211:43:38,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16427/203307 [18:36:39<211:43:37,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16427/203307 [18:36:39<211:43:37,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16428/203307 [18:36:44<211:43:37,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16428/203307 [18:36:44<211:43:37,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16429/203307 [18:36:48<211:43:29,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16429/203307 [18:36:48<211:43:29,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16430/203307 [18:36:52<211:43:29,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16430/203307 [18:36:52<211:43:29,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16431/203307 [18:36:56<211:43:21,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16431/203307 [18:36:56<211:43:22,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16432/203307 [18:37:00<211:43:14,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16432/203307 [18:37:00<211:43:14,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16433/203307 [18:37:04<211:43:12,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16433/203307 [18:37:04<211:43:12,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16434/203307 [18:37:08<211:43:04,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16434/203307 [18:37:08<211:43:04,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16435/203307 [18:37:12<211:43:03,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16435/203307 [18:37:12<211:43:03,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16436/203307 [18:37:16<211:43:03,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16436/203307 [18:37:16<211:43:03,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16437/203307 [18:37:20<211:42:59,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16437/203307 [18:37:20<211:42:59,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16438/203307 [18:37:24<211:42:51,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16438/203307 [18:37:24<211:42:52,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16439/203307 [18:37:29<211:42:53,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16439/203307 [18:37:29<211:42:53,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16440/203307 [18:37:33<211:42:46,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16440/203307 [18:37:33<211:42:46,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16441/203307 [18:37:37<211:42:45,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16441/203307 [18:37:37<211:42:45,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16442/203307 [18:37:41<211:42:38,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16442/203307 [18:37:41<211:42:38,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16443/203307 [18:37:44<211:42:29,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16443/203307 [18:37:44<211:42:29,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16444/203307 [18:37:49<211:42:30,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16444/203307 [18:37:49<211:42:30,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16445/203307 [18:37:53<211:42:22,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16445/203307 [18:37:53<211:42:22,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16446/203307 [18:37:57<211:42:19,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16446/203307 [18:37:57<211:42:19,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16447/203307 [18:38:01<211:42:11,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16447/203307 [18:38:01<211:42:11,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16448/203307 [18:38:05<211:42:12,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16448/203307 [18:38:05<211:42:12,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16449/203307 [18:38:09<211:42:03,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16449/203307 [18:38:09<211:42:03,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16450/203307 [18:38:13<211:42:03,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16450/203307 [18:38:13<211:42:03,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16451/203307 [18:38:17<211:41:56,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16451/203307 [18:38:17<211:41:56,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16452/203307 [18:38:21<211:41:55,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16452/203307 [18:38:21<211:41:55,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16453/203307 [18:38:26<211:41:55,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16453/203307 [18:38:26<211:41:55,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16454/203307 [18:38:30<211:41:48,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16454/203307 [18:38:30<211:41:48,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16455/203307 [18:38:34<211:41:44,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16455/203307 [18:38:34<211:41:44,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16456/203307 [18:38:38<211:41:44,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16456/203307 [18:38:38<211:41:44,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16457/203307 [18:38:42<211:41:38,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16457/203307 [18:38:42<211:41:38,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16458/203307 [18:38:46<211:41:35,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16458/203307 [18:38:46<211:41:35,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16459/203307 [18:38:50<211:41:27,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16459/203307 [18:38:50<211:41:27,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16460/203307 [18:38:54<211:41:26,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16460/203307 [18:38:54<211:41:26,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16461/203307 [18:38:59<211:41:25,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 16461/203307 [18:38:59<211:41:25,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16462/203307 [18:39:02<211:41:17,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16462/203307 [18:39:02<211:41:17,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16463/203307 [18:39:06<211:41:08,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16463/203307 [18:39:06<211:41:09,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16464/203307 [18:39:10<211:41:06,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16464/203307 [18:39:10<211:41:06,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16465/203307 [18:39:15<211:41:05,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16465/203307 [18:39:15<211:41:05,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16466/203307 [18:39:19<211:41:03,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16466/203307 [18:39:19<211:41:03,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16467/203307 [18:39:23<211:40:55,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16467/203307 [18:39:23<211:40:55,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16468/203307 [18:39:26<211:40:48,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16468/203307 [18:39:27<211:40:48,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16469/203307 [18:39:31<211:40:49,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16469/203307 [18:39:31<211:40:49,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16470/203307 [18:39:35<211:40:42,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16470/203307 [18:39:35<211:40:42,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16471/203307 [18:39:39<211:40:34,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16471/203307 [18:39:39<211:40:34,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16472/203307 [18:39:42<211:40:26,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16472/203307 [18:39:42<211:40:26,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16473/203307 [18:39:47<211:40:25,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16473/203307 [18:39:47<211:40:25,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16474/203307 [18:39:51<211:40:25,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16474/203307 [18:39:51<211:40:26,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16475/203307 [18:39:55<211:40:24,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16475/203307 [18:39:55<211:40:24,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16476/203307 [18:39:59<211:40:15,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16476/203307 [18:39:59<211:40:16,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16477/203307 [18:40:04<211:40:16,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16477/203307 [18:40:04<211:40:16,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16478/203307 [18:40:08<211:40:15,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16478/203307 [18:40:08<211:40:15,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16479/203307 [18:40:12<211:40:08,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16479/203307 [18:40:12<211:40:08,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16480/203307 [18:40:16<211:40:00,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16480/203307 [18:40:16<211:40:00,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16481/203307 [18:40:19<211:39:51,  0.25it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   8%|▊         | 16481/203307 [18:40:19<211:39:51,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16482/203307 [18:40:24<211:39:52,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16482/203307 [18:40:24<211:39:52,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16483/203307 [18:40:28<211:39:50,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16483/203307 [18:40:28<211:39:50,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16484/203307 [18:40:32<211:39:43,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16484/203307 [18:40:32<211:39:43,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16485/203307 [18:40:36<211:39:40,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16485/203307 [18:40:36<211:39:40,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16486/203307 [18:40:40<211:39:41,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16486/203307 [18:40:40<211:39:41,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16487/203307 [18:40:44<211:39:33,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16487/203307 [18:40:44<211:39:33,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16488/203307 [18:40:48<211:39:26,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16488/203307 [18:40:48<211:39:26,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16489/203307 [18:40:52<211:39:18,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16489/203307 [18:40:52<211:39:18,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16490/203307 [18:40:56<211:39:11,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16490/203307 [18:40:56<211:39:11,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16491/203307 [18:41:00<211:39:11,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16491/203307 [18:41:00<211:39:11,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16492/203307 [18:41:04<211:39:03,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16492/203307 [18:41:04<211:39:03,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16493/203307 [18:41:07<211:38:54,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16493/203307 [18:41:07<211:38:54,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16494/203307 [18:41:12<211:38:55,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16494/203307 [18:41:12<211:38:55,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16495/203307 [18:41:16<211:38:48,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16495/203307 [18:41:16<211:38:48,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16496/203307 [18:41:20<211:38:41,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16496/203307 [18:41:20<211:38:41,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16497/203307 [18:41:23<211:38:33,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16497/203307 [18:41:23<211:38:33,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16498/203307 [18:41:27<211:38:24,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16498/203307 [18:41:27<211:38:24,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16499/203307 [18:41:31<211:38:16,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16499/203307 [18:41:31<211:38:16,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16500/203307 [18:41:35<211:38:16,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16500/203307 [18:41:35<211:38:16,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16501/203307 [18:41:39<211:38:08,  0.25it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:   8%|▊         | 16501/203307 [18:41:39<211:38:08,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16502/203307 [18:41:43<211:38:06,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16502/203307 [18:41:43<211:38:06,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16503/203307 [18:41:47<211:38:05,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16503/203307 [18:41:47<211:38:05,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16504/203307 [18:41:51<211:37:56,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16504/203307 [18:41:51<211:37:56,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16505/203307 [18:41:55<211:37:47,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16505/203307 [18:41:55<211:37:47,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16506/203307 [18:41:59<211:37:39,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16506/203307 [18:41:59<211:37:40,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16507/203307 [18:42:02<211:37:32,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16507/203307 [18:42:02<211:37:32,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16508/203307 [18:42:07<211:37:32,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16508/203307 [18:42:07<211:37:32,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16509/203307 [18:42:11<211:37:29,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16509/203307 [18:42:11<211:37:29,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16510/203307 [18:42:15<211:37:27,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16510/203307 [18:42:15<211:37:27,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16511/203307 [18:42:20<211:37:26,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16511/203307 [18:42:20<211:37:26,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16512/203307 [18:42:23<211:37:18,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16512/203307 [18:42:23<211:37:18,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16513/203307 [18:42:27<211:37:10,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16513/203307 [18:42:27<211:37:10,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16514/203307 [18:42:31<211:37:02,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16514/203307 [18:42:31<211:37:02,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16515/203307 [18:42:34<211:36:54,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16515/203307 [18:42:34<211:36:54,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16516/203307 [18:42:39<211:36:52,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16516/203307 [18:42:39<211:36:52,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16517/203307 [18:42:43<211:36:52,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16517/203307 [18:42:43<211:36:52,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16518/203307 [18:42:47<211:36:49,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16518/203307 [18:42:47<211:36:49,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16519/203307 [18:42:52<211:36:48,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16519/203307 [18:42:52<211:36:49,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16520/203307 [18:42:55<211:36:41,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16520/203307 [18:42:55<211:36:41,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16521/203307 [18:42:59<211:36:33,  0.25it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:   8%|▊         | 16521/203307 [18:42:59<211:36:33,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16522/203307 [18:43:03<211:36:25,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16522/203307 [18:43:03<211:36:25,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16523/203307 [18:43:07<211:36:17,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16523/203307 [18:43:07<211:36:17,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16524/203307 [18:43:10<211:36:09,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16524/203307 [18:43:10<211:36:09,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16525/203307 [18:43:15<211:36:07,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16525/203307 [18:43:15<211:36:07,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16526/203307 [18:43:19<211:36:07,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16526/203307 [18:43:19<211:36:07,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16527/203307 [18:43:23<211:36:05,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16527/203307 [18:43:23<211:36:05,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16528/203307 [18:43:28<211:36:04,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16528/203307 [18:43:28<211:36:04,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16529/203307 [18:43:31<211:35:55,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16529/203307 [18:43:31<211:35:55,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16530/203307 [18:43:35<211:35:46,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16530/203307 [18:43:35<211:35:46,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16531/203307 [18:43:39<211:35:38,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16531/203307 [18:43:39<211:35:38,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16532/203307 [18:43:42<211:35:30,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16532/203307 [18:43:43<211:35:30,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16533/203307 [18:43:47<211:35:28,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16533/203307 [18:43:47<211:35:28,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16534/203307 [18:43:51<211:35:28,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16534/203307 [18:43:51<211:35:28,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16535/203307 [18:43:55<211:35:26,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16535/203307 [18:43:55<211:35:26,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16536/203307 [18:44:00<211:35:24,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16536/203307 [18:44:00<211:35:24,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16537/203307 [18:44:03<211:35:16,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16537/203307 [18:44:03<211:35:16,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16538/203307 [18:44:07<211:35:07,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16538/203307 [18:44:07<211:35:07,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16539/203307 [18:44:11<211:34:59,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16539/203307 [18:44:11<211:34:59,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16540/203307 [18:44:15<211:34:51,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16540/203307 [18:44:15<211:34:51,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16541/203307 [18:44:19<211:34:50,  0.25it/s, v_num=t5e6, training/loss=0.0776]Epoch 0:   8%|▊         | 16541/203307 [18:44:19<211:34:50,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16542/203307 [18:44:23<211:34:42,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16542/203307 [18:44:23<211:34:42,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16543/203307 [18:44:27<211:34:43,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16543/203307 [18:44:27<211:34:44,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16544/203307 [18:44:32<211:34:44,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16544/203307 [18:44:32<211:34:44,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16545/203307 [18:44:36<211:34:41,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16545/203307 [18:44:36<211:34:41,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16546/203307 [18:44:40<211:34:32,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16546/203307 [18:44:40<211:34:32,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16547/203307 [18:44:43<211:34:24,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16547/203307 [18:44:43<211:34:24,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16548/203307 [18:44:47<211:34:16,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16548/203307 [18:44:47<211:34:16,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16549/203307 [18:44:51<211:34:09,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16549/203307 [18:44:51<211:34:09,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16550/203307 [18:44:55<211:34:08,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16550/203307 [18:44:55<211:34:08,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16551/203307 [18:44:59<211:33:59,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16551/203307 [18:44:59<211:34:00,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16552/203307 [18:45:03<211:34:00,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16552/203307 [18:45:03<211:34:00,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16553/203307 [18:45:08<211:34:00,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16553/203307 [18:45:08<211:34:00,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16554/203307 [18:45:12<211:33:57,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16554/203307 [18:45:12<211:33:57,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16555/203307 [18:45:16<211:33:49,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16555/203307 [18:45:16<211:33:49,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16556/203307 [18:45:19<211:33:42,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16556/203307 [18:45:19<211:33:42,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16557/203307 [18:45:23<211:33:34,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16557/203307 [18:45:23<211:33:34,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16558/203307 [18:45:27<211:33:32,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16558/203307 [18:45:27<211:33:32,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16559/203307 [18:45:31<211:33:24,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16559/203307 [18:45:31<211:33:24,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16560/203307 [18:45:36<211:33:24,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16560/203307 [18:45:36<211:33:24,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16561/203307 [18:45:40<211:33:24,  0.25it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   8%|▊         | 16561/203307 [18:45:40<211:33:24,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16562/203307 [18:45:44<211:33:16,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16562/203307 [18:45:44<211:33:16,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16563/203307 [18:45:48<211:33:14,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16563/203307 [18:45:48<211:33:14,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16564/203307 [18:45:52<211:33:05,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16564/203307 [18:45:52<211:33:05,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16565/203307 [18:45:55<211:32:56,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16565/203307 [18:45:55<211:32:57,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16566/203307 [18:46:00<211:32:54,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16566/203307 [18:46:00<211:32:55,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16567/203307 [18:46:03<211:32:46,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16567/203307 [18:46:03<211:32:46,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16568/203307 [18:46:07<211:32:38,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16568/203307 [18:46:07<211:32:38,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16569/203307 [18:46:11<211:32:38,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16569/203307 [18:46:11<211:32:38,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16570/203307 [18:46:15<211:32:31,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16570/203307 [18:46:15<211:32:31,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16571/203307 [18:46:19<211:32:22,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16571/203307 [18:46:19<211:32:23,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16572/203307 [18:46:23<211:32:19,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16572/203307 [18:46:23<211:32:19,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16573/203307 [18:46:27<211:32:11,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16573/203307 [18:46:27<211:32:11,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16574/203307 [18:46:31<211:32:03,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16574/203307 [18:46:31<211:32:03,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16575/203307 [18:46:35<211:32:01,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16575/203307 [18:46:35<211:32:01,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16576/203307 [18:46:39<211:31:53,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16576/203307 [18:46:39<211:31:53,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16577/203307 [18:46:43<211:31:52,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16577/203307 [18:46:43<211:31:52,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16578/203307 [18:46:47<211:31:52,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16578/203307 [18:46:47<211:31:52,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16579/203307 [18:46:51<211:31:43,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16579/203307 [18:46:51<211:31:43,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16580/203307 [18:46:55<211:31:34,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16580/203307 [18:46:55<211:31:34,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16581/203307 [18:46:59<211:31:33,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16581/203307 [18:46:59<211:31:33,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16582/203307 [18:47:03<211:31:25,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16582/203307 [18:47:03<211:31:25,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16583/203307 [18:47:07<211:31:23,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16583/203307 [18:47:07<211:31:23,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16584/203307 [18:47:11<211:31:14,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16584/203307 [18:47:11<211:31:14,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16585/203307 [18:47:15<211:31:12,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16585/203307 [18:47:15<211:31:12,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16586/203307 [18:47:19<211:31:13,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16586/203307 [18:47:19<211:31:13,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16587/203307 [18:47:23<211:31:06,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16587/203307 [18:47:23<211:31:06,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16588/203307 [18:47:27<211:30:57,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16588/203307 [18:47:27<211:30:57,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16589/203307 [18:47:31<211:30:49,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16589/203307 [18:47:31<211:30:49,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16590/203307 [18:47:35<211:30:47,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16590/203307 [18:47:35<211:30:47,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16591/203307 [18:47:39<211:30:46,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16591/203307 [18:47:39<211:30:46,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16592/203307 [18:47:43<211:30:37,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16592/203307 [18:47:43<211:30:37,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16593/203307 [18:47:47<211:30:28,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16593/203307 [18:47:47<211:30:28,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16594/203307 [18:47:51<211:30:30,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16594/203307 [18:47:51<211:30:30,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16595/203307 [18:47:56<211:30:31,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16595/203307 [18:47:56<211:30:31,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16596/203307 [18:47:59<211:30:23,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16596/203307 [18:47:59<211:30:23,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16597/203307 [18:48:03<211:30:14,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16597/203307 [18:48:03<211:30:14,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16598/203307 [18:48:07<211:30:05,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16598/203307 [18:48:07<211:30:05,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16599/203307 [18:48:11<211:30:03,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16599/203307 [18:48:11<211:30:03,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16600/203307 [18:48:15<211:30:02,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16600/203307 [18:48:15<211:30:02,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16601/203307 [18:48:19<211:29:56,  0.25it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:   8%|▊         | 16601/203307 [18:48:19<211:29:56,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16602/203307 [18:48:23<211:29:54,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16602/203307 [18:48:23<211:29:54,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16603/203307 [18:48:28<211:29:54,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16603/203307 [18:48:28<211:29:55,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16604/203307 [18:48:32<211:29:53,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16604/203307 [18:48:32<211:29:53,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16605/203307 [18:48:36<211:29:44,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16605/203307 [18:48:36<211:29:44,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16606/203307 [18:48:40<211:29:35,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16606/203307 [18:48:40<211:29:35,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16607/203307 [18:48:43<211:29:27,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16607/203307 [18:48:43<211:29:27,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16608/203307 [18:48:48<211:29:25,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16608/203307 [18:48:48<211:29:25,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16609/203307 [18:48:51<211:29:16,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16609/203307 [18:48:51<211:29:16,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16610/203307 [18:48:55<211:29:14,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16610/203307 [18:48:55<211:29:14,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16611/203307 [18:49:00<211:29:13,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16611/203307 [18:49:00<211:29:13,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16612/203307 [18:49:04<211:29:13,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16612/203307 [18:49:04<211:29:13,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16613/203307 [18:49:08<211:29:05,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16613/203307 [18:49:08<211:29:05,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16614/203307 [18:49:12<211:28:57,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16614/203307 [18:49:12<211:28:57,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16615/203307 [18:49:15<211:28:48,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16615/203307 [18:49:15<211:28:49,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16616/203307 [18:49:20<211:28:47,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16616/203307 [18:49:20<211:28:47,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16617/203307 [18:49:24<211:28:45,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16617/203307 [18:49:24<211:28:45,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16618/203307 [18:49:28<211:28:35,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16618/203307 [18:49:28<211:28:36,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16619/203307 [18:49:32<211:28:37,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16619/203307 [18:49:32<211:28:37,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16620/203307 [18:49:36<211:28:29,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16620/203307 [18:49:36<211:28:29,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16621/203307 [18:49:40<211:28:29,  0.25it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:   8%|▊         | 16621/203307 [18:49:40<211:28:30,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16622/203307 [18:49:44<211:28:22,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16622/203307 [18:49:44<211:28:22,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16623/203307 [18:49:48<211:28:13,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16623/203307 [18:49:48<211:28:13,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16624/203307 [18:49:51<211:28:05,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16624/203307 [18:49:51<211:28:05,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16625/203307 [18:49:56<211:28:04,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16625/203307 [18:49:56<211:28:04,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16626/203307 [18:50:00<211:28:02,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16626/203307 [18:50:00<211:28:02,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16627/203307 [18:50:04<211:28:01,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16627/203307 [18:50:04<211:28:01,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16628/203307 [18:50:09<211:28:01,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16628/203307 [18:50:09<211:28:01,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16629/203307 [18:50:13<211:27:53,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16629/203307 [18:50:13<211:27:53,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16630/203307 [18:50:17<211:27:53,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16630/203307 [18:50:17<211:27:53,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16631/203307 [18:50:21<211:27:46,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16631/203307 [18:50:21<211:27:46,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16632/203307 [18:50:25<211:27:38,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16632/203307 [18:50:25<211:27:38,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16633/203307 [18:50:29<211:27:37,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16633/203307 [18:50:29<211:27:37,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16634/203307 [18:50:33<211:27:30,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16634/203307 [18:50:33<211:27:30,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16635/203307 [18:50:37<211:27:29,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16635/203307 [18:50:37<211:27:29,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16636/203307 [18:50:42<211:27:28,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16636/203307 [18:50:42<211:27:28,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16637/203307 [18:50:45<211:27:20,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16637/203307 [18:50:45<211:27:20,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16638/203307 [18:50:50<211:27:20,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16638/203307 [18:50:50<211:27:20,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16639/203307 [18:50:53<211:27:12,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16639/203307 [18:50:53<211:27:12,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16640/203307 [18:50:57<211:27:04,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16640/203307 [18:50:57<211:27:04,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16641/203307 [18:51:01<211:27:02,  0.25it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:   8%|▊         | 16641/203307 [18:51:01<211:27:03,  0.25it/s, v_num=t5e6, training/loss=0.087] Epoch 0:   8%|▊         | 16642/203307 [18:51:05<211:26:54,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16642/203307 [18:51:05<211:26:54,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16643/203307 [18:51:09<211:26:46,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16643/203307 [18:51:09<211:26:46,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16644/203307 [18:51:13<211:26:47,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16644/203307 [18:51:13<211:26:47,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16645/203307 [18:51:17<211:26:39,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16645/203307 [18:51:17<211:26:39,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16646/203307 [18:51:21<211:26:32,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16646/203307 [18:51:21<211:26:32,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16647/203307 [18:51:25<211:26:33,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16647/203307 [18:51:25<211:26:33,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16648/203307 [18:51:29<211:26:24,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16648/203307 [18:51:29<211:26:24,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16649/203307 [18:51:33<211:26:16,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16649/203307 [18:51:33<211:26:16,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16650/203307 [18:51:37<211:26:15,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16650/203307 [18:51:37<211:26:16,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16651/203307 [18:51:41<211:26:07,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16651/203307 [18:51:41<211:26:07,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16652/203307 [18:51:45<211:26:05,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16652/203307 [18:51:45<211:26:06,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16653/203307 [18:51:50<211:26:05,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16653/203307 [18:51:50<211:26:05,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16654/203307 [18:51:53<211:25:56,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16654/203307 [18:51:53<211:25:56,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16655/203307 [18:51:57<211:25:47,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16655/203307 [18:51:57<211:25:47,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16656/203307 [18:52:01<211:25:48,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16656/203307 [18:52:01<211:25:48,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16657/203307 [18:52:05<211:25:40,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16657/203307 [18:52:05<211:25:40,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16658/203307 [18:52:09<211:25:37,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16658/203307 [18:52:09<211:25:37,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16659/203307 [18:52:13<211:25:29,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16659/203307 [18:52:13<211:25:29,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16660/203307 [18:52:17<211:25:27,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16660/203307 [18:52:17<211:25:27,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16661/203307 [18:52:22<211:25:27,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 16661/203307 [18:52:22<211:25:27,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16662/203307 [18:52:26<211:25:25,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16662/203307 [18:52:26<211:25:25,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16663/203307 [18:52:30<211:25:16,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16663/203307 [18:52:30<211:25:16,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16664/203307 [18:52:34<211:25:17,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16664/203307 [18:52:34<211:25:17,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16665/203307 [18:52:38<211:25:08,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16665/203307 [18:52:38<211:25:09,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16666/203307 [18:52:42<211:25:06,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16666/203307 [18:52:42<211:25:06,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16667/203307 [18:52:46<211:24:58,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16667/203307 [18:52:46<211:24:58,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16668/203307 [18:52:49<211:24:49,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16668/203307 [18:52:49<211:24:49,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16669/203307 [18:52:54<211:24:51,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16669/203307 [18:52:54<211:24:51,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16670/203307 [18:52:58<211:24:43,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16670/203307 [18:52:58<211:24:43,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16671/203307 [18:53:02<211:24:40,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16671/203307 [18:53:02<211:24:40,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16672/203307 [18:53:06<211:24:32,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16672/203307 [18:53:06<211:24:32,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16673/203307 [18:53:10<211:24:33,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16673/203307 [18:53:10<211:24:33,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16674/203307 [18:53:14<211:24:25,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16674/203307 [18:53:14<211:24:25,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16675/203307 [18:53:18<211:24:24,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16675/203307 [18:53:18<211:24:24,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16676/203307 [18:53:22<211:24:16,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16676/203307 [18:53:22<211:24:16,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16677/203307 [18:53:26<211:24:16,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16677/203307 [18:53:26<211:24:16,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16678/203307 [18:53:31<211:24:15,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16678/203307 [18:53:31<211:24:15,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16679/203307 [18:53:35<211:24:07,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16679/203307 [18:53:35<211:24:08,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16680/203307 [18:53:39<211:24:05,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16680/203307 [18:53:39<211:24:05,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16681/203307 [18:53:43<211:23:57,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16681/203307 [18:53:43<211:23:57,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16682/203307 [18:53:47<211:23:58,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16682/203307 [18:53:47<211:23:58,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16683/203307 [18:53:51<211:23:56,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16683/203307 [18:53:51<211:23:56,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16684/203307 [18:53:55<211:23:47,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16684/203307 [18:53:55<211:23:47,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16685/203307 [18:53:59<211:23:45,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16685/203307 [18:53:59<211:23:46,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16686/203307 [18:54:04<211:23:45,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16686/203307 [18:54:04<211:23:46,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16687/203307 [18:54:07<211:23:38,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16687/203307 [18:54:07<211:23:38,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16688/203307 [18:54:11<211:23:30,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16688/203307 [18:54:11<211:23:30,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16689/203307 [18:54:15<211:23:27,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16689/203307 [18:54:15<211:23:27,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16690/203307 [18:54:20<211:23:26,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16690/203307 [18:54:20<211:23:26,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16691/203307 [18:54:24<211:23:24,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16691/203307 [18:54:24<211:23:24,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16692/203307 [18:54:28<211:23:16,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16692/203307 [18:54:28<211:23:16,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16693/203307 [18:54:31<211:23:08,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16693/203307 [18:54:31<211:23:08,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16694/203307 [18:54:36<211:23:09,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16694/203307 [18:54:36<211:23:09,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16695/203307 [18:54:40<211:23:03,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16695/203307 [18:54:40<211:23:03,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16696/203307 [18:54:44<211:22:54,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16696/203307 [18:54:44<211:22:54,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16697/203307 [18:54:47<211:22:45,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16697/203307 [18:54:47<211:22:45,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16698/203307 [18:54:51<211:22:42,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16698/203307 [18:54:51<211:22:42,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16699/203307 [18:54:56<211:22:43,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16699/203307 [18:54:56<211:22:43,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16700/203307 [18:55:00<211:22:42,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16700/203307 [18:55:00<211:22:42,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16701/203307 [18:55:04<211:22:34,  0.25it/s, v_num=t5e6, training/loss=0.0714]Epoch 0:   8%|▊         | 16701/203307 [18:55:04<211:22:34,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16702/203307 [18:55:08<211:22:33,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16702/203307 [18:55:08<211:22:33,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16703/203307 [18:55:13<211:22:32,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16703/203307 [18:55:13<211:22:32,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16704/203307 [18:55:16<211:22:24,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16704/203307 [18:55:16<211:22:24,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16705/203307 [18:55:20<211:22:16,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16705/203307 [18:55:20<211:22:16,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16706/203307 [18:55:24<211:22:09,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16706/203307 [18:55:24<211:22:09,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16707/203307 [18:55:28<211:22:07,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16707/203307 [18:55:28<211:22:07,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16708/203307 [18:55:33<211:22:09,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16708/203307 [18:55:33<211:22:09,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16709/203307 [18:55:37<211:22:02,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16709/203307 [18:55:37<211:22:02,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16710/203307 [18:55:41<211:22:00,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16710/203307 [18:55:41<211:22:00,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16711/203307 [18:55:45<211:22:01,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16711/203307 [18:55:45<211:22:01,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16712/203307 [18:55:49<211:21:53,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16712/203307 [18:55:49<211:21:53,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16713/203307 [18:55:53<211:21:46,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16713/203307 [18:55:53<211:21:46,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16714/203307 [18:55:57<211:21:38,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16714/203307 [18:55:57<211:21:39,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16715/203307 [18:56:00<211:21:31,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16715/203307 [18:56:00<211:21:31,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16716/203307 [18:56:05<211:21:31,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16716/203307 [18:56:05<211:21:32,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16717/203307 [18:56:09<211:21:24,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16717/203307 [18:56:09<211:21:24,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16718/203307 [18:56:12<211:21:16,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16718/203307 [18:56:12<211:21:16,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16719/203307 [18:56:17<211:21:17,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16719/203307 [18:56:17<211:21:17,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16720/203307 [18:56:21<211:21:09,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16720/203307 [18:56:21<211:21:09,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16721/203307 [18:56:25<211:21:01,  0.25it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   8%|▊         | 16721/203307 [18:56:25<211:21:01,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16722/203307 [18:56:28<211:20:53,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16722/203307 [18:56:28<211:20:53,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16723/203307 [18:56:32<211:20:45,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16723/203307 [18:56:32<211:20:45,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16724/203307 [18:56:36<211:20:36,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16724/203307 [18:56:36<211:20:36,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16725/203307 [18:56:40<211:20:37,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16725/203307 [18:56:40<211:20:37,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16726/203307 [18:56:44<211:20:28,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16726/203307 [18:56:44<211:20:28,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16727/203307 [18:56:48<211:20:26,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16727/203307 [18:56:48<211:20:26,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16728/203307 [18:56:52<211:20:25,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16728/203307 [18:56:52<211:20:25,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16729/203307 [18:56:56<211:20:17,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16729/203307 [18:56:56<211:20:17,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16730/203307 [18:57:00<211:20:07,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16730/203307 [18:57:00<211:20:07,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16731/203307 [18:57:03<211:19:59,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16731/203307 [18:57:03<211:19:59,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16732/203307 [18:57:07<211:19:50,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16732/203307 [18:57:07<211:19:50,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16733/203307 [18:57:11<211:19:48,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16733/203307 [18:57:11<211:19:48,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16734/203307 [18:57:16<211:19:48,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16734/203307 [18:57:16<211:19:48,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16735/203307 [18:57:20<211:19:45,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16735/203307 [18:57:20<211:19:46,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16736/203307 [18:57:24<211:19:44,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16736/203307 [18:57:24<211:19:44,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16737/203307 [18:57:28<211:19:37,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16737/203307 [18:57:28<211:19:37,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16738/203307 [18:57:32<211:19:29,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16738/203307 [18:57:32<211:19:29,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16739/203307 [18:57:35<211:19:20,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16739/203307 [18:57:35<211:19:20,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16740/203307 [18:57:39<211:19:12,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16740/203307 [18:57:39<211:19:12,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16741/203307 [18:57:43<211:19:10,  0.25it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:   8%|▊         | 16741/203307 [18:57:43<211:19:10,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16742/203307 [18:57:48<211:19:10,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16742/203307 [18:57:48<211:19:10,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16743/203307 [18:57:52<211:19:07,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16743/203307 [18:57:52<211:19:07,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16744/203307 [18:57:57<211:19:08,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16744/203307 [18:57:57<211:19:08,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16745/203307 [18:58:00<211:18:59,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16745/203307 [18:58:00<211:19:00,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16746/203307 [18:58:04<211:18:51,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16746/203307 [18:58:04<211:18:51,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16747/203307 [18:58:08<211:18:43,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16747/203307 [18:58:08<211:18:43,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16748/203307 [18:58:11<211:18:35,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16748/203307 [18:58:11<211:18:35,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16749/203307 [18:58:15<211:18:27,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16749/203307 [18:58:15<211:18:27,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16750/203307 [18:58:20<211:18:27,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16750/203307 [18:58:20<211:18:27,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16751/203307 [18:58:24<211:18:28,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16751/203307 [18:58:24<211:18:28,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16752/203307 [18:58:28<211:18:26,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16752/203307 [18:58:28<211:18:26,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16753/203307 [18:58:33<211:18:26,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16753/203307 [18:58:33<211:18:26,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16754/203307 [18:58:37<211:18:18,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16754/203307 [18:58:37<211:18:18,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16755/203307 [18:58:40<211:18:10,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16755/203307 [18:58:40<211:18:10,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16756/203307 [18:58:44<211:18:04,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16756/203307 [18:58:44<211:18:04,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16757/203307 [18:58:48<211:17:56,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16757/203307 [18:58:48<211:17:56,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16758/203307 [18:58:52<211:17:54,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16758/203307 [18:58:52<211:17:54,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16759/203307 [18:58:56<211:17:46,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16759/203307 [18:58:56<211:17:46,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16760/203307 [18:59:00<211:17:47,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16760/203307 [18:59:00<211:17:47,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16761/203307 [18:59:05<211:17:47,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   8%|▊         | 16761/203307 [18:59:05<211:17:47,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16762/203307 [18:59:09<211:17:40,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16762/203307 [18:59:09<211:17:40,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16763/203307 [18:59:12<211:17:32,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16763/203307 [18:59:12<211:17:32,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16764/203307 [18:59:16<211:17:25,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16764/203307 [18:59:16<211:17:25,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16765/203307 [18:59:20<211:17:18,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16765/203307 [18:59:20<211:17:18,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16766/203307 [18:59:24<211:17:17,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16766/203307 [18:59:24<211:17:17,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16767/203307 [18:59:28<211:17:09,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16767/203307 [18:59:28<211:17:09,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16768/203307 [18:59:32<211:17:08,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16768/203307 [18:59:32<211:17:08,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16769/203307 [18:59:37<211:17:09,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16769/203307 [18:59:37<211:17:09,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16770/203307 [18:59:41<211:17:06,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16770/203307 [18:59:41<211:17:06,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16771/203307 [18:59:45<211:16:58,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16771/203307 [18:59:45<211:16:58,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16772/203307 [18:59:49<211:16:50,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16772/203307 [18:59:49<211:16:50,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16773/203307 [18:59:52<211:16:42,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16773/203307 [18:59:52<211:16:42,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16774/203307 [18:59:56<211:16:34,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16774/203307 [18:59:56<211:16:34,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16775/203307 [19:00:00<211:16:32,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16775/203307 [19:00:00<211:16:33,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16776/203307 [19:00:04<211:16:25,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16776/203307 [19:00:04<211:16:25,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16777/203307 [19:00:09<211:16:25,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16777/203307 [19:00:09<211:16:25,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16778/203307 [19:00:13<211:16:25,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16778/203307 [19:00:13<211:16:25,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16779/203307 [19:00:17<211:16:22,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16779/203307 [19:00:17<211:16:22,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16780/203307 [19:00:21<211:16:14,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16780/203307 [19:00:21<211:16:14,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16781/203307 [19:00:25<211:16:07,  0.25it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:   8%|▊         | 16781/203307 [19:00:25<211:16:07,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16782/203307 [19:00:28<211:15:59,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16782/203307 [19:00:28<211:15:59,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16783/203307 [19:00:33<211:15:57,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16783/203307 [19:00:33<211:15:57,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16784/203307 [19:00:36<211:15:49,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16784/203307 [19:00:36<211:15:49,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16785/203307 [19:00:41<211:15:48,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16785/203307 [19:00:41<211:15:48,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16786/203307 [19:00:45<211:15:49,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16786/203307 [19:00:45<211:15:49,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16787/203307 [19:00:49<211:15:41,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16787/203307 [19:00:49<211:15:41,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16788/203307 [19:00:53<211:15:38,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16788/203307 [19:00:53<211:15:38,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16789/203307 [19:00:57<211:15:31,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16789/203307 [19:00:57<211:15:31,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16790/203307 [19:01:01<211:15:23,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16790/203307 [19:01:01<211:15:23,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16791/203307 [19:01:05<211:15:21,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16791/203307 [19:01:05<211:15:21,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16792/203307 [19:01:09<211:15:13,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16792/203307 [19:01:09<211:15:13,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16793/203307 [19:01:12<211:15:04,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16793/203307 [19:01:12<211:15:05,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16794/203307 [19:01:17<211:15:06,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16794/203307 [19:01:17<211:15:06,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16795/203307 [19:01:21<211:14:58,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16795/203307 [19:01:21<211:14:58,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16796/203307 [19:01:24<211:14:50,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16796/203307 [19:01:24<211:14:50,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16797/203307 [19:01:29<211:14:48,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16797/203307 [19:01:29<211:14:48,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16798/203307 [19:01:32<211:14:40,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16798/203307 [19:01:32<211:14:40,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16799/203307 [19:01:36<211:14:32,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16799/203307 [19:01:36<211:14:32,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16800/203307 [19:01:41<211:14:31,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16800/203307 [19:01:41<211:14:31,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16801/203307 [19:01:44<211:14:24,  0.25it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:   8%|▊         | 16801/203307 [19:01:44<211:14:24,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16802/203307 [19:01:49<211:14:23,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16802/203307 [19:01:49<211:14:23,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16803/203307 [19:01:53<211:14:23,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16803/203307 [19:01:53<211:14:23,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16804/203307 [19:01:57<211:14:15,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16804/203307 [19:01:57<211:14:15,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16805/203307 [19:02:01<211:14:07,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16805/203307 [19:02:01<211:14:07,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16806/203307 [19:02:05<211:14:07,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16806/203307 [19:02:05<211:14:07,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16807/203307 [19:02:09<211:13:59,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16807/203307 [19:02:09<211:13:59,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16808/203307 [19:02:13<211:13:57,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16808/203307 [19:02:13<211:13:57,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16809/203307 [19:02:17<211:13:49,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16809/203307 [19:02:17<211:13:49,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16810/203307 [19:02:21<211:13:47,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16810/203307 [19:02:21<211:13:47,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16811/203307 [19:02:25<211:13:47,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16811/203307 [19:02:25<211:13:47,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16812/203307 [19:02:30<211:13:47,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16812/203307 [19:02:30<211:13:47,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16813/203307 [19:02:34<211:13:39,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16813/203307 [19:02:34<211:13:39,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16814/203307 [19:02:37<211:13:32,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16814/203307 [19:02:37<211:13:32,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16815/203307 [19:02:42<211:13:30,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16815/203307 [19:02:42<211:13:31,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16816/203307 [19:02:46<211:13:29,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16816/203307 [19:02:46<211:13:29,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16817/203307 [19:02:50<211:13:22,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16817/203307 [19:02:50<211:13:22,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16818/203307 [19:02:54<211:13:14,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16818/203307 [19:02:54<211:13:14,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16819/203307 [19:02:58<211:13:15,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16819/203307 [19:02:58<211:13:15,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16820/203307 [19:03:03<211:13:15,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16820/203307 [19:03:03<211:13:15,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16821/203307 [19:03:06<211:13:08,  0.25it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   8%|▊         | 16821/203307 [19:03:06<211:13:08,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16822/203307 [19:03:10<211:13:00,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16822/203307 [19:03:10<211:13:00,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16823/203307 [19:03:14<211:12:52,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16823/203307 [19:03:14<211:12:52,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16824/203307 [19:03:18<211:12:50,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16824/203307 [19:03:18<211:12:50,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16825/203307 [19:03:22<211:12:49,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16825/203307 [19:03:22<211:12:49,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16826/203307 [19:03:26<211:12:41,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16826/203307 [19:03:26<211:12:41,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16827/203307 [19:03:30<211:12:39,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16827/203307 [19:03:30<211:12:39,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16828/203307 [19:03:35<211:12:39,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16828/203307 [19:03:35<211:12:39,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16829/203307 [19:03:39<211:12:39,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16829/203307 [19:03:39<211:12:39,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16830/203307 [19:03:43<211:12:31,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16830/203307 [19:03:43<211:12:31,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16831/203307 [19:03:47<211:12:23,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16831/203307 [19:03:47<211:12:23,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16832/203307 [19:03:50<211:12:15,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16832/203307 [19:03:50<211:12:15,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16833/203307 [19:03:55<211:12:13,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16833/203307 [19:03:55<211:12:13,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16834/203307 [19:03:58<211:12:04,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16834/203307 [19:03:58<211:12:04,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16835/203307 [19:04:03<211:12:03,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16835/203307 [19:04:03<211:12:03,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16836/203307 [19:04:07<211:12:02,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16836/203307 [19:04:07<211:12:02,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16837/203307 [19:04:11<211:11:54,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16837/203307 [19:04:11<211:11:54,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16838/203307 [19:04:15<211:11:54,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16838/203307 [19:04:15<211:11:54,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16839/203307 [19:04:19<211:11:46,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16839/203307 [19:04:19<211:11:46,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16840/203307 [19:04:23<211:11:37,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16840/203307 [19:04:23<211:11:37,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16841/203307 [19:04:27<211:11:35,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   8%|▊         | 16841/203307 [19:04:27<211:11:35,  0.25it/s, v_num=t5e6, training/loss=0.101] Epoch 0:   8%|▊         | 16842/203307 [19:04:31<211:11:33,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16842/203307 [19:04:31<211:11:33,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16843/203307 [19:04:35<211:11:25,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16843/203307 [19:04:35<211:11:25,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16844/203307 [19:04:39<211:11:25,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16844/203307 [19:04:39<211:11:25,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16845/203307 [19:04:43<211:11:17,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16845/203307 [19:04:43<211:11:17,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16846/203307 [19:04:47<211:11:17,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16846/203307 [19:04:48<211:11:17,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16847/203307 [19:04:51<211:11:09,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16847/203307 [19:04:51<211:11:09,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16848/203307 [19:04:55<211:11:01,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16848/203307 [19:04:55<211:11:01,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16849/203307 [19:04:59<211:10:53,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16849/203307 [19:04:59<211:10:53,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16850/203307 [19:05:03<211:10:51,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16850/203307 [19:05:03<211:10:51,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16851/203307 [19:05:07<211:10:49,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16851/203307 [19:05:07<211:10:49,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16852/203307 [19:05:11<211:10:47,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16852/203307 [19:05:11<211:10:47,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16853/203307 [19:05:16<211:10:46,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16853/203307 [19:05:16<211:10:46,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16854/203307 [19:05:20<211:10:38,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16854/203307 [19:05:20<211:10:38,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16855/203307 [19:05:24<211:10:37,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16855/203307 [19:05:24<211:10:37,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16856/203307 [19:05:28<211:10:28,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16856/203307 [19:05:28<211:10:28,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16857/203307 [19:05:31<211:10:19,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16857/203307 [19:05:31<211:10:19,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16858/203307 [19:05:35<211:10:17,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16858/203307 [19:05:35<211:10:17,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16859/203307 [19:05:39<211:10:08,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16859/203307 [19:05:39<211:10:09,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16860/203307 [19:05:43<211:10:07,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16860/203307 [19:05:43<211:10:07,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16861/203307 [19:05:48<211:10:06,  0.25it/s, v_num=t5e6, training/loss=0.101]Epoch 0:   8%|▊         | 16861/203307 [19:05:48<211:10:06,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16862/203307 [19:05:51<211:09:58,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16862/203307 [19:05:51<211:09:58,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16863/203307 [19:05:55<211:09:49,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16863/203307 [19:05:55<211:09:49,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16864/203307 [19:06:00<211:09:49,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16864/203307 [19:06:00<211:09:49,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16865/203307 [19:06:03<211:09:39,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16865/203307 [19:06:03<211:09:39,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16866/203307 [19:06:07<211:09:37,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16866/203307 [19:06:07<211:09:37,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16867/203307 [19:06:11<211:09:28,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16867/203307 [19:06:11<211:09:28,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16868/203307 [19:06:15<211:09:20,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16868/203307 [19:06:15<211:09:20,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16869/203307 [19:06:19<211:09:21,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16869/203307 [19:06:19<211:09:21,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16870/203307 [19:06:23<211:09:13,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16870/203307 [19:06:23<211:09:14,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16871/203307 [19:06:27<211:09:06,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16871/203307 [19:06:27<211:09:06,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16872/203307 [19:06:31<211:09:06,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16872/203307 [19:06:31<211:09:06,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16873/203307 [19:06:35<211:08:58,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16873/203307 [19:06:35<211:08:58,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16874/203307 [19:06:39<211:08:49,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16874/203307 [19:06:39<211:08:49,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16875/203307 [19:06:43<211:08:49,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16875/203307 [19:06:43<211:08:49,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16876/203307 [19:06:47<211:08:41,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16876/203307 [19:06:47<211:08:41,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16877/203307 [19:06:51<211:08:40,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16877/203307 [19:06:51<211:08:40,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16878/203307 [19:06:55<211:08:39,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16878/203307 [19:06:55<211:08:39,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16879/203307 [19:06:59<211:08:33,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16879/203307 [19:06:59<211:08:33,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16880/203307 [19:07:03<211:08:25,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16880/203307 [19:07:03<211:08:25,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16881/203307 [19:07:08<211:08:25,  0.25it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:   8%|▊         | 16881/203307 [19:07:08<211:08:25,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16882/203307 [19:07:11<211:08:19,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16882/203307 [19:07:11<211:08:19,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16883/203307 [19:07:16<211:08:16,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16883/203307 [19:07:16<211:08:16,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16884/203307 [19:07:19<211:08:08,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16884/203307 [19:07:19<211:08:08,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16885/203307 [19:07:24<211:08:06,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16885/203307 [19:07:24<211:08:06,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16886/203307 [19:07:28<211:08:05,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16886/203307 [19:07:28<211:08:06,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16887/203307 [19:07:32<211:08:03,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16887/203307 [19:07:32<211:08:03,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16888/203307 [19:07:36<211:07:56,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16888/203307 [19:07:36<211:07:56,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16889/203307 [19:07:40<211:07:48,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16889/203307 [19:07:40<211:07:49,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16890/203307 [19:07:44<211:07:50,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16890/203307 [19:07:44<211:07:50,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16891/203307 [19:07:49<211:07:47,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16891/203307 [19:07:49<211:07:47,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16892/203307 [19:07:52<211:07:39,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16892/203307 [19:07:52<211:07:39,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16893/203307 [19:07:56<211:07:31,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16893/203307 [19:07:56<211:07:31,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16894/203307 [19:08:01<211:07:32,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16894/203307 [19:08:01<211:07:32,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16895/203307 [19:08:04<211:07:24,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16895/203307 [19:08:04<211:07:24,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16896/203307 [19:08:09<211:07:22,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16896/203307 [19:08:09<211:07:22,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16897/203307 [19:08:12<211:07:14,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16897/203307 [19:08:12<211:07:14,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16898/203307 [19:08:17<211:07:14,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16898/203307 [19:08:17<211:07:14,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16899/203307 [19:08:21<211:07:07,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16899/203307 [19:08:21<211:07:07,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16900/203307 [19:08:25<211:07:05,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16900/203307 [19:08:25<211:07:05,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16901/203307 [19:08:29<211:06:57,  0.25it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:   8%|▊         | 16901/203307 [19:08:29<211:06:57,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16902/203307 [19:08:33<211:06:56,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16902/203307 [19:08:33<211:06:56,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16903/203307 [19:08:37<211:06:55,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16903/203307 [19:08:37<211:06:55,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16904/203307 [19:08:41<211:06:46,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16904/203307 [19:08:41<211:06:46,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16905/203307 [19:08:45<211:06:43,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16905/203307 [19:08:45<211:06:43,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16906/203307 [19:08:49<211:06:36,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16906/203307 [19:08:49<211:06:36,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16907/203307 [19:08:53<211:06:36,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16907/203307 [19:08:53<211:06:36,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16908/203307 [19:08:58<211:06:34,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16908/203307 [19:08:58<211:06:34,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16909/203307 [19:09:01<211:06:26,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16909/203307 [19:09:01<211:06:26,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16910/203307 [19:09:05<211:06:23,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16910/203307 [19:09:06<211:06:24,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16911/203307 [19:09:10<211:06:23,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16911/203307 [19:09:10<211:06:23,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16912/203307 [19:09:14<211:06:15,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16912/203307 [19:09:14<211:06:15,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16913/203307 [19:09:17<211:06:07,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16913/203307 [19:09:17<211:06:07,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16914/203307 [19:09:21<211:06:03,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16914/203307 [19:09:21<211:06:03,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16915/203307 [19:09:25<211:05:55,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16915/203307 [19:09:25<211:05:55,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16916/203307 [19:09:30<211:05:55,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16916/203307 [19:09:30<211:05:55,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16917/203307 [19:09:33<211:05:47,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16917/203307 [19:09:33<211:05:47,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16918/203307 [19:09:37<211:05:38,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16918/203307 [19:09:37<211:05:38,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16919/203307 [19:09:42<211:05:39,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16919/203307 [19:09:42<211:05:39,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16920/203307 [19:09:45<211:05:31,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16920/203307 [19:09:45<211:05:31,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16921/203307 [19:09:49<211:05:23,  0.25it/s, v_num=t5e6, training/loss=0.0948]Epoch 0:   8%|▊         | 16921/203307 [19:09:49<211:05:23,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16922/203307 [19:09:53<211:05:15,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16922/203307 [19:09:53<211:05:15,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16923/203307 [19:09:57<211:05:13,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16923/203307 [19:09:57<211:05:13,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16924/203307 [19:10:01<211:05:13,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16924/203307 [19:10:01<211:05:13,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16925/203307 [19:10:06<211:05:10,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16925/203307 [19:10:06<211:05:10,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16926/203307 [19:10:09<211:05:02,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16926/203307 [19:10:09<211:05:02,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16927/203307 [19:10:14<211:05:00,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16927/203307 [19:10:14<211:05:00,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16928/203307 [19:10:18<211:05:00,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16928/203307 [19:10:18<211:05:00,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16929/203307 [19:10:22<211:04:52,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16929/203307 [19:10:22<211:04:52,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16930/203307 [19:10:25<211:04:43,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16930/203307 [19:10:25<211:04:43,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16931/203307 [19:10:29<211:04:35,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16931/203307 [19:10:29<211:04:35,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16932/203307 [19:10:33<211:04:32,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16932/203307 [19:10:33<211:04:32,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16933/203307 [19:10:38<211:04:32,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16933/203307 [19:10:38<211:04:32,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16934/203307 [19:10:41<211:04:24,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16934/203307 [19:10:41<211:04:24,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16935/203307 [19:10:46<211:04:21,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16935/203307 [19:10:46<211:04:22,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16936/203307 [19:10:50<211:04:20,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16936/203307 [19:10:50<211:04:20,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16937/203307 [19:10:54<211:04:11,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16937/203307 [19:10:54<211:04:11,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16938/203307 [19:10:57<211:04:03,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16938/203307 [19:10:57<211:04:03,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16939/203307 [19:11:01<211:03:54,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16939/203307 [19:11:01<211:03:54,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16940/203307 [19:11:05<211:03:46,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16940/203307 [19:11:05<211:03:46,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16941/203307 [19:11:09<211:03:45,  0.25it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:   8%|▊         | 16941/203307 [19:11:09<211:03:45,  0.25it/s, v_num=t5e6, training/loss=0.084] Epoch 0:   8%|▊         | 16942/203307 [19:11:13<211:03:44,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16942/203307 [19:11:13<211:03:44,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16943/203307 [19:11:17<211:03:36,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16943/203307 [19:11:17<211:03:36,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16944/203307 [19:11:22<211:03:36,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16944/203307 [19:11:22<211:03:36,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16945/203307 [19:11:25<211:03:28,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16945/203307 [19:11:25<211:03:28,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16946/203307 [19:11:29<211:03:20,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16946/203307 [19:11:29<211:03:20,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16947/203307 [19:11:33<211:03:12,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16947/203307 [19:11:33<211:03:12,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16948/203307 [19:11:37<211:03:07,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16948/203307 [19:11:37<211:03:07,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16949/203307 [19:11:40<211:02:59,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16949/203307 [19:11:40<211:02:59,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16950/203307 [19:11:45<211:02:59,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16950/203307 [19:11:45<211:02:59,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16951/203307 [19:11:49<211:02:51,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16951/203307 [19:11:49<211:02:51,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16952/203307 [19:11:53<211:02:50,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16952/203307 [19:11:53<211:02:50,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16953/203307 [19:11:57<211:02:49,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16953/203307 [19:11:57<211:02:49,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16954/203307 [19:12:01<211:02:42,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16954/203307 [19:12:01<211:02:42,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16955/203307 [19:12:05<211:02:33,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16955/203307 [19:12:05<211:02:33,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16956/203307 [19:12:09<211:02:26,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16956/203307 [19:12:09<211:02:26,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16957/203307 [19:12:12<211:02:18,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16957/203307 [19:12:12<211:02:18,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16958/203307 [19:12:17<211:02:17,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16958/203307 [19:12:17<211:02:17,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16959/203307 [19:12:21<211:02:18,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16959/203307 [19:12:21<211:02:18,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16960/203307 [19:12:25<211:02:15,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16960/203307 [19:12:25<211:02:16,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16961/203307 [19:12:30<211:02:16,  0.25it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   8%|▊         | 16961/203307 [19:12:30<211:02:16,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16962/203307 [19:12:34<211:02:08,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16962/203307 [19:12:34<211:02:08,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16963/203307 [19:12:37<211:02:01,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16963/203307 [19:12:37<211:02:01,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16964/203307 [19:12:41<211:01:53,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16964/203307 [19:12:41<211:01:53,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16965/203307 [19:12:45<211:01:44,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16965/203307 [19:12:45<211:01:45,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16966/203307 [19:12:49<211:01:42,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16966/203307 [19:12:49<211:01:42,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16967/203307 [19:12:53<211:01:34,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16967/203307 [19:12:53<211:01:34,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16968/203307 [19:12:57<211:01:33,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16968/203307 [19:12:57<211:01:33,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16969/203307 [19:13:02<211:01:33,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16969/203307 [19:13:02<211:01:33,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16970/203307 [19:13:05<211:01:24,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16970/203307 [19:13:05<211:01:24,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16971/203307 [19:13:09<211:01:17,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16971/203307 [19:13:09<211:01:17,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16972/203307 [19:13:13<211:01:09,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16972/203307 [19:13:13<211:01:09,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16973/203307 [19:13:16<211:01:01,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16973/203307 [19:13:16<211:01:01,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16974/203307 [19:13:20<211:00:53,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16974/203307 [19:13:20<211:00:53,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16975/203307 [19:13:24<211:00:52,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16975/203307 [19:13:24<211:00:52,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16976/203307 [19:13:29<211:00:52,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16976/203307 [19:13:29<211:00:52,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16977/203307 [19:13:33<211:00:51,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16977/203307 [19:13:33<211:00:51,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16978/203307 [19:13:38<211:00:50,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16978/203307 [19:13:38<211:00:50,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16979/203307 [19:13:41<211:00:41,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16979/203307 [19:13:41<211:00:42,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16980/203307 [19:13:45<211:00:33,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16980/203307 [19:13:45<211:00:33,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16981/203307 [19:13:49<211:00:25,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   8%|▊         | 16981/203307 [19:13:49<211:00:25,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16982/203307 [19:13:52<211:00:18,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16982/203307 [19:13:52<211:00:18,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16983/203307 [19:13:57<211:00:16,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16983/203307 [19:13:57<211:00:16,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16984/203307 [19:14:00<211:00:07,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16984/203307 [19:14:00<211:00:07,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16985/203307 [19:14:05<211:00:06,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16985/203307 [19:14:05<211:00:06,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16986/203307 [19:14:09<211:00:06,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16986/203307 [19:14:09<211:00:06,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16987/203307 [19:14:13<210:59:58,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16987/203307 [19:14:13<210:59:58,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16988/203307 [19:14:17<210:59:50,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16988/203307 [19:14:17<210:59:50,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16989/203307 [19:14:20<210:59:43,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16989/203307 [19:14:20<210:59:43,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16990/203307 [19:14:24<210:59:36,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16990/203307 [19:14:24<210:59:36,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16991/203307 [19:14:29<210:59:34,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16991/203307 [19:14:29<210:59:34,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16992/203307 [19:14:32<210:59:26,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16992/203307 [19:14:32<210:59:26,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16993/203307 [19:14:36<210:59:17,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16993/203307 [19:14:36<210:59:17,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16994/203307 [19:14:40<210:59:17,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16994/203307 [19:14:40<210:59:17,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16995/203307 [19:14:44<210:59:13,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16995/203307 [19:14:44<210:59:14,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16996/203307 [19:14:48<210:59:06,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16996/203307 [19:14:48<210:59:06,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16997/203307 [19:14:52<210:58:58,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16997/203307 [19:14:52<210:58:58,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16998/203307 [19:14:56<210:58:50,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16998/203307 [19:14:56<210:58:50,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16999/203307 [19:14:59<210:58:43,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 16999/203307 [19:14:59<210:58:43,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 17000/203307 [19:15:04<210:58:42,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 17000/203307 [19:15:04<210:58:42,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 17001/203307 [19:15:08<210:58:34,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   8%|▊         | 17001/203307 [19:15:08<210:58:34,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17002/203307 [19:15:12<210:58:33,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17002/203307 [19:15:12<210:58:33,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17003/203307 [19:15:16<210:58:33,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17003/203307 [19:15:16<210:58:34,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17004/203307 [19:15:21<210:58:30,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17004/203307 [19:15:21<210:58:30,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17005/203307 [19:15:24<210:58:22,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17005/203307 [19:15:24<210:58:22,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17006/203307 [19:15:28<210:58:17,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17006/203307 [19:15:28<210:58:17,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17007/203307 [19:15:32<210:58:09,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17007/203307 [19:15:32<210:58:09,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17008/203307 [19:15:36<210:58:08,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17008/203307 [19:15:36<210:58:08,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17009/203307 [19:15:40<210:58:00,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17009/203307 [19:15:40<210:58:00,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17010/203307 [19:15:44<210:57:58,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17010/203307 [19:15:44<210:57:58,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17011/203307 [19:15:49<210:57:59,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17011/203307 [19:15:49<210:57:59,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17012/203307 [19:15:53<210:57:52,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17012/203307 [19:15:53<210:57:52,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17013/203307 [19:15:57<210:57:49,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17013/203307 [19:15:57<210:57:49,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17014/203307 [19:16:01<210:57:41,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17014/203307 [19:16:01<210:57:41,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17015/203307 [19:16:04<210:57:33,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17015/203307 [19:16:04<210:57:33,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17016/203307 [19:16:09<210:57:31,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17016/203307 [19:16:09<210:57:31,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17017/203307 [19:16:12<210:57:24,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17017/203307 [19:16:12<210:57:24,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17018/203307 [19:16:16<210:57:15,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17018/203307 [19:16:16<210:57:15,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17019/203307 [19:16:21<210:57:17,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17019/203307 [19:16:21<210:57:17,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17020/203307 [19:16:25<210:57:18,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17020/203307 [19:16:25<210:57:18,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17021/203307 [19:16:29<210:57:10,  0.25it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:   8%|▊         | 17021/203307 [19:16:29<210:57:10,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17022/203307 [19:16:33<210:57:09,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17022/203307 [19:16:33<210:57:09,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17023/203307 [19:16:37<210:57:01,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17023/203307 [19:16:37<210:57:01,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17024/203307 [19:16:41<210:56:54,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17024/203307 [19:16:41<210:56:54,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17025/203307 [19:16:45<210:56:53,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17025/203307 [19:16:45<210:56:53,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17026/203307 [19:16:49<210:56:45,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17026/203307 [19:16:49<210:56:45,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17027/203307 [19:16:53<210:56:43,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17027/203307 [19:16:53<210:56:43,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17028/203307 [19:16:58<210:56:44,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17028/203307 [19:16:58<210:56:44,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17029/203307 [19:17:01<210:56:36,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17029/203307 [19:17:01<210:56:36,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17030/203307 [19:17:05<210:56:28,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17030/203307 [19:17:05<210:56:28,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17031/203307 [19:17:09<210:56:27,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17031/203307 [19:17:09<210:56:27,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17032/203307 [19:17:13<210:56:19,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17032/203307 [19:17:13<210:56:19,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17033/203307 [19:17:17<210:56:17,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17033/203307 [19:17:17<210:56:17,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17034/203307 [19:17:21<210:56:10,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17034/203307 [19:17:21<210:56:10,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17035/203307 [19:17:26<210:56:08,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17035/203307 [19:17:26<210:56:08,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17036/203307 [19:17:30<210:56:08,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17036/203307 [19:17:30<210:56:08,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17037/203307 [19:17:34<210:56:09,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17037/203307 [19:17:34<210:56:09,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17038/203307 [19:17:38<210:56:01,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17038/203307 [19:17:38<210:56:01,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17039/203307 [19:17:42<210:55:53,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17039/203307 [19:17:42<210:55:53,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17040/203307 [19:17:46<210:55:51,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17040/203307 [19:17:46<210:55:51,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17041/203307 [19:17:51<210:55:50,  0.25it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:   8%|▊         | 17041/203307 [19:17:51<210:55:50,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17042/203307 [19:17:54<210:55:42,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17042/203307 [19:17:54<210:55:42,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17043/203307 [19:17:58<210:55:34,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17043/203307 [19:17:58<210:55:34,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17044/203307 [19:18:02<210:55:34,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17044/203307 [19:18:02<210:55:34,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17045/203307 [19:18:06<210:55:27,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17045/203307 [19:18:06<210:55:28,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17046/203307 [19:18:11<210:55:28,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17046/203307 [19:18:11<210:55:28,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17047/203307 [19:18:15<210:55:23,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17047/203307 [19:18:15<210:55:23,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17048/203307 [19:18:18<210:55:15,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17048/203307 [19:18:18<210:55:15,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17049/203307 [19:18:23<210:55:12,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17049/203307 [19:18:23<210:55:12,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17050/203307 [19:18:27<210:55:09,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17050/203307 [19:18:27<210:55:09,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17051/203307 [19:18:31<210:55:01,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17051/203307 [19:18:31<210:55:01,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17052/203307 [19:18:35<210:54:59,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17052/203307 [19:18:35<210:54:59,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17053/203307 [19:18:39<210:54:58,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17053/203307 [19:18:39<210:54:59,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17054/203307 [19:18:44<210:54:57,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17054/203307 [19:18:44<210:54:57,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17055/203307 [19:18:47<210:54:49,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17055/203307 [19:18:47<210:54:49,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17056/203307 [19:18:51<210:54:40,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17056/203307 [19:18:51<210:54:40,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17057/203307 [19:18:55<210:54:32,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17057/203307 [19:18:55<210:54:32,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17058/203307 [19:18:59<210:54:31,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17058/203307 [19:18:59<210:54:31,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17059/203307 [19:19:03<210:54:23,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17059/203307 [19:19:03<210:54:23,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17060/203307 [19:19:07<210:54:22,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17060/203307 [19:19:07<210:54:22,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17061/203307 [19:19:11<210:54:21,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   8%|▊         | 17061/203307 [19:19:11<210:54:21,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17062/203307 [19:19:15<210:54:13,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17062/203307 [19:19:15<210:54:13,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17063/203307 [19:19:20<210:54:14,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17063/203307 [19:19:20<210:54:14,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17064/203307 [19:19:23<210:54:06,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17064/203307 [19:19:23<210:54:06,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17065/203307 [19:19:27<210:53:58,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17065/203307 [19:19:27<210:53:58,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17066/203307 [19:19:31<210:53:56,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17066/203307 [19:19:31<210:53:56,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17067/203307 [19:19:35<210:53:53,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17067/203307 [19:19:35<210:53:53,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17068/203307 [19:19:39<210:53:43,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17068/203307 [19:19:39<210:53:44,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17069/203307 [19:19:44<210:53:44,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17069/203307 [19:19:44<210:53:44,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17070/203307 [19:19:47<210:53:35,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17070/203307 [19:19:47<210:53:35,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17071/203307 [19:19:51<210:53:27,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17071/203307 [19:19:51<210:53:27,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17072/203307 [19:19:55<210:53:28,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17072/203307 [19:19:55<210:53:28,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17073/203307 [19:19:59<210:53:20,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17073/203307 [19:19:59<210:53:20,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17074/203307 [19:20:03<210:53:11,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17074/203307 [19:20:03<210:53:11,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17075/203307 [19:20:07<210:53:09,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17075/203307 [19:20:07<210:53:09,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17076/203307 [19:20:11<210:53:07,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17076/203307 [19:20:11<210:53:07,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17077/203307 [19:20:16<210:53:05,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17077/203307 [19:20:16<210:53:05,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17078/203307 [19:20:20<210:53:06,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17078/203307 [19:20:20<210:53:06,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17079/203307 [19:20:24<210:52:59,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17079/203307 [19:20:24<210:52:59,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17080/203307 [19:20:28<210:53:00,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17080/203307 [19:20:28<210:53:00,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17081/203307 [19:20:32<210:52:54,  0.25it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:   8%|▊         | 17081/203307 [19:20:32<210:52:54,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17082/203307 [19:20:36<210:52:47,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17082/203307 [19:20:36<210:52:47,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17083/203307 [19:20:41<210:52:45,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17083/203307 [19:20:41<210:52:45,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17084/203307 [19:20:44<210:52:39,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17084/203307 [19:20:44<210:52:39,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17085/203307 [19:20:49<210:52:38,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17085/203307 [19:20:49<210:52:38,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17086/203307 [19:20:53<210:52:37,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17086/203307 [19:20:53<210:52:38,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17087/203307 [19:20:57<210:52:29,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17087/203307 [19:20:57<210:52:30,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17088/203307 [19:21:01<210:52:22,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17088/203307 [19:21:01<210:52:22,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17089/203307 [19:21:05<210:52:24,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17089/203307 [19:21:05<210:52:24,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17090/203307 [19:21:09<210:52:16,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17090/203307 [19:21:09<210:52:16,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17091/203307 [19:21:13<210:52:15,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17091/203307 [19:21:13<210:52:15,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17092/203307 [19:21:17<210:52:08,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17092/203307 [19:21:17<210:52:08,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17093/203307 [19:21:21<210:52:01,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17093/203307 [19:21:21<210:52:01,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17094/203307 [19:21:26<210:52:02,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17094/203307 [19:21:26<210:52:03,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17095/203307 [19:21:29<210:51:56,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17095/203307 [19:21:29<210:51:56,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17096/203307 [19:21:33<210:51:48,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17096/203307 [19:21:33<210:51:48,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17097/203307 [19:21:37<210:51:41,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17097/203307 [19:21:37<210:51:41,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17098/203307 [19:21:41<210:51:41,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17098/203307 [19:21:41<210:51:42,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17099/203307 [19:21:45<210:51:34,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17099/203307 [19:21:45<210:51:34,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17100/203307 [19:21:49<210:51:32,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17100/203307 [19:21:49<210:51:32,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17101/203307 [19:21:53<210:51:24,  0.25it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:   8%|▊         | 17101/203307 [19:21:53<210:51:24,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17102/203307 [19:21:58<210:51:24,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17102/203307 [19:21:58<210:51:24,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17103/203307 [19:22:02<210:51:23,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17103/203307 [19:22:02<210:51:23,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17104/203307 [19:22:06<210:51:17,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17104/203307 [19:22:06<210:51:17,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17105/203307 [19:22:10<210:51:08,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17105/203307 [19:22:10<210:51:08,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17106/203307 [19:22:14<210:51:09,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17106/203307 [19:22:14<210:51:09,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17107/203307 [19:22:18<210:51:01,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17107/203307 [19:22:18<210:51:02,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17108/203307 [19:22:22<210:51:00,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17108/203307 [19:22:22<210:51:00,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17109/203307 [19:22:26<210:50:53,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17109/203307 [19:22:26<210:50:53,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17110/203307 [19:22:30<210:50:51,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17110/203307 [19:22:30<210:50:51,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17111/203307 [19:22:35<210:50:51,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17111/203307 [19:22:35<210:50:51,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17112/203307 [19:22:39<210:50:49,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17112/203307 [19:22:39<210:50:49,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17113/203307 [19:22:43<210:50:41,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17113/203307 [19:22:43<210:50:41,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17114/203307 [19:22:46<210:50:34,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17114/203307 [19:22:46<210:50:34,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17115/203307 [19:22:51<210:50:34,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17115/203307 [19:22:51<210:50:34,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17116/203307 [19:22:55<210:50:33,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17116/203307 [19:22:55<210:50:33,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17117/203307 [19:22:59<210:50:25,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17117/203307 [19:22:59<210:50:25,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17118/203307 [19:23:03<210:50:17,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17118/203307 [19:23:03<210:50:17,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17119/203307 [19:23:07<210:50:17,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17119/203307 [19:23:07<210:50:17,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17120/203307 [19:23:11<210:50:09,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17120/203307 [19:23:11<210:50:09,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17121/203307 [19:23:15<210:50:08,  0.25it/s, v_num=t5e6, training/loss=0.0667]Epoch 0:   8%|▊         | 17121/203307 [19:23:15<210:50:08,  0.25it/s, v_num=t5e6, training/loss=0.083] Epoch 0:   8%|▊         | 17122/203307 [19:23:19<210:50:00,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17122/203307 [19:23:19<210:50:00,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17123/203307 [19:23:23<210:49:52,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17123/203307 [19:23:23<210:49:52,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17124/203307 [19:23:27<210:49:53,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17124/203307 [19:23:27<210:49:53,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17125/203307 [19:23:31<210:49:51,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17125/203307 [19:23:31<210:49:51,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17126/203307 [19:23:35<210:49:43,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17126/203307 [19:23:35<210:49:43,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17127/203307 [19:23:40<210:49:42,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17127/203307 [19:23:40<210:49:42,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17128/203307 [19:23:44<210:49:42,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17128/203307 [19:23:44<210:49:42,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17129/203307 [19:23:48<210:49:34,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17129/203307 [19:23:48<210:49:34,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17130/203307 [19:23:52<210:49:31,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17130/203307 [19:23:52<210:49:31,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17131/203307 [19:23:56<210:49:24,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17131/203307 [19:23:56<210:49:24,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17132/203307 [19:24:00<210:49:23,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17132/203307 [19:24:00<210:49:23,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17133/203307 [19:24:04<210:49:21,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17133/203307 [19:24:04<210:49:22,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17134/203307 [19:24:08<210:49:14,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17134/203307 [19:24:08<210:49:14,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17135/203307 [19:24:12<210:49:13,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17135/203307 [19:24:12<210:49:13,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17136/203307 [19:24:17<210:49:13,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17136/203307 [19:24:17<210:49:13,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17137/203307 [19:24:21<210:49:06,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17137/203307 [19:24:21<210:49:06,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17138/203307 [19:24:24<210:48:58,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17138/203307 [19:24:24<210:48:58,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17139/203307 [19:24:29<210:48:55,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17139/203307 [19:24:29<210:48:55,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17140/203307 [19:24:32<210:48:48,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17140/203307 [19:24:32<210:48:48,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17141/203307 [19:24:37<210:48:49,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   8%|▊         | 17141/203307 [19:24:37<210:48:49,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17142/203307 [19:24:41<210:48:41,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17142/203307 [19:24:41<210:48:41,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17143/203307 [19:24:44<210:48:32,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17143/203307 [19:24:44<210:48:32,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17144/203307 [19:24:49<210:48:32,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17144/203307 [19:24:49<210:48:32,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17145/203307 [19:24:52<210:48:24,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17145/203307 [19:24:52<210:48:24,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17146/203307 [19:24:56<210:48:16,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17146/203307 [19:24:56<210:48:16,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17147/203307 [19:25:00<210:48:08,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17147/203307 [19:25:00<210:48:08,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17148/203307 [19:25:04<210:48:06,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17148/203307 [19:25:04<210:48:06,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17149/203307 [19:25:08<210:47:58,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17149/203307 [19:25:08<210:47:58,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17150/203307 [19:25:12<210:47:58,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17150/203307 [19:25:12<210:47:58,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17151/203307 [19:25:16<210:47:50,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17151/203307 [19:25:16<210:47:50,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17152/203307 [19:25:20<210:47:49,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17152/203307 [19:25:20<210:47:49,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17153/203307 [19:25:25<210:47:49,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17153/203307 [19:25:25<210:47:49,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17154/203307 [19:25:29<210:47:41,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17154/203307 [19:25:29<210:47:41,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17155/203307 [19:25:32<210:47:33,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17155/203307 [19:25:32<210:47:33,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17156/203307 [19:25:36<210:47:26,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17156/203307 [19:25:36<210:47:26,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17157/203307 [19:25:40<210:47:25,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17157/203307 [19:25:40<210:47:25,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17158/203307 [19:25:45<210:47:24,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17158/203307 [19:25:45<210:47:24,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17159/203307 [19:25:49<210:47:16,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17159/203307 [19:25:49<210:47:16,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17160/203307 [19:25:53<210:47:14,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17160/203307 [19:25:53<210:47:14,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17161/203307 [19:25:57<210:47:14,  0.25it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:   8%|▊         | 17161/203307 [19:25:57<210:47:14,  0.25it/s, v_num=t5e6, training/loss=0.087] Epoch 0:   8%|▊         | 17162/203307 [19:26:01<210:47:06,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17162/203307 [19:26:01<210:47:06,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17163/203307 [19:26:05<210:46:59,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17163/203307 [19:26:05<210:46:59,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17164/203307 [19:26:09<210:46:51,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17164/203307 [19:26:09<210:46:51,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17165/203307 [19:26:12<210:46:43,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17165/203307 [19:26:12<210:46:43,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17166/203307 [19:26:17<210:46:42,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17166/203307 [19:26:17<210:46:42,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17167/203307 [19:26:21<210:46:42,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17167/203307 [19:26:21<210:46:42,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17168/203307 [19:26:25<210:46:33,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17168/203307 [19:26:25<210:46:33,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17169/203307 [19:26:29<210:46:33,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17169/203307 [19:26:29<210:46:33,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17170/203307 [19:26:33<210:46:26,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17170/203307 [19:26:33<210:46:26,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17171/203307 [19:26:37<210:46:19,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17171/203307 [19:26:37<210:46:19,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17172/203307 [19:26:40<210:46:11,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17172/203307 [19:26:40<210:46:11,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17173/203307 [19:26:44<210:46:04,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17173/203307 [19:26:44<210:46:04,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17174/203307 [19:26:48<210:45:55,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17174/203307 [19:26:48<210:45:55,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17175/203307 [19:26:52<210:45:54,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17175/203307 [19:26:52<210:45:54,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17176/203307 [19:26:57<210:45:55,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17176/203307 [19:26:57<210:45:55,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17177/203307 [19:27:01<210:45:53,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17177/203307 [19:27:01<210:45:53,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17178/203307 [19:27:06<210:45:53,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17178/203307 [19:27:06<210:45:54,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17179/203307 [19:27:09<210:45:46,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17179/203307 [19:27:09<210:45:46,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17180/203307 [19:27:13<210:45:38,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17180/203307 [19:27:13<210:45:38,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17181/203307 [19:27:17<210:45:32,  0.25it/s, v_num=t5e6, training/loss=0.087]Epoch 0:   8%|▊         | 17181/203307 [19:27:17<210:45:32,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17182/203307 [19:27:21<210:45:24,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17182/203307 [19:27:21<210:45:25,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17183/203307 [19:27:25<210:45:22,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17183/203307 [19:27:25<210:45:22,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17184/203307 [19:27:29<210:45:22,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17184/203307 [19:27:29<210:45:22,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17185/203307 [19:27:34<210:45:20,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17185/203307 [19:27:34<210:45:20,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17186/203307 [19:27:38<210:45:19,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17186/203307 [19:27:38<210:45:19,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17187/203307 [19:27:42<210:45:12,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17187/203307 [19:27:42<210:45:12,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17188/203307 [19:27:46<210:45:04,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17188/203307 [19:27:46<210:45:04,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17189/203307 [19:27:49<210:44:57,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17189/203307 [19:27:49<210:44:57,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17190/203307 [19:27:53<210:44:48,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17190/203307 [19:27:53<210:44:49,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17191/203307 [19:27:57<210:44:46,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17191/203307 [19:27:57<210:44:46,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17192/203307 [19:28:01<210:44:38,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17192/203307 [19:28:01<210:44:38,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17193/203307 [19:28:05<210:44:38,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17193/203307 [19:28:05<210:44:38,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17194/203307 [19:28:10<210:44:37,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17194/203307 [19:28:10<210:44:37,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17195/203307 [19:28:13<210:44:29,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17195/203307 [19:28:13<210:44:29,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17196/203307 [19:28:17<210:44:21,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17196/203307 [19:28:17<210:44:21,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17197/203307 [19:28:21<210:44:14,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17197/203307 [19:28:21<210:44:14,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17198/203307 [19:28:25<210:44:06,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17198/203307 [19:28:25<210:44:06,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17199/203307 [19:28:28<210:43:59,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17199/203307 [19:28:28<210:43:59,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17200/203307 [19:28:33<210:43:57,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17200/203307 [19:28:33<210:43:57,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17201/203307 [19:28:36<210:43:49,  0.25it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:   8%|▊         | 17201/203307 [19:28:36<210:43:49,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17202/203307 [19:28:41<210:43:49,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17202/203307 [19:28:41<210:43:49,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17203/203307 [19:28:45<210:43:48,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17203/203307 [19:28:45<210:43:48,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17204/203307 [19:28:49<210:43:40,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17204/203307 [19:28:49<210:43:41,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17205/203307 [19:28:53<210:43:32,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17205/203307 [19:28:53<210:43:33,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17206/203307 [19:28:56<210:43:25,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17206/203307 [19:28:56<210:43:25,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17207/203307 [19:29:00<210:43:17,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17207/203307 [19:29:00<210:43:17,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17208/203307 [19:29:04<210:43:15,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17208/203307 [19:29:04<210:43:15,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17209/203307 [19:29:08<210:43:07,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17209/203307 [19:29:08<210:43:07,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17210/203307 [19:29:13<210:43:07,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17210/203307 [19:29:13<210:43:07,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17211/203307 [19:29:17<210:43:06,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17211/203307 [19:29:17<210:43:06,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17212/203307 [19:29:21<210:43:00,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17212/203307 [19:29:21<210:43:00,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17213/203307 [19:29:25<210:42:53,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17213/203307 [19:29:25<210:42:53,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17214/203307 [19:29:28<210:42:46,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17214/203307 [19:29:28<210:42:46,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17215/203307 [19:29:32<210:42:38,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17215/203307 [19:29:32<210:42:38,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17216/203307 [19:29:37<210:42:37,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17216/203307 [19:29:37<210:42:37,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17217/203307 [19:29:40<210:42:29,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17217/203307 [19:29:40<210:42:29,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17218/203307 [19:29:44<210:42:20,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17218/203307 [19:29:44<210:42:20,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17219/203307 [19:29:49<210:42:22,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17219/203307 [19:29:49<210:42:22,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17220/203307 [19:29:53<210:42:20,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17220/203307 [19:29:53<210:42:20,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17221/203307 [19:29:57<210:42:13,  0.25it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   8%|▊         | 17221/203307 [19:29:57<210:42:13,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17222/203307 [19:30:00<210:42:05,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17222/203307 [19:30:00<210:42:05,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17223/203307 [19:30:04<210:41:57,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17223/203307 [19:30:04<210:41:58,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17224/203307 [19:30:08<210:41:49,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17224/203307 [19:30:08<210:41:50,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17225/203307 [19:30:12<210:41:49,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17225/203307 [19:30:12<210:41:49,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17226/203307 [19:30:16<210:41:40,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17226/203307 [19:30:16<210:41:40,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17227/203307 [19:30:20<210:41:39,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17227/203307 [19:30:20<210:41:39,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17228/203307 [19:30:25<210:41:39,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17228/203307 [19:30:25<210:41:39,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17229/203307 [19:30:29<210:41:36,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17229/203307 [19:30:29<210:41:36,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17230/203307 [19:30:33<210:41:27,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17230/203307 [19:30:33<210:41:28,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17231/203307 [19:30:36<210:41:20,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17231/203307 [19:30:36<210:41:20,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17232/203307 [19:30:40<210:41:11,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17232/203307 [19:30:40<210:41:12,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17233/203307 [19:30:44<210:41:09,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17233/203307 [19:30:44<210:41:09,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17234/203307 [19:30:48<210:41:02,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17234/203307 [19:30:48<210:41:02,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17235/203307 [19:30:52<210:41:00,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17235/203307 [19:30:52<210:41:00,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17236/203307 [19:30:57<210:40:59,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17236/203307 [19:30:57<210:40:59,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17237/203307 [19:31:00<210:40:51,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17237/203307 [19:31:00<210:40:51,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17238/203307 [19:31:05<210:40:48,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17238/203307 [19:31:05<210:40:48,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17239/203307 [19:31:08<210:40:40,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17239/203307 [19:31:08<210:40:40,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17240/203307 [19:31:12<210:40:32,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17240/203307 [19:31:12<210:40:32,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17241/203307 [19:31:16<210:40:31,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   8%|▊         | 17241/203307 [19:31:16<210:40:31,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17242/203307 [19:31:20<210:40:22,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17242/203307 [19:31:20<210:40:22,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17243/203307 [19:31:24<210:40:14,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17243/203307 [19:31:24<210:40:14,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17244/203307 [19:31:28<210:40:13,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17244/203307 [19:31:28<210:40:14,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17245/203307 [19:31:32<210:40:12,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17245/203307 [19:31:32<210:40:12,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17246/203307 [19:31:36<210:40:03,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17246/203307 [19:31:36<210:40:03,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17247/203307 [19:31:40<210:40:00,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17247/203307 [19:31:40<210:40:00,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17248/203307 [19:31:44<210:39:50,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17248/203307 [19:31:44<210:39:50,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17249/203307 [19:31:47<210:39:41,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17249/203307 [19:31:47<210:39:41,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17250/203307 [19:31:51<210:39:38,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17250/203307 [19:31:51<210:39:39,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17251/203307 [19:31:55<210:39:30,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17251/203307 [19:31:55<210:39:30,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17252/203307 [19:31:59<210:39:27,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17252/203307 [19:31:59<210:39:28,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17253/203307 [19:32:04<210:39:26,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17253/203307 [19:32:04<210:39:26,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17254/203307 [19:32:08<210:39:25,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17254/203307 [19:32:08<210:39:26,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17255/203307 [19:32:12<210:39:16,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17255/203307 [19:32:12<210:39:16,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17256/203307 [19:32:16<210:39:14,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17256/203307 [19:32:16<210:39:14,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17257/203307 [19:32:20<210:39:06,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17257/203307 [19:32:20<210:39:06,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17258/203307 [19:32:24<210:39:03,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17258/203307 [19:32:24<210:39:03,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17259/203307 [19:32:27<210:38:54,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17259/203307 [19:32:27<210:38:54,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17260/203307 [19:32:32<210:38:52,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17260/203307 [19:32:32<210:38:52,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17261/203307 [19:32:36<210:38:50,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   8%|▊         | 17261/203307 [19:32:36<210:38:50,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17262/203307 [19:32:40<210:38:49,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17262/203307 [19:32:40<210:38:49,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17263/203307 [19:32:44<210:38:40,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17263/203307 [19:32:44<210:38:40,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17264/203307 [19:32:48<210:38:31,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17264/203307 [19:32:48<210:38:31,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17265/203307 [19:32:52<210:38:28,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17265/203307 [19:32:52<210:38:28,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17266/203307 [19:32:56<210:38:25,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17266/203307 [19:32:56<210:38:25,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17267/203307 [19:33:00<210:38:16,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17267/203307 [19:33:00<210:38:16,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17268/203307 [19:33:03<210:38:06,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17268/203307 [19:33:03<210:38:06,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17269/203307 [19:33:08<210:38:06,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17269/203307 [19:33:08<210:38:06,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17270/203307 [19:33:11<210:37:57,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17270/203307 [19:33:11<210:37:57,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17271/203307 [19:33:16<210:37:56,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17271/203307 [19:33:16<210:37:56,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17272/203307 [19:33:19<210:37:48,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17272/203307 [19:33:19<210:37:48,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17273/203307 [19:33:23<210:37:40,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17273/203307 [19:33:23<210:37:40,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17274/203307 [19:33:27<210:37:38,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17274/203307 [19:33:27<210:37:38,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17275/203307 [19:33:31<210:37:36,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17275/203307 [19:33:31<210:37:36,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17276/203307 [19:33:35<210:37:27,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17276/203307 [19:33:35<210:37:27,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17277/203307 [19:33:39<210:37:25,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17277/203307 [19:33:39<210:37:25,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17278/203307 [19:33:44<210:37:24,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17278/203307 [19:33:44<210:37:25,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17279/203307 [19:33:47<210:37:16,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17279/203307 [19:33:47<210:37:16,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17280/203307 [19:33:52<210:37:16,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17280/203307 [19:33:52<210:37:16,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17281/203307 [19:33:56<210:37:08,  0.25it/s, v_num=t5e6, training/loss=0.0934]Epoch 0:   8%|▊         | 17281/203307 [19:33:56<210:37:08,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17282/203307 [19:33:59<210:36:59,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17282/203307 [19:33:59<210:37:00,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17283/203307 [19:34:03<210:36:57,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17283/203307 [19:34:03<210:36:57,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17284/203307 [19:34:07<210:36:49,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17284/203307 [19:34:07<210:36:49,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17285/203307 [19:34:12<210:36:48,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17285/203307 [19:34:12<210:36:48,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17286/203307 [19:34:16<210:36:48,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17286/203307 [19:34:16<210:36:48,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17287/203307 [19:34:20<210:36:40,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17287/203307 [19:34:20<210:36:40,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17288/203307 [19:34:24<210:36:39,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17288/203307 [19:34:24<210:36:39,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17289/203307 [19:34:28<210:36:31,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17289/203307 [19:34:28<210:36:31,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17290/203307 [19:34:31<210:36:22,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17290/203307 [19:34:31<210:36:22,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17291/203307 [19:34:36<210:36:19,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17291/203307 [19:34:36<210:36:19,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17292/203307 [19:34:40<210:36:16,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17292/203307 [19:34:40<210:36:17,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17293/203307 [19:34:43<210:36:07,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17293/203307 [19:34:43<210:36:07,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17294/203307 [19:34:48<210:36:07,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17294/203307 [19:34:48<210:36:07,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17295/203307 [19:34:52<210:35:59,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17295/203307 [19:34:52<210:35:59,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17296/203307 [19:34:55<210:35:52,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17296/203307 [19:34:55<210:35:52,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17297/203307 [19:35:00<210:35:51,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17297/203307 [19:35:00<210:35:51,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17298/203307 [19:35:03<210:35:43,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17298/203307 [19:35:03<210:35:43,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17299/203307 [19:35:07<210:35:34,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17299/203307 [19:35:07<210:35:34,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17300/203307 [19:35:11<210:35:33,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17300/203307 [19:35:11<210:35:33,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17301/203307 [19:35:16<210:35:31,  0.25it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:   9%|▊         | 17301/203307 [19:35:16<210:35:31,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17302/203307 [19:35:20<210:35:29,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17302/203307 [19:35:20<210:35:29,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17303/203307 [19:35:24<210:35:28,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17303/203307 [19:35:24<210:35:28,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17304/203307 [19:35:28<210:35:20,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17304/203307 [19:35:28<210:35:20,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17305/203307 [19:35:32<210:35:12,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17305/203307 [19:35:32<210:35:12,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17306/203307 [19:35:36<210:35:12,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17306/203307 [19:35:36<210:35:12,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17307/203307 [19:35:40<210:35:04,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17307/203307 [19:35:40<210:35:04,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17308/203307 [19:35:44<210:35:00,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17308/203307 [19:35:44<210:35:00,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17309/203307 [19:35:48<210:34:51,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17309/203307 [19:35:48<210:34:51,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17310/203307 [19:35:52<210:34:50,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17310/203307 [19:35:52<210:34:50,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17311/203307 [19:35:56<210:34:49,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17311/203307 [19:35:56<210:34:49,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17312/203307 [19:36:00<210:34:41,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17312/203307 [19:36:00<210:34:41,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17313/203307 [19:36:04<210:34:32,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17313/203307 [19:36:04<210:34:32,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17314/203307 [19:36:08<210:34:31,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17314/203307 [19:36:08<210:34:32,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17315/203307 [19:36:12<210:34:23,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17315/203307 [19:36:12<210:34:23,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17316/203307 [19:36:16<210:34:20,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17316/203307 [19:36:16<210:34:20,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17317/203307 [19:36:20<210:34:12,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17317/203307 [19:36:20<210:34:12,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17318/203307 [19:36:23<210:34:04,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17318/203307 [19:36:23<210:34:04,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17319/203307 [19:36:28<210:34:04,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17319/203307 [19:36:28<210:34:04,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17320/203307 [19:36:31<210:33:56,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17320/203307 [19:36:31<210:33:56,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17321/203307 [19:36:35<210:33:47,  0.25it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:   9%|▊         | 17321/203307 [19:36:35<210:33:47,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17322/203307 [19:36:39<210:33:38,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17322/203307 [19:36:39<210:33:38,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17323/203307 [19:36:43<210:33:38,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17323/203307 [19:36:43<210:33:38,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17324/203307 [19:36:47<210:33:29,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17324/203307 [19:36:47<210:33:29,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17325/203307 [19:36:51<210:33:27,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17325/203307 [19:36:51<210:33:27,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17326/203307 [19:36:55<210:33:18,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17326/203307 [19:36:55<210:33:19,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17327/203307 [19:36:59<210:33:17,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17327/203307 [19:36:59<210:33:17,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17328/203307 [19:37:03<210:33:15,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17328/203307 [19:37:03<210:33:15,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17329/203307 [19:37:07<210:33:06,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17329/203307 [19:37:07<210:33:06,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17330/203307 [19:37:11<210:32:58,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17330/203307 [19:37:11<210:32:58,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17331/203307 [19:37:14<210:32:50,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17331/203307 [19:37:14<210:32:50,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17332/203307 [19:37:19<210:32:51,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17332/203307 [19:37:19<210:32:51,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17333/203307 [19:37:23<210:32:48,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17333/203307 [19:37:23<210:32:48,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17334/203307 [19:37:27<210:32:40,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17334/203307 [19:37:27<210:32:40,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17335/203307 [19:37:31<210:32:38,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17335/203307 [19:37:31<210:32:38,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17336/203307 [19:37:36<210:32:38,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17336/203307 [19:37:36<210:32:38,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17337/203307 [19:37:40<210:32:34,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17337/203307 [19:37:40<210:32:34,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17338/203307 [19:37:43<210:32:27,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17338/203307 [19:37:43<210:32:27,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17339/203307 [19:37:47<210:32:19,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17339/203307 [19:37:47<210:32:20,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17340/203307 [19:37:52<210:32:19,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17340/203307 [19:37:52<210:32:19,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17341/203307 [19:37:56<210:32:17,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17341/203307 [19:37:56<210:32:17,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17342/203307 [19:37:59<210:32:08,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17342/203307 [19:37:59<210:32:09,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17343/203307 [19:38:03<210:32:01,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17343/203307 [19:38:03<210:32:01,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17344/203307 [19:38:08<210:32:02,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17344/203307 [19:38:08<210:32:03,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17345/203307 [19:38:12<210:31:55,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17345/203307 [19:38:12<210:31:55,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17346/203307 [19:38:16<210:31:52,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17346/203307 [19:38:16<210:31:52,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17347/203307 [19:38:19<210:31:43,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17347/203307 [19:38:19<210:31:43,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17348/203307 [19:38:23<210:31:35,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17348/203307 [19:38:23<210:31:35,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17349/203307 [19:38:28<210:31:35,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17349/203307 [19:38:28<210:31:35,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17350/203307 [19:38:32<210:31:34,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17350/203307 [19:38:32<210:31:34,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17351/203307 [19:38:35<210:31:25,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17351/203307 [19:38:36<210:31:25,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17352/203307 [19:38:40<210:31:23,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17352/203307 [19:38:40<210:31:23,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17353/203307 [19:38:44<210:31:21,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17353/203307 [19:38:44<210:31:21,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17354/203307 [19:38:48<210:31:12,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17354/203307 [19:38:48<210:31:12,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17355/203307 [19:38:52<210:31:09,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17355/203307 [19:38:52<210:31:09,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17356/203307 [19:38:55<210:31:00,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17356/203307 [19:38:55<210:31:00,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17357/203307 [19:38:59<210:30:51,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17357/203307 [19:38:59<210:30:51,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17358/203307 [19:39:04<210:30:51,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17358/203307 [19:39:04<210:30:51,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17359/203307 [19:39:07<210:30:42,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17359/203307 [19:39:07<210:30:42,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17360/203307 [19:39:11<210:30:40,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17360/203307 [19:39:11<210:30:40,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17361/203307 [19:39:16<210:30:39,  0.25it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:   9%|▊         | 17361/203307 [19:39:16<210:30:39,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17362/203307 [19:39:20<210:30:32,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17362/203307 [19:39:20<210:30:32,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17363/203307 [19:39:23<210:30:24,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17363/203307 [19:39:23<210:30:24,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17364/203307 [19:39:28<210:30:21,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17364/203307 [19:39:28<210:30:21,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17365/203307 [19:39:31<210:30:13,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17365/203307 [19:39:31<210:30:13,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17366/203307 [19:39:36<210:30:12,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17366/203307 [19:39:36<210:30:12,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17367/203307 [19:39:39<210:30:03,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17367/203307 [19:39:39<210:30:03,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17368/203307 [19:39:43<210:29:56,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17368/203307 [19:39:43<210:29:56,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17369/203307 [19:39:47<210:29:56,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17369/203307 [19:39:47<210:29:56,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17370/203307 [19:39:51<210:29:48,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17370/203307 [19:39:51<210:29:48,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17371/203307 [19:39:55<210:29:40,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17371/203307 [19:39:55<210:29:40,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17372/203307 [19:39:59<210:29:32,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17372/203307 [19:39:59<210:29:32,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17373/203307 [19:40:03<210:29:30,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17373/203307 [19:40:03<210:29:30,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17374/203307 [19:40:06<210:29:21,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17374/203307 [19:40:06<210:29:21,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17375/203307 [19:40:11<210:29:21,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17375/203307 [19:40:11<210:29:21,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17376/203307 [19:40:15<210:29:12,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17376/203307 [19:40:15<210:29:13,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17377/203307 [19:40:19<210:29:12,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17377/203307 [19:40:19<210:29:12,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17378/203307 [19:40:23<210:29:11,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17378/203307 [19:40:23<210:29:11,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17379/203307 [19:40:27<210:29:04,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17379/203307 [19:40:27<210:29:04,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17380/203307 [19:40:31<210:28:56,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17380/203307 [19:40:31<210:28:56,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17381/203307 [19:40:35<210:28:48,  0.25it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:   9%|▊         | 17381/203307 [19:40:35<210:28:49,  0.25it/s, v_num=t5e6, training/loss=0.089] Epoch 0:   9%|▊         | 17382/203307 [19:40:39<210:28:46,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17382/203307 [19:40:39<210:28:46,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17383/203307 [19:40:43<210:28:43,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17383/203307 [19:40:43<210:28:43,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17384/203307 [19:40:47<210:28:43,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17384/203307 [19:40:47<210:28:43,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17385/203307 [19:40:52<210:28:41,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17385/203307 [19:40:52<210:28:41,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17386/203307 [19:40:56<210:28:41,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17386/203307 [19:40:56<210:28:41,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17387/203307 [19:41:00<210:28:33,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17387/203307 [19:41:00<210:28:33,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17388/203307 [19:41:04<210:28:26,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17388/203307 [19:41:04<210:28:26,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17389/203307 [19:41:07<210:28:19,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17389/203307 [19:41:08<210:28:19,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17390/203307 [19:41:11<210:28:11,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17390/203307 [19:41:11<210:28:11,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17391/203307 [19:41:15<210:28:09,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17391/203307 [19:41:15<210:28:09,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17392/203307 [19:41:20<210:28:10,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17392/203307 [19:41:20<210:28:10,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17393/203307 [19:41:24<210:28:02,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17393/203307 [19:41:24<210:28:02,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17394/203307 [19:41:28<210:28:02,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17394/203307 [19:41:28<210:28:03,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17395/203307 [19:41:32<210:27:55,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17395/203307 [19:41:32<210:27:55,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17396/203307 [19:41:36<210:27:48,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17396/203307 [19:41:36<210:27:48,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17397/203307 [19:41:40<210:27:41,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17397/203307 [19:41:40<210:27:41,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17398/203307 [19:41:43<210:27:34,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17398/203307 [19:41:43<210:27:34,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17399/203307 [19:41:47<210:27:26,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17399/203307 [19:41:47<210:27:26,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17400/203307 [19:41:52<210:27:26,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17400/203307 [19:41:52<210:27:26,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17401/203307 [19:41:56<210:27:27,  0.25it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▊         | 17401/203307 [19:41:56<210:27:27,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17402/203307 [19:42:00<210:27:26,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17402/203307 [19:42:00<210:27:26,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17403/203307 [19:42:05<210:27:25,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17403/203307 [19:42:05<210:27:25,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17404/203307 [19:42:09<210:27:18,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17404/203307 [19:42:09<210:27:18,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17405/203307 [19:42:12<210:27:10,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17405/203307 [19:42:12<210:27:10,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17406/203307 [19:42:16<210:27:02,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17406/203307 [19:42:16<210:27:02,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17407/203307 [19:42:20<210:26:55,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17407/203307 [19:42:20<210:26:55,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17408/203307 [19:42:24<210:26:53,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17408/203307 [19:42:24<210:26:53,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17409/203307 [19:42:28<210:26:51,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17409/203307 [19:42:28<210:26:51,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17410/203307 [19:42:33<210:26:51,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17410/203307 [19:42:33<210:26:51,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17411/203307 [19:42:37<210:26:50,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17411/203307 [19:42:37<210:26:50,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17412/203307 [19:42:41<210:26:42,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17412/203307 [19:42:41<210:26:42,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17413/203307 [19:42:45<210:26:34,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17413/203307 [19:42:45<210:26:34,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17414/203307 [19:42:48<210:26:26,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17414/203307 [19:42:48<210:26:26,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17415/203307 [19:42:52<210:26:18,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17415/203307 [19:42:52<210:26:18,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17416/203307 [19:42:56<210:26:16,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17416/203307 [19:42:56<210:26:16,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17417/203307 [19:43:00<210:26:07,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17417/203307 [19:43:00<210:26:08,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17418/203307 [19:43:04<210:26:06,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17418/203307 [19:43:04<210:26:06,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17419/203307 [19:43:09<210:26:06,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17419/203307 [19:43:09<210:26:06,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17420/203307 [19:43:12<210:25:58,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17420/203307 [19:43:12<210:25:58,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17421/203307 [19:43:16<210:25:50,  0.25it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:   9%|▊         | 17421/203307 [19:43:16<210:25:50,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17422/203307 [19:43:20<210:25:42,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17422/203307 [19:43:20<210:25:42,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17423/203307 [19:43:24<210:25:35,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17423/203307 [19:43:24<210:25:35,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17424/203307 [19:43:27<210:25:28,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17424/203307 [19:43:27<210:25:28,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17425/203307 [19:43:32<210:25:26,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17425/203307 [19:43:32<210:25:27,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17426/203307 [19:43:35<210:25:18,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17426/203307 [19:43:36<210:25:19,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17427/203307 [19:43:40<210:25:19,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17427/203307 [19:43:40<210:25:19,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17428/203307 [19:43:44<210:25:18,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17428/203307 [19:43:44<210:25:18,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17429/203307 [19:43:48<210:25:10,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17429/203307 [19:43:48<210:25:10,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17430/203307 [19:43:52<210:25:02,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17430/203307 [19:43:52<210:25:03,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17431/203307 [19:43:56<210:24:55,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17431/203307 [19:43:56<210:24:55,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17432/203307 [19:43:59<210:24:47,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17432/203307 [19:43:59<210:24:47,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17433/203307 [19:44:04<210:24:45,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17433/203307 [19:44:04<210:24:45,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17434/203307 [19:44:07<210:24:38,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17434/203307 [19:44:07<210:24:38,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17435/203307 [19:44:12<210:24:36,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17435/203307 [19:44:12<210:24:36,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17436/203307 [19:44:16<210:24:36,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17436/203307 [19:44:16<210:24:37,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17437/203307 [19:44:20<210:24:30,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17437/203307 [19:44:20<210:24:30,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17438/203307 [19:44:24<210:24:22,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17438/203307 [19:44:24<210:24:22,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17439/203307 [19:44:27<210:24:14,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17439/203307 [19:44:27<210:24:14,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17440/203307 [19:44:31<210:24:07,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17440/203307 [19:44:31<210:24:07,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17441/203307 [19:44:36<210:24:06,  0.25it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▊         | 17441/203307 [19:44:36<210:24:06,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17442/203307 [19:44:39<210:23:58,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17442/203307 [19:44:39<210:23:58,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17443/203307 [19:44:43<210:23:50,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17443/203307 [19:44:43<210:23:50,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17444/203307 [19:44:48<210:23:52,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17444/203307 [19:44:48<210:23:52,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17445/203307 [19:44:52<210:23:50,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17445/203307 [19:44:52<210:23:50,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17446/203307 [19:44:56<210:23:42,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17446/203307 [19:44:56<210:23:42,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17447/203307 [19:44:59<210:23:35,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17447/203307 [19:44:59<210:23:35,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17448/203307 [19:45:03<210:23:27,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17448/203307 [19:45:03<210:23:27,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17449/203307 [19:45:07<210:23:20,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17449/203307 [19:45:07<210:23:20,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17450/203307 [19:45:11<210:23:19,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17450/203307 [19:45:11<210:23:20,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17451/203307 [19:45:15<210:23:12,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17451/203307 [19:45:15<210:23:12,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17452/203307 [19:45:20<210:23:12,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17452/203307 [19:45:20<210:23:13,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17453/203307 [19:45:24<210:23:13,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17453/203307 [19:45:24<210:23:13,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17454/203307 [19:45:28<210:23:11,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17454/203307 [19:45:28<210:23:11,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17455/203307 [19:45:32<210:23:04,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17455/203307 [19:45:32<210:23:04,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17456/203307 [19:45:36<210:22:57,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17456/203307 [19:45:36<210:22:57,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17457/203307 [19:45:40<210:22:50,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17457/203307 [19:45:40<210:22:50,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17458/203307 [19:45:44<210:22:48,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17458/203307 [19:45:44<210:22:48,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17459/203307 [19:45:48<210:22:44,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17459/203307 [19:45:48<210:22:44,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17460/203307 [19:45:52<210:22:42,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17460/203307 [19:45:52<210:22:42,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17461/203307 [19:45:57<210:22:42,  0.25it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▊         | 17461/203307 [19:45:57<210:22:42,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17462/203307 [19:46:01<210:22:42,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17462/203307 [19:46:01<210:22:42,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17463/203307 [19:46:06<210:22:40,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17463/203307 [19:46:06<210:22:41,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17464/203307 [19:46:09<210:22:33,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17464/203307 [19:46:09<210:22:33,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17465/203307 [19:46:13<210:22:26,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17465/203307 [19:46:13<210:22:26,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17466/203307 [19:46:17<210:22:24,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17466/203307 [19:46:17<210:22:24,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17467/203307 [19:46:21<210:22:17,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17467/203307 [19:46:21<210:22:17,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17468/203307 [19:46:25<210:22:08,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17468/203307 [19:46:25<210:22:08,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17469/203307 [19:46:29<210:22:10,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17469/203307 [19:46:29<210:22:10,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17470/203307 [19:46:34<210:22:09,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17470/203307 [19:46:34<210:22:10,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17471/203307 [19:46:38<210:22:02,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17471/203307 [19:46:38<210:22:02,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17472/203307 [19:46:42<210:21:59,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17472/203307 [19:46:42<210:21:59,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17473/203307 [19:46:46<210:21:51,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17473/203307 [19:46:46<210:21:51,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17474/203307 [19:46:49<210:21:43,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17474/203307 [19:46:49<210:21:43,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17475/203307 [19:46:54<210:21:41,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17475/203307 [19:46:54<210:21:41,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17476/203307 [19:46:57<210:21:35,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17476/203307 [19:46:57<210:21:35,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17477/203307 [19:47:02<210:21:33,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17477/203307 [19:47:02<210:21:33,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17478/203307 [19:47:06<210:21:33,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17478/203307 [19:47:06<210:21:33,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17479/203307 [19:47:10<210:21:32,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17479/203307 [19:47:10<210:21:32,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17480/203307 [19:47:14<210:21:24,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17480/203307 [19:47:14<210:21:24,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17481/203307 [19:47:19<210:21:22,  0.25it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▊         | 17481/203307 [19:47:19<210:21:22,  0.25it/s, v_num=t5e6, training/loss=0.083] Epoch 0:   9%|▊         | 17482/203307 [19:47:22<210:21:15,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17482/203307 [19:47:22<210:21:15,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17483/203307 [19:47:27<210:21:13,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17483/203307 [19:47:27<210:21:13,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17484/203307 [19:47:30<210:21:05,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17484/203307 [19:47:30<210:21:05,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17485/203307 [19:47:35<210:21:04,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17485/203307 [19:47:35<210:21:04,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17486/203307 [19:47:39<210:21:02,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17486/203307 [19:47:39<210:21:03,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17487/203307 [19:47:43<210:20:55,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17487/203307 [19:47:43<210:20:55,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17488/203307 [19:47:47<210:20:55,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17488/203307 [19:47:47<210:20:55,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17489/203307 [19:47:51<210:20:48,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17489/203307 [19:47:51<210:20:48,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17490/203307 [19:47:55<210:20:44,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17490/203307 [19:47:55<210:20:44,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17491/203307 [19:47:59<210:20:43,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17491/203307 [19:47:59<210:20:43,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17492/203307 [19:48:03<210:20:35,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17492/203307 [19:48:03<210:20:35,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17493/203307 [19:48:07<210:20:28,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17493/203307 [19:48:07<210:20:28,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17494/203307 [19:48:11<210:20:28,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17494/203307 [19:48:11<210:20:28,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17495/203307 [19:48:15<210:20:21,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17495/203307 [19:48:15<210:20:21,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17496/203307 [19:48:20<210:20:21,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17496/203307 [19:48:20<210:20:21,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17497/203307 [19:48:23<210:20:14,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17497/203307 [19:48:23<210:20:14,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17498/203307 [19:48:27<210:20:06,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17498/203307 [19:48:27<210:20:06,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17499/203307 [19:48:31<210:20:03,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17499/203307 [19:48:31<210:20:03,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17500/203307 [19:48:36<210:20:02,  0.25it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17500/203307 [19:48:36<210:20:02,  0.25it/s, v_num=t5e6, training/loss=0.083]
Validation: |          | 0/? [00:00<?, ?it/s][A
Validation:   0%|          | 0/1 [00:00<?, ?it/s][A


Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s][A[A

Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:25,  1.16it/s][A[A

Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:23,  1.17it/s][A[A

Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:23,  1.16it/s][A[A

Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:22,  1.16it/s][A[A

Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:22,  1.16it/s][A[A

Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:20,  1.16it/s][A[A

Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:19,  1.17it/s][A[A

Sampling (mamba memory):  54%|█████▍    | 108/200 [00:06<01:18,  1.17it/s][A[A

Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:18,  1.16it/s][A[A

Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:17,  1.16it/s][A[A

Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:27,  1.13it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:25,  1.14it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:24,  1.14it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:23,  1.14it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:23,  1.14it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:22,  1.14it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:21,  1.14it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:20,  1.14it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:19,  1.14it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:18,  1.14it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:18,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:28,  1.12it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:26,  1.13it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:26,  1.13it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:25,  1.13it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:24,  1.13it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:23,  1.13it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:22,  1.13it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:21,  1.13it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:20,  1.13it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:19,  1.13it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:19,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:28,  1.12it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:27,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:26,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:25,  1.12it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:25,  1.12it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:24,  1.12it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:23,  1.12it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:21,  1.12it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:21,  1.12it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:20,  1.11it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:19,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:29,  1.11it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:27,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:26,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:25,  1.12it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:25,  1.12it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:24,  1.12it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:23,  1.12it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:22,  1.11it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:22,  1.11it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:21,  1.11it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:20,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:30,  1.09it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:28,  1.11it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:26,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:25,  1.12it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:25,  1.12it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:24,  1.11it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:23,  1.11it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:22,  1.11it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:22,  1.10it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:09<01:21,  1.10it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:20,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:30,  1.09it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:28,  1.11it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:27,  1.11it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:26,  1.11it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:25,  1.11it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:24,  1.11it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:23,  1.11it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:23,  1.11it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:22,  1.10it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:09<01:21,  1.10it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:21,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:31,  1.08it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:29,  1.09it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:29,  1.09it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:28,  1.08it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:27,  1.08it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:27,  1.08it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:26,  1.08it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:25,  1.08it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:24,  1.07it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:09<01:24,  1.07it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:10<01:23,  1.0Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:17,  1.16it/s][A[A

Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:16,  1.15it/s][A[A

Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:15,  1.15it/s][A[A

Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:14,  1.15it/s][A[A

Sampling (mamba memory):  57%|█████▊    | 115/200 [00:12<01:14,  1.15it/s][A[A

Sampling (mamba memory):  58%|█████▊    | 116/200 [00:13<01:13,  1.15it/s][A[A

Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:12,  1.15it/s][A[A

Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:11,  1.15it/s][A[A

Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:10,  1.15it/s][A[A

Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:09,  1.15it/s][A[A

Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:08,  1.15it/s][A[A

Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:08,  1.14it/s][A[A

4it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:17,  1.13it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:16,  1.14it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:15,  1.14it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:14,  1.13it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:14,  1.13it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:13,  1.13it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:12,  1.13it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:11,  1.13it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:11,  1.13it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:10,  1.12it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:09,  1.12it/s]Sampling (mamba memory):  62%|██████▏   | 123/2it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:18,  1.12it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:17,  1.13it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:16,  1.12it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:15,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:14,  1.13it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:13,  1.13it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:12,  1.13it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:11,  1.13it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:11,  1.13it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:10,  1.12it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:09,  1.12it/s]Sampling (mamba memory):  62%|██████▏   | 123/1it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:19,  1.11it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:18,  1.11it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:17,  1.12it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:16,  1.11it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:15,  1.11it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:14,  1.12it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:13,  1.12it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:12,  1.12it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:11,  1.11it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:11,  1.11it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:10,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 123/Sampling (mamba memory):  62%|██████▏   | 123/200 [00:19<01:07,  1.14it/s][A[A

1it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:19,  1.11it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:18,  1.11it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:17,  1.11it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:17,  1.10it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:16,  1.10it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:15,  1.10it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:14,  1.10it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:13,  1.10it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:13,  1.09it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:19<01:12,  1.09it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:11,  1.08it/s]Sampling (mamba memory):  62%|██████▏   | 123/0it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:20,  1.10it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:19,  1.10it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:18,  1.10it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:17,  1.09it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:16,  1.09it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:15,  1.10it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:14,  1.09it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:14,  1.09it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:13,  1.09it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:19<01:12,  1.09it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:20<01:11,  1.09it/s]Sampling (mamba memory):  62%|██████▏   | 123/0it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:20,  1.10it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:19,  1.09it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:18,  1.09it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:17,  1.09it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:17,  1.09it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:16,  1.09it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:15,  1.09it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:14,  1.09it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:13,  1.09it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:19<01:12,  1.09it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:20<01:11,  1.08it/s]Sampling (mamba memory):  62%|██████▏   | 123/7it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:11<01:22,  1.07it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:12<01:21,  1.07it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:13<01:20,  1.07it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:19,  1.07it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:18,  1.07it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:17,  1.06it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:17,  1.06it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:16,  1.06it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:15,  1.06it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:19<01:14,  1.06it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:20<01:13,  1.05it/s]Sampling (mamba memory):  62%|██████▏   | 123/Sampling (mamba memory):  62%|██████▏   | 124/200 [00:20<01:06,  1.14it/s][A[A

Sampling (mamba memory):  62%|██████▎   | 125/200 [00:21<01:05,  1.14it/s][A[A

Sampling (mamba memory):  63%|██████▎   | 126/200 [00:22<01:05,  1.13it/s][A[A

Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:04,  1.13it/s][A[A

Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:03,  1.13it/s][A[A

Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:03,  1.13it/s][A[A

Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:02,  1.12it/s][A[A

Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:01,  1.12it/s][A[A

Sampling (mamba memory):  66%|██████▌   | 132/200 [00:27<01:00,  1.12it/s][A[A

Sampling (mamba memory):  66%|██████▋   | 133/200 [00:28<01:00,  1.12it/s][A[A

Sampling (mamba memory):  67%|██████▋   | 134/200 [00:29<00:59,  1.12it/s][A[A

200 [00:20<01:09,  1.12it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:08,  1.11it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:07,  1.11it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:06,  1.11it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:05,  1.11it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:05,  1.11it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:04,  1.10it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:03,  1.10it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:02,  1.10it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:01,  1.10it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:01,  1.09it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:00,  1.09it/s]Sampling (mamba 200 [00:20<01:08,  1.12it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:07,  1.12it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:07,  1.12it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:06,  1.12it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:05,  1.11it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:04,  1.11it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:04,  1.10it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:03,  1.10it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:02,  1.10it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:02,  1.10it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:01,  1.09it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:00,  1.09it/s]Sampling (mamba Sampling (mamba memory):  68%|██████▊   | 135/200 [00:30<00:58,  1.11it/s][A[A

200 [00:20<01:09,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:08,  1.10it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:07,  1.10it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:07,  1.10it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:06,  1.10it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:05,  1.10it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:04,  1.09it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:04,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:03,  1.08it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:02,  1.08it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:02,  1.08it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:01,  1.08it/s]Sampling (mamba 200 [00:20<01:10,  1.09it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:09,  1.09it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:08,  1.09it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:07,  1.10it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:06,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:06,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:05,  1.09it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:04,  1.08it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:03,  1.08it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:03,  1.08it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:02,  1.08it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<01:01,  1.07it/s]Sampling (mamba 200 [00:20<01:11,  1.08it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:10,  1.08it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:09,  1.07it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:08,  1.07it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:08,  1.07it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:07,  1.07it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:06,  1.06it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:06,  1.06it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:05,  1.05it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:04,  1.06it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:03,  1.05it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<01:02,  1.05it/s]Sampling (mamba 200 [00:21<01:11,  1.08it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:10,  1.08it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:09,  1.08it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:08,  1.08it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:08,  1.07it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:07,  1.07it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:06,  1.07it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:05,  1.06it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:05,  1.06it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:04,  1.05it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:03,  1.06it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<01:02,  1.05it/s]Sampling (mamba Sampling (mamba memory):  68%|██████▊   | 136/200 [00:31<00:57,  1.11it/s][A[A

200 [00:21<01:13,  1.05it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:22<01:12,  1.05it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:23<01:11,  1.05it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:24<01:10,  1.05it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:25<01:10,  1.04it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:26<01:09,  1.04it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:27<01:08,  1.04it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:28<01:07,  1.03it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:29<01:06,  1.03it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:30<01:05,  1.03it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:31<01:04,  1.03it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:32<01:03,  1.03it/s]Sampling (mamba Sampling (mamba memory):  68%|██████▊   | 137/200 [00:32<00:56,  1.12it/s][A[A

Sampling (mamba memory):  69%|██████▉   | 138/200 [00:33<00:55,  1.12it/s][A[A

Sampling (mamba memory):  70%|██████▉   | 139/200 [00:34<00:54,  1.12it/s][A[A

Sampling (mamba memory):  70%|███████   | 140/200 [00:35<00:53,  1.11it/s][A[A

Sampling (mamba memory):  70%|███████   | 141/200 [00:36<00:53,  1.11it/s][A[A

Sampling (mamba memory):  71%|███████   | 142/200 [00:36<00:52,  1.11it/s][A[A

Sampling (mamba memory):  72%|███████▏  | 143/200 [00:37<00:51,  1.11it/s][A[A

Sampling (mamba memory):  72%|███████▏  | 144/200 [00:38<00:50,  1.11it/s][A[A

Sampling (mamba memory):  72%|███████▎  | 145/200 [00:39<00:49,  1.11it/s][A[A

Sampling (mamba memory):  73%|███████▎  | 146/200 [00:40<00:48,  1.11it/s][A[A

memory):  68%|██████▊   | 135/200 [00:31<00:59,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:59,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:58,  1.08it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:57,  1.08it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:34<00:56,  1.08it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:35<00:55,  1.08it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:36<00:54,  1.08it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:37<00:54,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:38<00:53,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:52,  1.07it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:51,  1.07it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:31<00:59,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:59,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:58,  1.08it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:57,  1.08it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:56,  1.08it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:55,  1.07it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:36<00:55,  1.07it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:37<00:54,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:38<00:53,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:52,  1.07it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:51,  1.07it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:31<01:00,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:59,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:58,  1.07it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:58,  1.06it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:57,  1.06it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:56,  1.06it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:55,  1.06it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:55,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:54,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:53,  1.05it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:52,  1.05it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▎  | 147/200 [00:41<00:47,  1.11it/s][A[A

memory):  68%|██████▊   | 135/200 [00:32<01:00,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:59,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:58,  1.07it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:57,  1.07it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:57,  1.07it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:56,  1.06it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:55,  1.06it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:54,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:53,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:53,  1.06it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:51,  1.06it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:32<01:01,  1.05it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:33<01:00,  1.05it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:34<00:59,  1.05it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:35<00:58,  1.06it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:36<00:57,  1.06it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:56,  1.06it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:55,  1.06it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:55,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:54,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:53,  1.05it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:52,  1.04it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:32<01:01,  1.05it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:33<01:00,  1.05it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:34<01:00,  1.05it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:35<00:59,  1.05it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:36<00:58,  1.04it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:37<00:57,  1.05it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:38<00:56,  1.04it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:39<00:55,  1.04it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:40<00:54,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:53,  1.05it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:52,  1.05it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▍  | 148/200 [00:42<00:46,  1.11it/s][A[A

memory):  68%|██████▊   | 135/200 [00:33<01:03,  1.03it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:34<01:02,  1.03it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:35<01:01,  1.03it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:36<01:00,  1.02it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:37<00:59,  1.02it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:38<00:58,  1.03it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:39<00:57,  1.03it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:39<00:56,  1.03it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:40<00:55,  1.03it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:41<00:54,  1.03it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:42<00:53,  1.03it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▍  | 149/200 [00:43<00:46,  1.11it/s][A[A

Sampling (mamba memory):  75%|███████▌  | 150/200 [00:44<00:45,  1.11it/s][A[A

Sampling (mamba memory):  76%|███████▌  | 151/200 [00:45<00:44,  1.10it/s][A[A

Sampling (mamba memory):  76%|███████▌  | 152/200 [00:46<00:43,  1.09it/s][A[A

Sampling (mamba memory):  76%|███████▋  | 153/200 [00:46<00:43,  1.09it/s][A[A

Sampling (mamba memory):  77%|███████▋  | 154/200 [00:47<00:42,  1.09it/s][A[A

Sampling (mamba memory):  78%|███████▊  | 155/200 [00:48<00:41,  1.08it/s][A[A

Sampling (mamba memory):  78%|███████▊  | 156/200 [00:49<00:40,  1.07it/s][A[A

Sampling (mamba memory):  78%|███████▊  | 157/200 [00:50<00:40,  1.07it/s][A[A

 | 146/200 [00:41<00:50,  1.07it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:49,  1.07it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:48,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:48,  1.06it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:47,  1.06it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:46,  1.06it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:45,  1.06it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:44,  1.06it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:43,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:42,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:50<00:41,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:51<00:40 | 146/200 [00:41<00:50,  1.07it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:49,  1.07it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:48,  1.07it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:47,  1.06it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:49,  1.02it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:47,  1.03it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:46,  1.04it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:45,  1.04it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:44,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:43,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:42,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:41Sampling (mamba memory):  79%|███████▉  | 158/200 [00:51<00:39,  1.07it/s][A[A

 | 146/200 [00:42<00:51,  1.05it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:50,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:49,  1.04it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:49,  1.04it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:48,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:47,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:46,  1.04it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:45,  1.04it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:44,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:43,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:42,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:41 | 146/200 [00:42<00:50,  1.06it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:50,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:49,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:48,  1.05it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:48,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:47,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:48<00:46,  1.04it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:49<00:45,  1.03it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:50<00:44,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:51<00:43,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:52<00:42,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:53<00:41 | 146/200 [00:42<00:51,  1.04it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:50,  1.04it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:49,  1.04it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:49,  1.04it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:47,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:46,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:48<00:45,  1.05it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:49<00:45,  1.04it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:50<00:44,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:51<00:43,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:52<00:42,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:53<00:41 | 146/200 [00:42<00:51,  1.05it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:50,  1.04it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:49,  1.04it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:48,  1.04it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:47,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:46,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:48<00:46,  1.04it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:49<00:45,  1.04it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:50<00:44,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:51<00:43,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:52<00:42,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:53<00:41Sampling (mamba memory):  80%|███████▉  | 159/200 [00:52<00:38,  1.06it/s][A[A

Sampling (mamba memory):  80%|████████  | 160/200 [00:53<00:37,  1.06it/s][A[A

 | 146/200 [00:43<00:52,  1.03it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:44<00:51,  1.03it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:45<00:50,  1.02it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:46<00:50,  1.02it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:47<00:49,  1.02it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:48<00:48,  1.01it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:49<00:47,  1.01it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:50<00:46,  1.00it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:51<00:45,  1.00it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:52<00:44,  1.00it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:53<00:44,  1.00s/it]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:54<00:43Sampling (mamba memory):  80%|████████  | 161/200 [00:54<00:36,  1.06it/s][A[A

Sampling (mamba memory):  81%|████████  | 162/200 [00:55<00:35,  1.06it/s][A[A

Sampling (mamba memory):  82%|████████▏ | 163/200 [00:56<00:34,  1.06it/s][A[A

Sampling (mamba memory):  82%|████████▏ | 164/200 [00:57<00:34,  1.05it/s][A[A

Sampling (mamba memory):  82%|████████▎ | 165/200 [00:58<00:33,  1.05it/s][A[A

Sampling (mamba memory):  83%|████████▎ | 166/200 [00:59<00:32,  1.05it/s][A[A

Sampling (mamba memory):  84%|████████▎ | 167/200 [01:00<00:31,  1.05it/s][A[A

Sampling (mamba memory):  84%|████████▍ | 168/200 [01:01<00:30,  1.05it/s][A[A

,  1.06it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:52<00:39,  1.05it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:53<00:39,  1.05it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:54<00:38,  1.05it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:55<00:37,  1.05it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:56<00:36,  1.05it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:57<00:35,  1.05it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:58<00:34,  1.04it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [00:59<00:33,  1.04it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:00<00:32,  1.04it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:01<00:31,  1.04it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:02<00:30,  1.04it/s,  1.04it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:53<00:40,  1.03it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:54<00:39,  1.03it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:55<00:38,  1.03it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:56<00:38,  1.03it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:57<00:37,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:36,  1.03it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:34,  1.03it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:33,  1.03it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:32,  1.03it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:02<00:31,  1.03it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:02<00:30,  1.03it/sSampling (mamba memory):  84%|████████▍ | 169/200 [01:02<00:29,  1.05it/s][A[A

,  1.03it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:53<00:40,  1.03it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:54<00:39,  1.03it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:55<00:38,  1.03it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:56<00:37,  1.03it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:57<00:37,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:36,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:35,  1.01it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:34,  1.01it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:33,  1.01it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:02<00:32,  1.01it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:03<00:31,  1.01it/s,  1.03it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:54<00:40,  1.03it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:55<00:40,  1.02it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:56<00:39,  1.02it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:57<00:38,  1.02it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:58<00:37,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:36,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:35,  1.01it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:34,  1.01it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:33,  1.02it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:02<00:32,  1.02it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:03<00:31,  1.02it/sSampling (mamba memory):  85%|████████▌ | 170/200 [01:03<00:28,  1.05it/s][A[A

,  1.03it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:54<00:40,  1.03it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:55<00:39,  1.03it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:56<00:38,  1.03it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:57<00:38,  1.02it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:58<00:37,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:59<00:36,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:00<00:35,  1.02it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:01<00:34,  1.02it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:02<00:33,  1.02it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:03<00:32,  1.01it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:04<00:31,  1.01it/s,  1.03it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:54<00:40,  1.03it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:55<00:39,  1.03it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:56<00:38,  1.03it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:57<00:37,  1.03it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:58<00:37,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:59<00:36,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:00<00:35,  1.02it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:01<00:34,  1.01it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:02<00:33,  1.01it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:03<00:32,  1.01it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:04<00:31,  1.01it/sSampling (mamba memory):  86%|████████▌ | 171/200 [01:04<00:27,  1.05it/s][A[A

Sampling (mamba memory):  86%|████████▌ | 172/200 [01:04<00:26,  1.05it/s][A[A

,  1.00s/it]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:55<00:42,  1.00s/it]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:56<00:41,  1.01s/it]Sampling (mamba memory):  80%|████████  | 160/200 [00:57<00:40,  1.01s/it]Sampling (mamba memory):  80%|████████  | 161/200 [00:58<00:39,  1.01s/it]Sampling (mamba memory):  81%|████████  | 162/200 [00:59<00:38,  1.01s/it]Sampling (mamba memory):  82%|████████▏ | 163/200 [01:00<00:37,  1.02s/it]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:01<00:36,  1.02s/it]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:02<00:35,  1.02s/it]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:04<00:34,  1.02s/it]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:05<00:33,  1.02s/it]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:06<00:32,  1.02s/itSampling (mamba memory):  86%|████████▋ | 173/200 [01:05<00:25,  1.05it/s][A[A

Sampling (mamba memory):  87%|████████▋ | 174/200 [01:06<00:24,  1.05it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 175/200 [01:07<00:23,  1.05it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 176/200 [01:08<00:22,  1.05it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 177/200 [01:09<00:21,  1.05it/s][A[A

Sampling (mamba memory):  89%|████████▉ | 178/200 [01:10<00:21,  1.04it/s][A[A

Sampling (mamba memory):  90%|████████▉ | 179/200 [01:11<00:20,  1.04it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:03<00:29,  1.03it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:04<00:29,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:05<00:28,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:06<00:27,  1.03it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:07<00:26,  1.03it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:08<00:25,  1.03it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:09<00:24,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:10<00:23,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:11<00:22,  1.02it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:12<00:21,  1.02it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:13<00:20,  1.02it/s]Sampling (mamba memory):  90%|█████████ | 180/200 [01:12<00:19,  1.04it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:03<00:30,  1.03it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:04<00:29,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:05<00:28,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:06<00:27,  1.03it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:07<00:26,  1.03it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:08<00:25,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:09<00:24,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:10<00:23,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:11<00:22,  1.02it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:12<00:21,  1.02it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:13<00:20,  1.01it/s]]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:04<00:30,  1.01it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:05<00:29,  1.01it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:06<00:28,  1.01it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:07<00:27,  1.01it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:08<00:26,  1.01it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:09<00:25,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:10<00:24,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:11<00:23,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:12<00:22,  1.01it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:13<00:21,  1.00it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:14<00:21,  1.00s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:13<00:18,  1.03it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:04<00:30,  1.02it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:05<00:29,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:06<00:28,  1.01it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:07<00:27,  1.02it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:08<00:26,  1.01it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:09<00:25,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:10<00:24,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:11<00:23,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:12<00:22,  1.01it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:13<00:21,  1.00it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:14<00:20,  1.00it/s]]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:05<00:30,  1.01it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:06<00:29,  1.01it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:07<00:28,  1.01it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:08<00:27,  1.01it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:09<00:26,  1.01it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:10<00:25,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:11<00:24,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:12<00:23,  1.00it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:13<00:22,  1.00it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:14<00:22,  1.00s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:15<00:21,  1.00s/it]]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:05<00:30,  1.01it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:06<00:29,  1.01it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:07<00:28,  1.01it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:08<00:27,  1.01it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:09<00:26,  1.00it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:10<00:25,  1.00it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:11<00:24,  1.00it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:12<00:24,  1.00s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:13<00:23,  1.00s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:14<00:22,  1.01s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:15<00:21,  1.01s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:14<00:17,  1.03it/s][A[A

Sampling (mamba memory):  92%|█████████▏| 183/200 [01:15<00:16,  1.03it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:07<00:31,  1.02s/it]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:08<00:30,  1.02s/it]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:09<00:29,  1.02s/it]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:10<00:28,  1.02s/it]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:11<00:27,  1.03s/it]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:12<00:26,  1.03s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:13<00:25,  1.03s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:14<00:24,  1.03s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:15<00:23,  1.04s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:16<00:22,  1.04s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:17<00:21,  1.04s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:16<00:15,  1.03it/s][A[A

Sampling (mamba memory):  92%|█████████▎| 185/200 [01:17<00:14,  1.03it/s][A[A

Sampling (mamba memory):  93%|█████████▎| 186/200 [01:18<00:13,  1.03it/s][A[A

Sampling (mamba memory):  94%|█████████▎| 187/200 [01:19<00:12,  1.03it/s][A[A

Sampling (mamba memory):  94%|█████████▍| 188/200 [01:20<00:11,  1.03it/s][A[A

Sampling (mamba memory):  94%|█████████▍| 189/200 [01:21<00:10,  1.03it/s][A[A

Sampling (mamba memory):  95%|█████████▌| 190/200 [01:22<00:09,  1.02it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:14<00:19,  1.01it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:15<00:18,  1.01it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:16<00:17,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:17<00:16,  1.02it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:18<00:15,  1.02it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:19<00:14,  1.02it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:20<00:13,  1.02it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:21<00:12,  1.02it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:22<00:11,  1.02it/s]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:23<00:10,  1.01it/s]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:24<00Sampling (mamba memory):  96%|█████████▌| 191/200 [01:23<00:08,  1.02it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:14<00:19,  1.01it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:15<00:18,  1.01it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:16<00:17,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:17<00:16,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:18<00:15,  1.01it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:19<00:14,  1.01it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:20<00:13,  1.01it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:21<00:12,  1.00it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:22<00:11,  1.00it/s]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:23<00:11,  1.00s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:24<00Sampling (mamba memory):  96%|█████████▌| 192/200 [01:24<00:07,  1.02it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:15<00:20,  1.01s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:16<00:19,  1.01s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:17<00:18,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:18<00:17,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:19<00:16,  1.01s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:20<00:15,  1.01s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:21<00:14,  1.01s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:22<00:13,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:23<00:12,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:24<00:11,  1.02s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:25<00Sampling (mamba memory):  90%|█████████ | 180/200 [01:15<00:20,  1.00s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:16<00:19,  1.00s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:17<00:18,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:18<00:17,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:19<00:16,  1.01s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:20<00:15,  1.01s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:21<00:14,  1.01s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:22<00:13,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:23<00:12,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:24<00:11,  1.02s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:25<00Sampling (mamba memory):  90%|█████████ | 180/200 [01:16<00:20,  1.01s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:17<00:19,  1.01s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:18<00:18,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:19<00:17,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:20<00:16,  1.01s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:21<00:15,  1.01s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:22<00:14,  1.01s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:23<00:13,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:24<00:12,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:25<00:11,  1.02s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:26<00Sampling (mamba memory):  96%|█████████▋| 193/200 [01:25<00:06,  1.02it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:16<00:20,  1.01s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:17<00:19,  1.02s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:18<00:18,  1.02s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:19<00:17,  1.02s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:20<00:16,  1.02s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:21<00:15,  1.02s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:22<00:14,  1.02s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:23<00:13,  1.02s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:24<00:12,  1.02s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:25<00:11,  1.03s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:26<00Sampling (mamba memory):  97%|█████████▋| 194/200 [01:26<00:05,  1.01it/s][A[A

Sampling (mamba memory):  98%|█████████▊| 195/200 [01:27<00:04,  1.01it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:18<00:20,  1.04s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:19<00:19,  1.04s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:20<00:18,  1.04s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:21<00:17,  1.04s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:22<00:16,  1.04s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:23<00:15,  1.04s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:24<00:14,  1.05s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:25<00:13,  1.05s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:26<00:12,  1.05s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:27<00:11,  1.06s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:28<00Sampling (mamba memory):  98%|█████████▊| 196/200 [01:28<00:03,  1.01it/s][A[A

Sampling (mamba memory):  98%|█████████▊| 197/200 [01:29<00:02,  1.01it/s][A[A

Sampling (mamba memory):  99%|█████████▉| 198/200 [01:30<00:01,  1.00it/s][A[A

Sampling (mamba memory): 100%|█████████▉| 199/200 [01:31<00:00,  1.00it/s][A[A

Sampling (mamba memory): 100%|██████████| 200/200 [01:32<00:00,  1.00it/s][A[ASampling (mamba memory): 100%|██████████| 200/200 [01:37<00:00,  1.03it/s]
Validation DataLoader 0:   0%|          | 0/1 [00:00<?, ?it/s][A
:09,  1.01it/s]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:25<00:08,  1.01it/s]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:26<00:07,  1.01it/s]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:27<00:06,  1.01it/s]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:28<00:05,  1.00it/s]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:29<00:04,  1.00it/s]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:30<00:03,  1.00it/s]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:31<00:02,  1.00it/s]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:32<00:01,  1.00it/s]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:33<00:00,  1.00it/s]Sampling (mamba memory): 100%|██████████| 200/200 [01:34<00:00,  1.00it/s]Sampling (mamba memory): 100%|██████████| 200/200 [01:38<00:00,  1.01it/s]
:10,  1.00s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:25<00:09,  1.01s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:26<00:08,  1.01s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:27<00:07,  1.01s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:28<00:06,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:29<00:05,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:30<00:04,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:31<00:03,  1.01s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:32<00:02,  1.01s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:33<00:01,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:34<00:00,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:39<00:00,  1.00it/s]
:10,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:26<00:09,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:27<00:08,  1.03s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:28<00:07,  1.03s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:29<00:06,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:30<00:05,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:31<00:04,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:32<00:03,  1.03s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:33<00:02,  1.03s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:35<00:01,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:36<00:00,  1.04s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:40<00:00,  1.01s/it]
:10,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:27<00:09,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:28<00:08,  1.03s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:29<00:07,  1.03s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:30<00:06,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:31<00:05,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:32<00:04,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:33<00:03,  1.03s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:34<00:02,  1.03s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:35<00:01,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:36<00:00,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:41<00:00,  1.01s/it]
:10,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:27<00:09,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:28<00:08,  1.03s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:29<00:07,  1.03s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:30<00:06,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:31<00:05,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:32<00:04,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:33<00:03,  1.03s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:34<00:02,  1.03s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:35<00:01,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:36<00:00,  1.04s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:41<00:00,  1.02s/it]
:10,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:27<00:09,  1.04s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:28<00:08,  1.04s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:29<00:07,  1.04s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:30<00:06,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:31<00:05,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:32<00:04,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:33<00:03,  1.04s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:34<00:02,  1.03s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:35<00:01,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:36<00:00,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:41<00:00,  1.02s/it]
:10,  1.06s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:30<00:09,  1.06s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:31<00:08,  1.07s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:32<00:07,  1.07s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:33<00:06,  1.06s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:34<00:05,  1.06s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:35<00:04,  1.06s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:36<00:03,  1.06s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:37<00:02,  1.06s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:38<00:01,  1.05s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:39<00:00,  1.05s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:44<00:00,  1.04s/it]
Validation DataLoader 0: 100%|██████████| 1/1 [01:37<00:00,  0.01it/s][A
                                                                      [AEpoch 0:   9%|▊         | 17500/203307 [19:50:32<210:40:33,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17501/203307 [19:50:36<210:40:33,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▊         | 17501/203307 [19:50:36<210:40:33,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17502/203307 [19:50:40<210:40:31,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17502/203307 [19:50:40<210:40:31,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17503/203307 [19:50:45<210:40:30,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17503/203307 [19:50:45<210:40:31,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17504/203307 [19:50:49<210:40:31,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17504/203307 [19:50:49<210:40:31,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17505/203307 [19:50:53<210:40:24,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17505/203307 [19:50:53<210:40:24,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17506/203307 [19:50:57<210:40:18,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17506/203307 [19:50:57<210:40:18,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17507/203307 [19:51:01<210:40:14,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17507/203307 [19:51:01<210:40:14,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17508/203307 [19:51:05<210:40:10,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17508/203307 [19:51:05<210:40:10,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17509/203307 [19:51:09<210:40:03,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17509/203307 [19:51:09<210:40:03,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17510/203307 [19:51:13<210:40:03,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17510/203307 [19:51:13<210:40:03,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17511/203307 [19:51:17<210:39:56,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17511/203307 [19:51:17<210:39:56,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17512/203307 [19:51:22<210:39:56,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17512/203307 [19:51:22<210:39:56,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17513/203307 [19:51:26<210:39:55,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17513/203307 [19:51:26<210:39:55,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17514/203307 [19:51:30<210:39:46,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17514/203307 [19:51:30<210:39:46,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17515/203307 [19:51:33<210:39:38,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17515/203307 [19:51:33<210:39:38,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17516/203307 [19:51:37<210:39:31,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17516/203307 [19:51:37<210:39:31,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17517/203307 [19:51:42<210:39:29,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17517/203307 [19:51:42<210:39:29,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17518/203307 [19:51:46<210:39:28,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17518/203307 [19:51:46<210:39:28,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17519/203307 [19:51:50<210:39:21,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17519/203307 [19:51:50<210:39:21,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17520/203307 [19:51:54<210:39:19,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17520/203307 [19:51:54<210:39:19,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17521/203307 [19:51:58<210:39:11,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:   9%|▊         | 17521/203307 [19:51:58<210:39:11,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17522/203307 [19:52:02<210:39:10,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17522/203307 [19:52:02<210:39:10,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17523/203307 [19:52:06<210:39:02,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17523/203307 [19:52:06<210:39:02,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17524/203307 [19:52:09<210:38:54,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17524/203307 [19:52:09<210:38:54,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17525/203307 [19:52:14<210:38:52,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17525/203307 [19:52:14<210:38:52,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17526/203307 [19:52:18<210:38:51,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17526/203307 [19:52:18<210:38:51,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17527/203307 [19:52:22<210:38:44,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17527/203307 [19:52:22<210:38:44,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17528/203307 [19:52:26<210:38:44,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17528/203307 [19:52:26<210:38:44,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17529/203307 [19:52:30<210:38:37,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17529/203307 [19:52:30<210:38:37,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17530/203307 [19:52:35<210:38:36,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17530/203307 [19:52:35<210:38:36,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17531/203307 [19:52:38<210:38:28,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17531/203307 [19:52:38<210:38:28,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17532/203307 [19:52:42<210:38:19,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17532/203307 [19:52:42<210:38:19,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17533/203307 [19:52:46<210:38:17,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17533/203307 [19:52:46<210:38:17,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17534/203307 [19:52:51<210:38:16,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17534/203307 [19:52:51<210:38:16,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17535/203307 [19:52:55<210:38:13,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17535/203307 [19:52:55<210:38:13,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17536/203307 [19:52:59<210:38:12,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17536/203307 [19:52:59<210:38:12,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17537/203307 [19:53:03<210:38:04,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17537/203307 [19:53:03<210:38:04,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17538/203307 [19:53:06<210:37:55,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17538/203307 [19:53:06<210:37:55,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17539/203307 [19:53:11<210:37:56,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17539/203307 [19:53:11<210:37:56,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17540/203307 [19:53:15<210:37:48,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17540/203307 [19:53:15<210:37:48,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17541/203307 [19:53:18<210:37:40,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▊         | 17541/203307 [19:53:18<210:37:40,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17542/203307 [19:53:23<210:37:39,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17542/203307 [19:53:23<210:37:39,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17543/203307 [19:53:27<210:37:37,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17543/203307 [19:53:27<210:37:37,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17544/203307 [19:53:32<210:37:36,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17544/203307 [19:53:32<210:37:37,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17545/203307 [19:53:36<210:37:33,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17545/203307 [19:53:36<210:37:33,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17546/203307 [19:53:39<210:37:24,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17546/203307 [19:53:39<210:37:24,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17547/203307 [19:53:43<210:37:16,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17547/203307 [19:53:43<210:37:16,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17548/203307 [19:53:48<210:37:17,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17548/203307 [19:53:48<210:37:17,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17549/203307 [19:53:51<210:37:09,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17549/203307 [19:53:51<210:37:09,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17550/203307 [19:53:55<210:37:06,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17550/203307 [19:53:55<210:37:06,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17551/203307 [19:54:00<210:37:05,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17551/203307 [19:54:00<210:37:05,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17552/203307 [19:54:03<210:36:56,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17552/203307 [19:54:03<210:36:56,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17553/203307 [19:54:08<210:36:55,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17553/203307 [19:54:08<210:36:55,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17554/203307 [19:54:12<210:36:48,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17554/203307 [19:54:12<210:36:48,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17555/203307 [19:54:15<210:36:41,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17555/203307 [19:54:15<210:36:41,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17556/203307 [19:54:20<210:36:41,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17556/203307 [19:54:20<210:36:41,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17557/203307 [19:54:24<210:36:32,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17557/203307 [19:54:24<210:36:32,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17558/203307 [19:54:28<210:36:30,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17558/203307 [19:54:28<210:36:30,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17559/203307 [19:54:32<210:36:28,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17559/203307 [19:54:32<210:36:28,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17560/203307 [19:54:36<210:36:20,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17560/203307 [19:54:36<210:36:20,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17561/203307 [19:54:40<210:36:19,  0.24it/s, v_num=t5e6, training/loss=0.0844]Epoch 0:   9%|▊         | 17561/203307 [19:54:40<210:36:19,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17562/203307 [19:54:44<210:36:16,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17562/203307 [19:54:44<210:36:16,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17563/203307 [19:54:48<210:36:08,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17563/203307 [19:54:48<210:36:08,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17564/203307 [19:54:52<210:36:00,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17564/203307 [19:54:52<210:36:00,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17565/203307 [19:54:56<210:35:59,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17565/203307 [19:54:56<210:35:59,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17566/203307 [19:55:00<210:35:51,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17566/203307 [19:55:00<210:35:51,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17567/203307 [19:55:04<210:35:49,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17567/203307 [19:55:04<210:35:50,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17568/203307 [19:55:08<210:35:48,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17568/203307 [19:55:08<210:35:48,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17569/203307 [19:55:13<210:35:46,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17569/203307 [19:55:13<210:35:46,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17570/203307 [19:55:16<210:35:38,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17570/203307 [19:55:16<210:35:38,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17571/203307 [19:55:20<210:35:31,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17571/203307 [19:55:20<210:35:31,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17572/203307 [19:55:24<210:35:27,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17572/203307 [19:55:24<210:35:27,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17573/203307 [19:55:28<210:35:22,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17573/203307 [19:55:28<210:35:22,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17574/203307 [19:55:33<210:35:24,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17574/203307 [19:55:33<210:35:24,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17575/203307 [19:55:37<210:35:20,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17575/203307 [19:55:37<210:35:21,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17576/203307 [19:55:41<210:35:19,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17576/203307 [19:55:41<210:35:19,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17577/203307 [19:55:45<210:35:11,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17577/203307 [19:55:45<210:35:11,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17578/203307 [19:55:50<210:35:10,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17578/203307 [19:55:50<210:35:10,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17579/203307 [19:55:53<210:35:02,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17579/203307 [19:55:53<210:35:02,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17580/203307 [19:55:57<210:34:54,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17580/203307 [19:55:57<210:34:54,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17581/203307 [19:56:01<210:34:52,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▊         | 17581/203307 [19:56:01<210:34:52,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17582/203307 [19:56:06<210:34:51,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17582/203307 [19:56:06<210:34:51,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17583/203307 [19:56:10<210:34:49,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17583/203307 [19:56:10<210:34:49,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17584/203307 [19:56:14<210:34:48,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17584/203307 [19:56:14<210:34:48,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17585/203307 [19:56:18<210:34:40,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17585/203307 [19:56:18<210:34:40,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17586/203307 [19:56:22<210:34:39,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17586/203307 [19:56:22<210:34:39,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17587/203307 [19:56:26<210:34:31,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17587/203307 [19:56:26<210:34:31,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17588/203307 [19:56:30<210:34:23,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17588/203307 [19:56:30<210:34:23,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17589/203307 [19:56:34<210:34:15,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17589/203307 [19:56:34<210:34:16,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17590/203307 [19:56:38<210:34:14,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17590/203307 [19:56:38<210:34:14,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17591/203307 [19:56:42<210:34:15,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17591/203307 [19:56:42<210:34:15,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17592/203307 [19:56:47<210:34:13,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17592/203307 [19:56:47<210:34:13,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17593/203307 [19:56:51<210:34:11,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17593/203307 [19:56:51<210:34:11,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17594/203307 [19:56:55<210:34:10,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17594/203307 [19:56:55<210:34:10,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17595/203307 [19:56:59<210:34:02,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17595/203307 [19:56:59<210:34:02,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17596/203307 [19:57:03<210:33:55,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17596/203307 [19:57:03<210:33:55,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17597/203307 [19:57:07<210:33:48,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17597/203307 [19:57:07<210:33:48,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17598/203307 [19:57:11<210:33:41,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17598/203307 [19:57:11<210:33:41,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17599/203307 [19:57:15<210:33:39,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17599/203307 [19:57:15<210:33:39,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17600/203307 [19:57:19<210:33:38,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17600/203307 [19:57:19<210:33:38,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17601/203307 [19:57:23<210:33:36,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17601/203307 [19:57:23<210:33:36,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17602/203307 [19:57:27<210:33:27,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17602/203307 [19:57:27<210:33:27,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17603/203307 [19:57:31<210:33:26,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17603/203307 [19:57:31<210:33:27,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17604/203307 [19:57:35<210:33:18,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17604/203307 [19:57:35<210:33:18,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17605/203307 [19:57:39<210:33:11,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17605/203307 [19:57:39<210:33:11,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17606/203307 [19:57:43<210:33:03,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17606/203307 [19:57:43<210:33:03,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17607/203307 [19:57:46<210:32:56,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17607/203307 [19:57:46<210:32:56,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17608/203307 [19:57:51<210:32:56,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17608/203307 [19:57:51<210:32:56,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17609/203307 [19:57:55<210:32:54,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17609/203307 [19:57:55<210:32:54,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17610/203307 [19:57:59<210:32:46,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17610/203307 [19:57:59<210:32:46,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17611/203307 [19:58:03<210:32:45,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17611/203307 [19:58:03<210:32:45,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17612/203307 [19:58:07<210:32:38,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17612/203307 [19:58:07<210:32:38,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17613/203307 [19:58:11<210:32:30,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17613/203307 [19:58:11<210:32:30,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17614/203307 [19:58:15<210:32:22,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17614/203307 [19:58:15<210:32:22,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17615/203307 [19:58:18<210:32:16,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17615/203307 [19:58:18<210:32:16,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17616/203307 [19:58:22<210:32:09,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17616/203307 [19:58:22<210:32:09,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17617/203307 [19:58:27<210:32:09,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17617/203307 [19:58:27<210:32:09,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17618/203307 [19:58:31<210:32:07,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17618/203307 [19:58:31<210:32:07,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17619/203307 [19:58:35<210:32:06,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17619/203307 [19:58:35<210:32:06,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17620/203307 [19:58:39<210:31:59,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17620/203307 [19:58:39<210:31:59,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17621/203307 [19:58:43<210:31:51,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:   9%|▊         | 17621/203307 [19:58:43<210:31:51,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17622/203307 [19:58:47<210:31:43,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17622/203307 [19:58:47<210:31:43,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17623/203307 [19:58:50<210:31:35,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17623/203307 [19:58:50<210:31:35,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17624/203307 [19:58:54<210:31:27,  0.25it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17624/203307 [19:58:54<210:31:27,  0.25it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17625/203307 [19:58:58<210:31:26,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17625/203307 [19:58:58<210:31:26,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17626/203307 [19:59:03<210:31:25,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17626/203307 [19:59:03<210:31:25,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17627/203307 [19:59:07<210:31:18,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17627/203307 [19:59:07<210:31:18,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17628/203307 [19:59:11<210:31:17,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17628/203307 [19:59:11<210:31:18,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17629/203307 [19:59:15<210:31:12,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17629/203307 [19:59:15<210:31:12,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17630/203307 [19:59:19<210:31:07,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17630/203307 [19:59:19<210:31:07,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17631/203307 [19:59:23<210:30:59,  0.25it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17631/203307 [19:59:23<210:30:59,  0.25it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17632/203307 [19:59:26<210:30:52,  0.25it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17632/203307 [19:59:26<210:30:52,  0.25it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17633/203307 [19:59:31<210:30:50,  0.25it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17633/203307 [19:59:31<210:30:50,  0.25it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17634/203307 [19:59:35<210:30:51,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17634/203307 [19:59:35<210:30:51,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17635/203307 [19:59:40<210:30:49,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17635/203307 [19:59:40<210:30:49,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17636/203307 [19:59:44<210:30:48,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17636/203307 [19:59:44<210:30:49,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17637/203307 [19:59:48<210:30:41,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17637/203307 [19:59:48<210:30:41,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17638/203307 [19:59:51<210:30:33,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17638/203307 [19:59:51<210:30:33,  0.24it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17639/203307 [19:59:55<210:30:26,  0.25it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17639/203307 [19:59:55<210:30:26,  0.25it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17640/203307 [19:59:59<210:30:19,  0.25it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17640/203307 [19:59:59<210:30:19,  0.25it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17641/203307 [20:00:03<210:30:11,  0.25it/s, v_num=t5e6, training/loss=0.0973]Epoch 0:   9%|▊         | 17641/203307 [20:00:03<210:30:11,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17642/203307 [20:00:07<210:30:09,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17642/203307 [20:00:07<210:30:09,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17643/203307 [20:00:11<210:30:08,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17643/203307 [20:00:11<210:30:08,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17644/203307 [20:00:16<210:30:07,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17644/203307 [20:00:16<210:30:07,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17645/203307 [20:00:20<210:30:00,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17645/203307 [20:00:20<210:30:00,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17646/203307 [20:00:23<210:29:51,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17646/203307 [20:00:23<210:29:51,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17647/203307 [20:00:27<210:29:44,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17647/203307 [20:00:27<210:29:44,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17648/203307 [20:00:31<210:29:37,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17648/203307 [20:00:31<210:29:37,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17649/203307 [20:00:35<210:29:29,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17649/203307 [20:00:35<210:29:29,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17650/203307 [20:00:39<210:29:28,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17650/203307 [20:00:39<210:29:28,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17651/203307 [20:00:43<210:29:27,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17651/203307 [20:00:43<210:29:27,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17652/203307 [20:00:48<210:29:27,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17652/203307 [20:00:48<210:29:27,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17653/203307 [20:00:52<210:29:27,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17653/203307 [20:00:52<210:29:27,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17654/203307 [20:00:56<210:29:19,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17654/203307 [20:00:56<210:29:19,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17655/203307 [20:01:00<210:29:11,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17655/203307 [20:01:00<210:29:11,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17656/203307 [20:01:03<210:29:03,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17656/203307 [20:01:03<210:29:03,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17657/203307 [20:01:07<210:28:56,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17657/203307 [20:01:07<210:28:56,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17658/203307 [20:01:11<210:28:54,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17658/203307 [20:01:11<210:28:54,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17659/203307 [20:01:16<210:28:53,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17659/203307 [20:01:16<210:28:53,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17660/203307 [20:01:20<210:28:52,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17660/203307 [20:01:20<210:28:53,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17661/203307 [20:01:25<210:28:53,  0.25it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:   9%|▊         | 17661/203307 [20:01:25<210:28:53,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17662/203307 [20:01:29<210:28:51,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17662/203307 [20:01:29<210:28:51,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17663/203307 [20:01:33<210:28:43,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17663/203307 [20:01:33<210:28:43,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17664/203307 [20:01:37<210:28:38,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17664/203307 [20:01:37<210:28:38,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17665/203307 [20:01:40<210:28:30,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17665/203307 [20:01:40<210:28:30,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17666/203307 [20:01:44<210:28:23,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17666/203307 [20:01:44<210:28:23,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17667/203307 [20:01:49<210:28:21,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17667/203307 [20:01:49<210:28:21,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17668/203307 [20:01:53<210:28:21,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17668/203307 [20:01:53<210:28:21,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17669/203307 [20:01:57<210:28:20,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17669/203307 [20:01:57<210:28:20,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17670/203307 [20:02:01<210:28:13,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17670/203307 [20:02:01<210:28:13,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17671/203307 [20:02:05<210:28:10,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17671/203307 [20:02:05<210:28:10,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17672/203307 [20:02:09<210:28:02,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17672/203307 [20:02:09<210:28:02,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17673/203307 [20:02:13<210:27:54,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17673/203307 [20:02:13<210:27:54,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17674/203307 [20:02:16<210:27:46,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17674/203307 [20:02:16<210:27:46,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17675/203307 [20:02:21<210:27:46,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17675/203307 [20:02:21<210:27:46,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17676/203307 [20:02:25<210:27:44,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17676/203307 [20:02:25<210:27:44,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17677/203307 [20:02:29<210:27:38,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17677/203307 [20:02:29<210:27:38,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17678/203307 [20:02:34<210:27:38,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17678/203307 [20:02:34<210:27:38,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17679/203307 [20:02:37<210:27:31,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17679/203307 [20:02:37<210:27:31,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17680/203307 [20:02:42<210:27:29,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17680/203307 [20:02:42<210:27:29,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17681/203307 [20:02:45<210:27:22,  0.25it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▊         | 17681/203307 [20:02:45<210:27:22,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17682/203307 [20:02:49<210:27:14,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17682/203307 [20:02:49<210:27:14,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17683/203307 [20:02:54<210:27:13,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17683/203307 [20:02:54<210:27:13,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17684/203307 [20:02:58<210:27:12,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17684/203307 [20:02:58<210:27:12,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17685/203307 [20:03:02<210:27:05,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17685/203307 [20:03:02<210:27:05,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17686/203307 [20:03:06<210:27:05,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17686/203307 [20:03:06<210:27:05,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17687/203307 [20:03:10<210:26:58,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17687/203307 [20:03:10<210:26:58,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17688/203307 [20:03:14<210:26:50,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17688/203307 [20:03:14<210:26:50,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17689/203307 [20:03:18<210:26:48,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17689/203307 [20:03:18<210:26:48,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17690/203307 [20:03:22<210:26:41,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17690/203307 [20:03:22<210:26:41,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17691/203307 [20:03:26<210:26:33,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17691/203307 [20:03:26<210:26:33,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17692/203307 [20:03:30<210:26:32,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17692/203307 [20:03:30<210:26:32,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17693/203307 [20:03:34<210:26:32,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17693/203307 [20:03:34<210:26:32,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17694/203307 [20:03:39<210:26:32,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17694/203307 [20:03:39<210:26:32,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17695/203307 [20:03:43<210:26:31,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17695/203307 [20:03:43<210:26:31,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17696/203307 [20:03:47<210:26:23,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17696/203307 [20:03:47<210:26:23,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17697/203307 [20:03:51<210:26:16,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17697/203307 [20:03:51<210:26:16,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17698/203307 [20:03:55<210:26:14,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17698/203307 [20:03:55<210:26:14,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17699/203307 [20:03:59<210:26:06,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17699/203307 [20:03:59<210:26:06,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17700/203307 [20:04:03<210:26:04,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17700/203307 [20:04:03<210:26:04,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17701/203307 [20:04:07<210:26:02,  0.25it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:   9%|▊         | 17701/203307 [20:04:07<210:26:02,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17702/203307 [20:04:11<210:25:55,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17702/203307 [20:04:11<210:25:55,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17703/203307 [20:04:15<210:25:54,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17703/203307 [20:04:15<210:25:54,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17704/203307 [20:04:20<210:25:55,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17704/203307 [20:04:20<210:25:55,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17705/203307 [20:04:24<210:25:47,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17705/203307 [20:04:24<210:25:47,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17706/203307 [20:04:27<210:25:38,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17706/203307 [20:04:27<210:25:38,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17707/203307 [20:04:32<210:25:36,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17707/203307 [20:04:32<210:25:36,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17708/203307 [20:04:36<210:25:33,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17708/203307 [20:04:36<210:25:33,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17709/203307 [20:04:40<210:25:32,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17709/203307 [20:04:40<210:25:33,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17710/203307 [20:04:44<210:25:25,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17710/203307 [20:04:44<210:25:25,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17711/203307 [20:04:48<210:25:23,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17711/203307 [20:04:48<210:25:23,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17712/203307 [20:04:53<210:25:22,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17712/203307 [20:04:53<210:25:22,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17713/203307 [20:04:56<210:25:15,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17713/203307 [20:04:56<210:25:15,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17714/203307 [20:05:00<210:25:07,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17714/203307 [20:05:00<210:25:07,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17715/203307 [20:05:04<210:24:58,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17715/203307 [20:05:04<210:24:58,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17716/203307 [20:05:08<210:24:56,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17716/203307 [20:05:08<210:24:56,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17717/203307 [20:05:12<210:24:55,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17717/203307 [20:05:12<210:24:55,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17718/203307 [20:05:17<210:24:53,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17718/203307 [20:05:17<210:24:53,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17719/203307 [20:05:21<210:24:52,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17719/203307 [20:05:21<210:24:52,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17720/203307 [20:05:25<210:24:45,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17720/203307 [20:05:25<210:24:45,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17721/203307 [20:05:29<210:24:45,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▊         | 17721/203307 [20:05:29<210:24:45,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17722/203307 [20:05:33<210:24:38,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17722/203307 [20:05:33<210:24:38,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17723/203307 [20:05:37<210:24:30,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17723/203307 [20:05:37<210:24:30,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17724/203307 [20:05:41<210:24:22,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17724/203307 [20:05:41<210:24:22,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17725/203307 [20:05:45<210:24:20,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17725/203307 [20:05:45<210:24:20,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17726/203307 [20:05:49<210:24:19,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17726/203307 [20:05:49<210:24:19,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17727/203307 [20:05:53<210:24:11,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17727/203307 [20:05:53<210:24:11,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17728/203307 [20:05:57<210:24:11,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17728/203307 [20:05:57<210:24:11,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17729/203307 [20:06:01<210:24:03,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17729/203307 [20:06:01<210:24:03,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17730/203307 [20:06:06<210:24:03,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17730/203307 [20:06:06<210:24:03,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17731/203307 [20:06:09<210:23:55,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17731/203307 [20:06:09<210:23:55,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17732/203307 [20:06:13<210:23:48,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17732/203307 [20:06:13<210:23:48,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17733/203307 [20:06:17<210:23:46,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17733/203307 [20:06:17<210:23:46,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17734/203307 [20:06:22<210:23:46,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17734/203307 [20:06:22<210:23:46,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17735/203307 [20:06:26<210:23:38,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17735/203307 [20:06:26<210:23:38,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17736/203307 [20:06:30<210:23:37,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17736/203307 [20:06:30<210:23:37,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17737/203307 [20:06:34<210:23:29,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17737/203307 [20:06:34<210:23:29,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17738/203307 [20:06:38<210:23:28,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17738/203307 [20:06:38<210:23:28,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17739/203307 [20:06:42<210:23:21,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17739/203307 [20:06:42<210:23:21,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17740/203307 [20:06:46<210:23:13,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17740/203307 [20:06:46<210:23:13,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17741/203307 [20:06:49<210:23:06,  0.25it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:   9%|▊         | 17741/203307 [20:06:49<210:23:06,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17742/203307 [20:06:54<210:23:05,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17742/203307 [20:06:54<210:23:05,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17743/203307 [20:06:58<210:23:04,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17743/203307 [20:06:58<210:23:04,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17744/203307 [20:07:02<210:23:04,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17744/203307 [20:07:02<210:23:04,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17745/203307 [20:07:06<210:22:56,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17745/203307 [20:07:06<210:22:56,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17746/203307 [20:07:10<210:22:47,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17746/203307 [20:07:10<210:22:47,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17747/203307 [20:07:14<210:22:47,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17747/203307 [20:07:14<210:22:47,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17748/203307 [20:07:18<210:22:40,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17748/203307 [20:07:18<210:22:40,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17749/203307 [20:07:22<210:22:32,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17749/203307 [20:07:22<210:22:32,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17750/203307 [20:07:26<210:22:30,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17750/203307 [20:07:26<210:22:30,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17751/203307 [20:07:31<210:22:30,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17751/203307 [20:07:31<210:22:30,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17752/203307 [20:07:35<210:22:27,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17752/203307 [20:07:35<210:22:27,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17753/203307 [20:07:39<210:22:27,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17753/203307 [20:07:39<210:22:27,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17754/203307 [20:07:43<210:22:18,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17754/203307 [20:07:43<210:22:18,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17755/203307 [20:07:47<210:22:11,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17755/203307 [20:07:47<210:22:11,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17756/203307 [20:07:51<210:22:10,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17756/203307 [20:07:51<210:22:10,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17757/203307 [20:07:55<210:22:02,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17757/203307 [20:07:55<210:22:02,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17758/203307 [20:07:59<210:21:59,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17758/203307 [20:07:59<210:21:59,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17759/203307 [20:08:03<210:21:58,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17759/203307 [20:08:03<210:21:58,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17760/203307 [20:08:07<210:21:51,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17760/203307 [20:08:07<210:21:51,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17761/203307 [20:08:12<210:21:51,  0.25it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▊         | 17761/203307 [20:08:12<210:21:51,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17762/203307 [20:08:15<210:21:44,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17762/203307 [20:08:15<210:21:44,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17763/203307 [20:08:19<210:21:36,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17763/203307 [20:08:19<210:21:36,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17764/203307 [20:08:24<210:21:36,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17764/203307 [20:08:24<210:21:36,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17765/203307 [20:08:27<210:21:29,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17765/203307 [20:08:27<210:21:29,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17766/203307 [20:08:31<210:21:22,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17766/203307 [20:08:31<210:21:22,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17767/203307 [20:08:35<210:21:20,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17767/203307 [20:08:35<210:21:20,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17768/203307 [20:08:40<210:21:18,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17768/203307 [20:08:40<210:21:18,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17769/203307 [20:08:44<210:21:18,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17769/203307 [20:08:44<210:21:18,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17770/203307 [20:08:48<210:21:15,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17770/203307 [20:08:48<210:21:15,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17771/203307 [20:08:52<210:21:07,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17771/203307 [20:08:52<210:21:07,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17772/203307 [20:08:56<210:20:59,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17772/203307 [20:08:56<210:20:59,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17773/203307 [20:09:00<210:21:01,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17773/203307 [20:09:00<210:21:01,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17774/203307 [20:09:04<210:20:56,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17774/203307 [20:09:04<210:20:56,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17775/203307 [20:09:09<210:20:54,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17775/203307 [20:09:09<210:20:54,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17776/203307 [20:09:13<210:20:53,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17776/203307 [20:09:13<210:20:53,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17777/203307 [20:09:17<210:20:46,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17777/203307 [20:09:17<210:20:46,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17778/203307 [20:09:22<210:20:48,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17778/203307 [20:09:22<210:20:48,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17779/203307 [20:09:26<210:20:45,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17779/203307 [20:09:26<210:20:45,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17780/203307 [20:09:30<210:20:38,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17780/203307 [20:09:30<210:20:38,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17781/203307 [20:09:33<210:20:30,  0.25it/s, v_num=t5e6, training/loss=0.0882]Epoch 0:   9%|▊         | 17781/203307 [20:09:33<210:20:31,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▊         | 17782/203307 [20:09:38<210:20:31,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▊         | 17782/203307 [20:09:38<210:20:31,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▊         | 17783/203307 [20:09:42<210:20:29,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▊         | 17783/203307 [20:09:42<210:20:29,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▊         | 17784/203307 [20:09:46<210:20:28,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▊         | 17784/203307 [20:09:46<210:20:28,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▊         | 17785/203307 [20:09:50<210:20:21,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▊         | 17785/203307 [20:09:50<210:20:21,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▊         | 17786/203307 [20:09:55<210:20:20,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▊         | 17786/203307 [20:09:55<210:20:20,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▊         | 17787/203307 [20:09:58<210:20:13,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▊         | 17787/203307 [20:09:58<210:20:13,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▊         | 17788/203307 [20:10:03<210:20:10,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▊         | 17788/203307 [20:10:03<210:20:10,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▊         | 17789/203307 [20:10:06<210:20:02,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▊         | 17789/203307 [20:10:06<210:20:02,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 17790/203307 [20:10:11<210:20:01,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 17790/203307 [20:10:11<210:20:01,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 17791/203307 [20:10:15<210:19:54,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 17791/203307 [20:10:15<210:19:54,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 17792/203307 [20:10:19<210:19:52,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 17792/203307 [20:10:19<210:19:52,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 17793/203307 [20:10:23<210:19:51,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 17793/203307 [20:10:23<210:19:51,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 17794/203307 [20:10:28<210:19:50,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 17794/203307 [20:10:28<210:19:50,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 17795/203307 [20:10:31<210:19:43,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 17795/203307 [20:10:31<210:19:43,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 17796/203307 [20:10:35<210:19:35,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 17796/203307 [20:10:35<210:19:35,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 17797/203307 [20:10:39<210:19:31,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 17797/203307 [20:10:39<210:19:31,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 17798/203307 [20:10:43<210:19:24,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 17798/203307 [20:10:43<210:19:24,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 17799/203307 [20:10:47<210:19:24,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 17799/203307 [20:10:47<210:19:24,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 17800/203307 [20:10:52<210:19:20,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 17800/203307 [20:10:52<210:19:20,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 17801/203307 [20:10:56<210:19:18,  0.25it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 17801/203307 [20:10:56<210:19:18,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17802/203307 [20:11:00<210:19:10,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17802/203307 [20:11:00<210:19:10,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17803/203307 [20:11:04<210:19:09,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17803/203307 [20:11:04<210:19:09,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17804/203307 [20:11:08<210:19:01,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17804/203307 [20:11:08<210:19:01,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17805/203307 [20:11:11<210:18:53,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17805/203307 [20:11:11<210:18:53,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17806/203307 [20:11:16<210:18:51,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17806/203307 [20:11:16<210:18:51,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17807/203307 [20:11:19<210:18:42,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17807/203307 [20:11:19<210:18:42,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17808/203307 [20:11:24<210:18:43,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17808/203307 [20:11:24<210:18:43,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17809/203307 [20:11:28<210:18:41,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17809/203307 [20:11:28<210:18:41,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17810/203307 [20:11:32<210:18:34,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17810/203307 [20:11:32<210:18:34,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17811/203307 [20:11:36<210:18:33,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17811/203307 [20:11:36<210:18:33,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17812/203307 [20:11:40<210:18:27,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17812/203307 [20:11:40<210:18:27,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17813/203307 [20:11:44<210:18:18,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17813/203307 [20:11:44<210:18:18,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17814/203307 [20:11:47<210:18:10,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17814/203307 [20:11:47<210:18:10,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17815/203307 [20:11:52<210:18:08,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17815/203307 [20:11:52<210:18:08,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17816/203307 [20:11:56<210:18:07,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17816/203307 [20:11:56<210:18:07,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17817/203307 [20:12:00<210:18:05,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17817/203307 [20:12:00<210:18:05,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17818/203307 [20:12:05<210:18:03,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17818/203307 [20:12:05<210:18:03,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17819/203307 [20:12:09<210:18:02,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17819/203307 [20:12:09<210:18:02,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17820/203307 [20:12:13<210:17:54,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17820/203307 [20:12:13<210:17:54,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17821/203307 [20:12:16<210:17:46,  0.25it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:   9%|▉         | 17821/203307 [20:12:16<210:17:46,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17822/203307 [20:12:20<210:17:42,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17822/203307 [20:12:20<210:17:42,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17823/203307 [20:12:25<210:17:37,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17823/203307 [20:12:25<210:17:37,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17824/203307 [20:12:29<210:17:35,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17824/203307 [20:12:29<210:17:35,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17825/203307 [20:12:33<210:17:34,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17825/203307 [20:12:33<210:17:34,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17826/203307 [20:12:38<210:17:36,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17826/203307 [20:12:38<210:17:36,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17827/203307 [20:12:42<210:17:31,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17827/203307 [20:12:42<210:17:31,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17828/203307 [20:12:46<210:17:30,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17828/203307 [20:12:46<210:17:31,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17829/203307 [20:12:50<210:17:22,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17829/203307 [20:12:50<210:17:22,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17830/203307 [20:12:54<210:17:18,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17830/203307 [20:12:54<210:17:18,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17831/203307 [20:12:58<210:17:13,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17831/203307 [20:12:58<210:17:13,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17832/203307 [20:13:02<210:17:05,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17832/203307 [20:13:02<210:17:05,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17833/203307 [20:13:06<210:17:04,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17833/203307 [20:13:06<210:17:04,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17834/203307 [20:13:11<210:17:05,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17834/203307 [20:13:11<210:17:05,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17835/203307 [20:13:15<210:17:00,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17835/203307 [20:13:15<210:17:00,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17836/203307 [20:13:19<210:16:59,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17836/203307 [20:13:19<210:16:59,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17837/203307 [20:13:23<210:16:52,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17837/203307 [20:13:23<210:16:52,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17838/203307 [20:13:27<210:16:48,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17838/203307 [20:13:27<210:16:48,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17839/203307 [20:13:31<210:16:42,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17839/203307 [20:13:31<210:16:42,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17840/203307 [20:13:35<210:16:35,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17840/203307 [20:13:35<210:16:35,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17841/203307 [20:13:38<210:16:28,  0.25it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:   9%|▉         | 17841/203307 [20:13:38<210:16:28,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17842/203307 [20:13:43<210:16:28,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17842/203307 [20:13:43<210:16:28,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17843/203307 [20:13:47<210:16:26,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17843/203307 [20:13:47<210:16:26,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17844/203307 [20:13:52<210:16:26,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17844/203307 [20:13:52<210:16:26,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17845/203307 [20:13:55<210:16:18,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17845/203307 [20:13:55<210:16:18,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17846/203307 [20:13:59<210:16:14,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17846/203307 [20:13:59<210:16:14,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17847/203307 [20:14:03<210:16:06,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17847/203307 [20:14:03<210:16:06,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17848/203307 [20:14:07<210:16:00,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17848/203307 [20:14:07<210:16:00,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17849/203307 [20:14:11<210:15:52,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17849/203307 [20:14:11<210:15:53,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17850/203307 [20:14:15<210:15:52,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17850/203307 [20:14:15<210:15:52,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17851/203307 [20:14:20<210:15:55,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17851/203307 [20:14:20<210:15:55,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17852/203307 [20:14:24<210:15:48,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17852/203307 [20:14:24<210:15:48,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17853/203307 [20:14:28<210:15:48,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17853/203307 [20:14:28<210:15:48,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17854/203307 [20:14:32<210:15:43,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17854/203307 [20:14:32<210:15:43,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17855/203307 [20:14:36<210:15:36,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17855/203307 [20:14:36<210:15:36,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17856/203307 [20:14:40<210:15:28,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17856/203307 [20:14:40<210:15:28,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17857/203307 [20:14:44<210:15:21,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17857/203307 [20:14:44<210:15:21,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17858/203307 [20:14:48<210:15:19,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17858/203307 [20:14:48<210:15:19,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17859/203307 [20:14:52<210:15:18,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17859/203307 [20:14:52<210:15:18,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17860/203307 [20:14:57<210:15:19,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17860/203307 [20:14:57<210:15:19,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17861/203307 [20:15:01<210:15:18,  0.25it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 17861/203307 [20:15:01<210:15:18,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17862/203307 [20:15:05<210:15:14,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17862/203307 [20:15:05<210:15:14,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17863/203307 [20:15:09<210:15:07,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17863/203307 [20:15:09<210:15:07,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17864/203307 [20:15:13<210:15:00,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17864/203307 [20:15:13<210:15:00,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17865/203307 [20:15:17<210:14:52,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17865/203307 [20:15:17<210:14:52,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17866/203307 [20:15:20<210:14:46,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17866/203307 [20:15:20<210:14:46,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17867/203307 [20:15:25<210:14:45,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17867/203307 [20:15:25<210:14:45,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17868/203307 [20:15:29<210:14:45,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17868/203307 [20:15:29<210:14:45,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17869/203307 [20:15:34<210:14:45,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17869/203307 [20:15:34<210:14:45,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17870/203307 [20:15:38<210:14:40,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17870/203307 [20:15:38<210:14:40,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17871/203307 [20:15:42<210:14:33,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17871/203307 [20:15:42<210:14:33,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17872/203307 [20:15:45<210:14:26,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17872/203307 [20:15:45<210:14:26,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17873/203307 [20:15:49<210:14:19,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17873/203307 [20:15:49<210:14:19,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17874/203307 [20:15:53<210:14:14,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17874/203307 [20:15:53<210:14:14,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17875/203307 [20:15:57<210:14:12,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17875/203307 [20:15:57<210:14:12,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17876/203307 [20:16:02<210:14:10,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17876/203307 [20:16:02<210:14:10,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17877/203307 [20:16:06<210:14:11,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17877/203307 [20:16:06<210:14:11,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17878/203307 [20:16:11<210:14:13,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17878/203307 [20:16:11<210:14:13,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17879/203307 [20:16:15<210:14:05,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17879/203307 [20:16:15<210:14:05,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17880/203307 [20:16:18<210:13:57,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17880/203307 [20:16:18<210:13:57,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17881/203307 [20:16:22<210:13:49,  0.25it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:   9%|▉         | 17881/203307 [20:16:22<210:13:49,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17882/203307 [20:16:26<210:13:44,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17882/203307 [20:16:26<210:13:44,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17883/203307 [20:16:30<210:13:42,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17883/203307 [20:16:30<210:13:42,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17884/203307 [20:16:35<210:13:41,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17884/203307 [20:16:35<210:13:41,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17885/203307 [20:16:38<210:13:34,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17885/203307 [20:16:39<210:13:34,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17886/203307 [20:16:43<210:13:37,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17886/203307 [20:16:43<210:13:37,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17887/203307 [20:16:48<210:13:35,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17887/203307 [20:16:48<210:13:35,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17888/203307 [20:16:51<210:13:28,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17888/203307 [20:16:51<210:13:28,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17889/203307 [20:16:55<210:13:20,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17889/203307 [20:16:55<210:13:20,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17890/203307 [20:16:59<210:13:16,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17890/203307 [20:16:59<210:13:16,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17891/203307 [20:17:03<210:13:09,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17891/203307 [20:17:03<210:13:09,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17892/203307 [20:17:07<210:13:09,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17892/203307 [20:17:07<210:13:09,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17893/203307 [20:17:12<210:13:07,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17893/203307 [20:17:12<210:13:08,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17894/203307 [20:17:16<210:13:10,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17894/203307 [20:17:16<210:13:10,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17895/203307 [20:17:20<210:13:03,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17895/203307 [20:17:20<210:13:03,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17896/203307 [20:17:25<210:13:02,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17896/203307 [20:17:25<210:13:02,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17897/203307 [20:17:28<210:12:53,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17897/203307 [20:17:28<210:12:54,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17898/203307 [20:17:32<210:12:49,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17898/203307 [20:17:32<210:12:50,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17899/203307 [20:17:36<210:12:43,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17899/203307 [20:17:36<210:12:43,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17900/203307 [20:17:40<210:12:40,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17900/203307 [20:17:40<210:12:40,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17901/203307 [20:17:45<210:12:39,  0.25it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 17901/203307 [20:17:45<210:12:39,  0.25it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17902/203307 [20:17:49<210:12:35,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17902/203307 [20:17:49<210:12:35,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17903/203307 [20:17:53<210:12:35,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17903/203307 [20:17:53<210:12:35,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17904/203307 [20:17:57<210:12:28,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17904/203307 [20:17:57<210:12:28,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17905/203307 [20:18:02<210:12:26,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17905/203307 [20:18:02<210:12:26,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17906/203307 [20:18:06<210:12:22,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17906/203307 [20:18:06<210:12:22,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17907/203307 [20:18:09<210:12:14,  0.25it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17907/203307 [20:18:09<210:12:14,  0.25it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17908/203307 [20:18:14<210:12:12,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17908/203307 [20:18:14<210:12:12,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17909/203307 [20:18:18<210:12:11,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17909/203307 [20:18:18<210:12:11,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17910/203307 [20:18:22<210:12:07,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17910/203307 [20:18:22<210:12:07,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17911/203307 [20:18:26<210:12:07,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17911/203307 [20:18:26<210:12:07,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17912/203307 [20:18:31<210:12:07,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17912/203307 [20:18:31<210:12:07,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17913/203307 [20:18:35<210:12:02,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17913/203307 [20:18:35<210:12:02,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17914/203307 [20:18:39<210:12:01,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17914/203307 [20:18:39<210:12:01,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17915/203307 [20:18:43<210:11:54,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17915/203307 [20:18:43<210:11:54,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17916/203307 [20:18:47<210:11:45,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17916/203307 [20:18:47<210:11:45,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17917/203307 [20:18:51<210:11:44,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17917/203307 [20:18:51<210:11:44,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17918/203307 [20:18:56<210:11:46,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17918/203307 [20:18:56<210:11:46,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17919/203307 [20:19:00<210:11:44,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17919/203307 [20:19:00<210:11:44,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17920/203307 [20:19:04<210:11:43,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17920/203307 [20:19:04<210:11:43,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17921/203307 [20:19:08<210:11:35,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 17921/203307 [20:19:08<210:11:35,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17922/203307 [20:19:12<210:11:31,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17922/203307 [20:19:12<210:11:31,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17923/203307 [20:19:17<210:11:30,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17923/203307 [20:19:17<210:11:31,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17924/203307 [20:19:21<210:11:26,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17924/203307 [20:19:21<210:11:26,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17925/203307 [20:19:25<210:11:24,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17925/203307 [20:19:25<210:11:24,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17926/203307 [20:19:30<210:11:27,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17926/203307 [20:19:30<210:11:27,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17927/203307 [20:19:34<210:11:21,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17927/203307 [20:19:34<210:11:21,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17928/203307 [20:19:38<210:11:21,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17928/203307 [20:19:38<210:11:21,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17929/203307 [20:19:43<210:11:21,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17929/203307 [20:19:43<210:11:21,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17930/203307 [20:19:47<210:11:16,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17930/203307 [20:19:47<210:11:16,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17931/203307 [20:19:50<210:11:08,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17931/203307 [20:19:50<210:11:08,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17932/203307 [20:19:55<210:11:06,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17932/203307 [20:19:55<210:11:06,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17933/203307 [20:19:59<210:11:04,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17933/203307 [20:19:59<210:11:04,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17934/203307 [20:20:03<210:11:05,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17934/203307 [20:20:03<210:11:05,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17935/203307 [20:20:07<210:10:57,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17935/203307 [20:20:07<210:10:57,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17936/203307 [20:20:12<210:10:58,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17936/203307 [20:20:12<210:10:58,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17937/203307 [20:20:16<210:10:51,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17937/203307 [20:20:16<210:10:51,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17938/203307 [20:20:20<210:10:53,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17938/203307 [20:20:20<210:10:53,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17939/203307 [20:20:24<210:10:46,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17939/203307 [20:20:24<210:10:46,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17940/203307 [20:20:28<210:10:38,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17940/203307 [20:20:28<210:10:38,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17941/203307 [20:20:32<210:10:37,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:   9%|▉         | 17941/203307 [20:20:32<210:10:37,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17942/203307 [20:20:37<210:10:38,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17942/203307 [20:20:37<210:10:38,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17943/203307 [20:20:41<210:10:36,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17943/203307 [20:20:41<210:10:36,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17944/203307 [20:20:45<210:10:36,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17944/203307 [20:20:45<210:10:36,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17945/203307 [20:20:49<210:10:28,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17945/203307 [20:20:49<210:10:28,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17946/203307 [20:20:54<210:10:29,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17946/203307 [20:20:54<210:10:29,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17947/203307 [20:20:58<210:10:22,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17947/203307 [20:20:58<210:10:22,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17948/203307 [20:21:01<210:10:15,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17948/203307 [20:21:01<210:10:15,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17949/203307 [20:21:05<210:10:08,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17949/203307 [20:21:05<210:10:08,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17950/203307 [20:21:09<210:10:07,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17950/203307 [20:21:09<210:10:07,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17951/203307 [20:21:14<210:10:06,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17951/203307 [20:21:14<210:10:06,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17952/203307 [20:21:18<210:09:59,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17952/203307 [20:21:18<210:09:59,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17953/203307 [20:21:22<210:09:59,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17953/203307 [20:21:22<210:09:59,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17954/203307 [20:21:26<210:09:54,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17954/203307 [20:21:26<210:09:54,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17955/203307 [20:21:31<210:09:54,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17955/203307 [20:21:31<210:09:54,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17956/203307 [20:21:34<210:09:47,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17956/203307 [20:21:34<210:09:47,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17957/203307 [20:21:38<210:09:40,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17957/203307 [20:21:38<210:09:40,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17958/203307 [20:21:42<210:09:37,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17958/203307 [20:21:42<210:09:37,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17959/203307 [20:21:47<210:09:36,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17959/203307 [20:21:47<210:09:36,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17960/203307 [20:21:51<210:09:29,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17960/203307 [20:21:51<210:09:29,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17961/203307 [20:21:55<210:09:28,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:   9%|▉         | 17961/203307 [20:21:55<210:09:28,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17962/203307 [20:21:59<210:09:23,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17962/203307 [20:21:59<210:09:23,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17963/203307 [20:22:03<210:09:15,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17963/203307 [20:22:03<210:09:15,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17964/203307 [20:22:07<210:09:15,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17964/203307 [20:22:07<210:09:16,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17965/203307 [20:22:11<210:09:07,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17965/203307 [20:22:11<210:09:07,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17966/203307 [20:22:15<210:09:02,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17966/203307 [20:22:15<210:09:02,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17967/203307 [20:22:19<210:09:01,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17967/203307 [20:22:19<210:09:01,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17968/203307 [20:22:24<210:09:00,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17968/203307 [20:22:24<210:09:00,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17969/203307 [20:22:28<210:09:00,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17969/203307 [20:22:28<210:09:00,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17970/203307 [20:22:32<210:08:54,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17970/203307 [20:22:32<210:08:54,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17971/203307 [20:22:36<210:08:46,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17971/203307 [20:22:36<210:08:46,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17972/203307 [20:22:40<210:08:46,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17972/203307 [20:22:40<210:08:46,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17973/203307 [20:22:44<210:08:38,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17973/203307 [20:22:44<210:08:38,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17974/203307 [20:22:48<210:08:32,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17974/203307 [20:22:48<210:08:32,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17975/203307 [20:22:52<210:08:30,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17975/203307 [20:22:52<210:08:31,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17976/203307 [20:22:56<210:08:28,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17976/203307 [20:22:56<210:08:28,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17977/203307 [20:23:01<210:08:25,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17977/203307 [20:23:01<210:08:25,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17978/203307 [20:23:05<210:08:27,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17978/203307 [20:23:05<210:08:27,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17979/203307 [20:23:09<210:08:19,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17979/203307 [20:23:09<210:08:19,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17980/203307 [20:23:13<210:08:11,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17980/203307 [20:23:13<210:08:11,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17981/203307 [20:23:17<210:08:12,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 17981/203307 [20:23:17<210:08:12,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17982/203307 [20:23:21<210:08:07,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17982/203307 [20:23:21<210:08:07,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17983/203307 [20:23:25<210:08:04,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17983/203307 [20:23:25<210:08:04,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17984/203307 [20:23:30<210:08:03,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17984/203307 [20:23:30<210:08:03,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17985/203307 [20:23:33<210:07:55,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17985/203307 [20:23:33<210:07:56,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17986/203307 [20:23:38<210:07:58,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17986/203307 [20:23:38<210:07:58,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17987/203307 [20:23:42<210:07:51,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17987/203307 [20:23:42<210:07:51,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17988/203307 [20:23:46<210:07:43,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17988/203307 [20:23:46<210:07:44,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17989/203307 [20:23:49<210:07:35,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17989/203307 [20:23:49<210:07:35,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17990/203307 [20:23:54<210:07:39,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17990/203307 [20:23:54<210:07:39,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17991/203307 [20:23:58<210:07:31,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17991/203307 [20:23:58<210:07:31,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17992/203307 [20:24:02<210:07:29,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17992/203307 [20:24:02<210:07:30,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17993/203307 [20:24:07<210:07:28,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17993/203307 [20:24:07<210:07:28,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17994/203307 [20:24:11<210:07:30,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17994/203307 [20:24:11<210:07:30,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17995/203307 [20:24:15<210:07:26,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17995/203307 [20:24:15<210:07:26,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17996/203307 [20:24:19<210:07:19,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17996/203307 [20:24:19<210:07:19,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17997/203307 [20:24:23<210:07:11,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17997/203307 [20:24:23<210:07:11,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17998/203307 [20:24:28<210:07:14,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17998/203307 [20:24:28<210:07:14,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17999/203307 [20:24:31<210:07:07,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 17999/203307 [20:24:31<210:07:07,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 18000/203307 [20:24:36<210:07:04,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 18000/203307 [20:24:36<210:07:04,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 18001/203307 [20:24:40<210:07:02,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:   9%|▉         | 18001/203307 [20:24:40<210:07:02,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18002/203307 [20:24:44<210:06:57,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18002/203307 [20:24:44<210:06:57,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18003/203307 [20:24:48<210:06:57,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18003/203307 [20:24:48<210:06:57,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18004/203307 [20:24:53<210:06:54,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18004/203307 [20:24:53<210:06:54,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18005/203307 [20:24:56<210:06:46,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18005/203307 [20:24:56<210:06:46,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18006/203307 [20:25:00<210:06:42,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18006/203307 [20:25:00<210:06:42,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18007/203307 [20:25:05<210:06:45,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18007/203307 [20:25:05<210:06:45,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18008/203307 [20:25:09<210:06:42,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18008/203307 [20:25:09<210:06:42,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18009/203307 [20:25:14<210:06:41,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18009/203307 [20:25:14<210:06:41,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18010/203307 [20:25:18<210:06:36,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18010/203307 [20:25:18<210:06:36,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18011/203307 [20:25:22<210:06:35,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18011/203307 [20:25:22<210:06:36,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18012/203307 [20:25:26<210:06:28,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18012/203307 [20:25:26<210:06:28,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18013/203307 [20:25:30<210:06:26,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18013/203307 [20:25:30<210:06:26,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18014/203307 [20:25:34<210:06:21,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18014/203307 [20:25:34<210:06:21,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18015/203307 [20:25:38<210:06:14,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18015/203307 [20:25:38<210:06:14,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18016/203307 [20:25:43<210:06:17,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18016/203307 [20:25:43<210:06:17,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18017/203307 [20:25:47<210:06:15,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18017/203307 [20:25:47<210:06:15,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18018/203307 [20:25:52<210:06:16,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18018/203307 [20:25:52<210:06:16,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18019/203307 [20:25:56<210:06:15,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18019/203307 [20:25:56<210:06:15,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18020/203307 [20:26:00<210:06:09,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18020/203307 [20:26:00<210:06:09,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18021/203307 [20:26:03<210:06:00,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:   9%|▉         | 18021/203307 [20:26:03<210:06:00,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18022/203307 [20:26:08<210:05:58,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18022/203307 [20:26:08<210:05:58,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18023/203307 [20:26:11<210:05:50,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18023/203307 [20:26:11<210:05:50,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18024/203307 [20:26:16<210:05:50,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18024/203307 [20:26:16<210:05:50,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18025/203307 [20:26:20<210:05:49,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18025/203307 [20:26:20<210:05:49,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18026/203307 [20:26:25<210:05:49,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18026/203307 [20:26:25<210:05:49,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18027/203307 [20:26:29<210:05:42,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18027/203307 [20:26:29<210:05:42,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18028/203307 [20:26:33<210:05:41,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18028/203307 [20:26:33<210:05:42,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18029/203307 [20:26:37<210:05:34,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18029/203307 [20:26:37<210:05:34,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18030/203307 [20:26:41<210:05:30,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18030/203307 [20:26:41<210:05:30,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18031/203307 [20:26:45<210:05:28,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18031/203307 [20:26:45<210:05:28,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18032/203307 [20:26:49<210:05:20,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18032/203307 [20:26:49<210:05:20,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18033/203307 [20:26:53<210:05:21,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18033/203307 [20:26:53<210:05:21,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18034/203307 [20:26:58<210:05:22,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18034/203307 [20:26:58<210:05:22,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18035/203307 [20:27:02<210:05:14,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18035/203307 [20:27:02<210:05:14,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18036/203307 [20:27:06<210:05:14,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18036/203307 [20:27:06<210:05:14,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18037/203307 [20:27:10<210:05:07,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18037/203307 [20:27:10<210:05:07,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18038/203307 [20:27:14<210:05:01,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18038/203307 [20:27:14<210:05:01,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18039/203307 [20:27:18<210:04:54,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18039/203307 [20:27:18<210:04:54,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18040/203307 [20:27:22<210:04:51,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18040/203307 [20:27:22<210:04:52,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18041/203307 [20:27:26<210:04:44,  0.24it/s, v_num=t5e6, training/loss=0.0897]Epoch 0:   9%|▉         | 18041/203307 [20:27:26<210:04:44,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18042/203307 [20:27:30<210:04:47,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18042/203307 [20:27:30<210:04:47,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18043/203307 [20:27:35<210:04:46,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18043/203307 [20:27:35<210:04:46,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18044/203307 [20:27:39<210:04:45,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18044/203307 [20:27:39<210:04:45,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18045/203307 [20:27:43<210:04:38,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18045/203307 [20:27:43<210:04:38,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18046/203307 [20:27:47<210:04:33,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18046/203307 [20:27:47<210:04:33,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18047/203307 [20:27:51<210:04:26,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18047/203307 [20:27:51<210:04:26,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18048/203307 [20:27:55<210:04:19,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18048/203307 [20:27:55<210:04:19,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18049/203307 [20:27:59<210:04:18,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18049/203307 [20:27:59<210:04:18,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18050/203307 [20:28:04<210:04:20,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18050/203307 [20:28:04<210:04:20,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18051/203307 [20:28:08<210:04:21,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18051/203307 [20:28:08<210:04:21,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18052/203307 [20:28:12<210:04:14,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18052/203307 [20:28:12<210:04:14,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18053/203307 [20:28:16<210:04:14,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18053/203307 [20:28:16<210:04:14,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18054/203307 [20:28:21<210:04:09,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18054/203307 [20:28:21<210:04:09,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18055/203307 [20:28:24<210:04:02,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18055/203307 [20:28:24<210:04:02,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18056/203307 [20:28:28<210:03:55,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18056/203307 [20:28:28<210:03:55,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18057/203307 [20:28:32<210:03:46,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18057/203307 [20:28:32<210:03:46,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18058/203307 [20:28:36<210:03:45,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18058/203307 [20:28:36<210:03:45,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18059/203307 [20:28:41<210:03:46,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18059/203307 [20:28:41<210:03:46,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18060/203307 [20:28:44<210:03:38,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18060/203307 [20:28:44<210:03:38,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18061/203307 [20:28:49<210:03:36,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:   9%|▉         | 18061/203307 [20:28:49<210:03:37,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18062/203307 [20:28:53<210:03:32,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18062/203307 [20:28:53<210:03:32,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18063/203307 [20:28:56<210:03:24,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18063/203307 [20:28:56<210:03:24,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18064/203307 [20:29:00<210:03:16,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18064/203307 [20:29:00<210:03:16,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18065/203307 [20:29:04<210:03:08,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18065/203307 [20:29:04<210:03:08,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18066/203307 [20:29:08<210:03:03,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18066/203307 [20:29:08<210:03:03,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18067/203307 [20:29:12<210:03:01,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18067/203307 [20:29:12<210:03:01,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18068/203307 [20:29:17<210:03:00,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18068/203307 [20:29:17<210:03:01,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18069/203307 [20:29:21<210:03:00,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18069/203307 [20:29:21<210:03:00,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18070/203307 [20:29:25<210:02:55,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18070/203307 [20:29:25<210:02:55,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18071/203307 [20:29:29<210:02:47,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18071/203307 [20:29:29<210:02:47,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18072/203307 [20:29:32<210:02:39,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18072/203307 [20:29:32<210:02:39,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18073/203307 [20:29:36<210:02:32,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18073/203307 [20:29:36<210:02:33,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18074/203307 [20:29:40<210:02:27,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18074/203307 [20:29:40<210:02:27,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18075/203307 [20:29:44<210:02:25,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18075/203307 [20:29:44<210:02:25,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18076/203307 [20:29:49<210:02:24,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18076/203307 [20:29:49<210:02:24,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18077/203307 [20:29:53<210:02:17,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18077/203307 [20:29:53<210:02:17,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18078/203307 [20:29:57<210:02:20,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18078/203307 [20:29:57<210:02:20,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18079/203307 [20:30:01<210:02:13,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18079/203307 [20:30:01<210:02:13,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18080/203307 [20:30:05<210:02:06,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18080/203307 [20:30:05<210:02:06,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18081/203307 [20:30:09<210:01:59,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:   9%|▉         | 18081/203307 [20:30:09<210:01:59,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18082/203307 [20:30:13<210:01:54,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18082/203307 [20:30:13<210:01:54,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18083/203307 [20:30:17<210:01:52,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18083/203307 [20:30:17<210:01:52,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18084/203307 [20:30:22<210:01:52,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18084/203307 [20:30:22<210:01:52,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18085/203307 [20:30:26<210:01:52,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18085/203307 [20:30:26<210:01:52,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18086/203307 [20:30:31<210:01:54,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18086/203307 [20:30:31<210:01:54,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18087/203307 [20:30:34<210:01:45,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18087/203307 [20:30:34<210:01:46,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18088/203307 [20:30:38<210:01:37,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18088/203307 [20:30:38<210:01:37,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18089/203307 [20:30:42<210:01:30,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18089/203307 [20:30:42<210:01:30,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18090/203307 [20:30:46<210:01:26,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18090/203307 [20:30:46<210:01:26,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18091/203307 [20:30:50<210:01:18,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18091/203307 [20:30:50<210:01:18,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18092/203307 [20:30:54<210:01:16,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18092/203307 [20:30:54<210:01:16,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18093/203307 [20:30:58<210:01:15,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18093/203307 [20:30:58<210:01:15,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18094/203307 [20:31:03<210:01:17,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18094/203307 [20:31:03<210:01:17,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18095/203307 [20:31:07<210:01:10,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18095/203307 [20:31:07<210:01:10,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18096/203307 [20:31:10<210:01:03,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18096/203307 [20:31:10<210:01:03,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18097/203307 [20:31:14<210:00:56,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18097/203307 [20:31:14<210:00:56,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18098/203307 [20:31:18<210:00:51,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18098/203307 [20:31:18<210:00:51,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18099/203307 [20:31:22<210:00:44,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18099/203307 [20:31:22<210:00:44,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18100/203307 [20:31:26<210:00:42,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18100/203307 [20:31:26<210:00:42,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18101/203307 [20:31:31<210:00:41,  0.24it/s, v_num=t5e6, training/loss=0.0941]Epoch 0:   9%|▉         | 18101/203307 [20:31:31<210:00:41,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18102/203307 [20:31:35<210:00:43,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18102/203307 [20:31:35<210:00:43,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18103/203307 [20:31:40<210:00:42,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18103/203307 [20:31:40<210:00:42,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18104/203307 [20:31:44<210:00:34,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18104/203307 [20:31:44<210:00:34,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18105/203307 [20:31:47<210:00:26,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18105/203307 [20:31:47<210:00:26,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18106/203307 [20:31:51<210:00:21,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18106/203307 [20:31:51<210:00:21,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18107/203307 [20:31:55<210:00:13,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18107/203307 [20:31:55<210:00:14,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18108/203307 [20:31:59<210:00:10,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18108/203307 [20:31:59<210:00:11,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18109/203307 [20:32:03<210:00:09,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18109/203307 [20:32:03<210:00:09,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18110/203307 [20:32:07<210:00:04,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18110/203307 [20:32:07<210:00:04,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18111/203307 [20:32:12<210:00:03,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18111/203307 [20:32:12<210:00:03,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18112/203307 [20:32:16<210:00:00,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18112/203307 [20:32:16<210:00:00,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18113/203307 [20:32:20<209:59:52,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18113/203307 [20:32:20<209:59:52,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18114/203307 [20:32:24<209:59:47,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18114/203307 [20:32:24<209:59:47,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18115/203307 [20:32:28<209:59:40,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18115/203307 [20:32:28<209:59:40,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18116/203307 [20:32:31<209:59:32,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18116/203307 [20:32:31<209:59:32,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18117/203307 [20:32:36<209:59:32,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18117/203307 [20:32:36<209:59:32,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18118/203307 [20:32:40<209:59:33,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18118/203307 [20:32:40<209:59:33,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18119/203307 [20:32:45<209:59:32,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18119/203307 [20:32:45<209:59:32,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18120/203307 [20:32:49<209:59:32,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18120/203307 [20:32:49<209:59:32,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18121/203307 [20:32:54<209:59:31,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:   9%|▉         | 18121/203307 [20:32:54<209:59:31,  0.24it/s, v_num=t5e6, training/loss=0.084] Epoch 0:   9%|▉         | 18122/203307 [20:32:57<209:59:25,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18122/203307 [20:32:57<209:59:25,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18123/203307 [20:33:01<209:59:18,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18123/203307 [20:33:01<209:59:18,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18124/203307 [20:33:05<209:59:11,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18124/203307 [20:33:05<209:59:11,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18125/203307 [20:33:09<209:59:09,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18125/203307 [20:33:09<209:59:09,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18126/203307 [20:33:14<209:59:10,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18126/203307 [20:33:14<209:59:10,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18127/203307 [20:33:18<209:59:02,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18127/203307 [20:33:18<209:59:02,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18128/203307 [20:33:22<209:59:01,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18128/203307 [20:33:22<209:59:01,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18129/203307 [20:33:26<209:58:54,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18129/203307 [20:33:26<209:58:54,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18130/203307 [20:33:30<209:58:51,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18130/203307 [20:33:30<209:58:51,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18131/203307 [20:33:34<209:58:43,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18131/203307 [20:33:34<209:58:43,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18132/203307 [20:33:37<209:58:36,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18132/203307 [20:33:37<209:58:36,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18133/203307 [20:33:42<209:58:33,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18133/203307 [20:33:42<209:58:33,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18134/203307 [20:33:46<209:58:35,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18134/203307 [20:33:46<209:58:35,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18135/203307 [20:33:50<209:58:28,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18135/203307 [20:33:50<209:58:28,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18136/203307 [20:33:54<209:58:27,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18136/203307 [20:33:55<209:58:27,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18137/203307 [20:33:59<209:58:27,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18137/203307 [20:33:59<209:58:27,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18138/203307 [20:34:03<209:58:21,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18138/203307 [20:34:03<209:58:22,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18139/203307 [20:34:07<209:58:18,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18139/203307 [20:34:07<209:58:18,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18140/203307 [20:34:11<209:58:10,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18140/203307 [20:34:11<209:58:10,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18141/203307 [20:34:15<209:58:02,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:   9%|▉         | 18141/203307 [20:34:15<209:58:02,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18142/203307 [20:34:19<209:58:02,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18142/203307 [20:34:19<209:58:02,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18143/203307 [20:34:23<209:58:02,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18143/203307 [20:34:23<209:58:02,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18144/203307 [20:34:28<209:58:01,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18144/203307 [20:34:28<209:58:01,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18145/203307 [20:34:32<209:57:54,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18145/203307 [20:34:32<209:57:54,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18146/203307 [20:34:36<209:57:57,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18146/203307 [20:34:36<209:57:57,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18147/203307 [20:34:40<209:57:50,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18147/203307 [20:34:40<209:57:50,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18148/203307 [20:34:45<209:57:48,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18148/203307 [20:34:45<209:57:48,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18149/203307 [20:34:48<209:57:41,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18149/203307 [20:34:48<209:57:41,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18150/203307 [20:34:53<209:57:39,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18150/203307 [20:34:53<209:57:39,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18151/203307 [20:34:57<209:57:38,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18151/203307 [20:34:57<209:57:38,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18152/203307 [20:35:01<209:57:31,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18152/203307 [20:35:01<209:57:31,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18153/203307 [20:35:05<209:57:30,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18153/203307 [20:35:05<209:57:30,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18154/203307 [20:35:10<209:57:32,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18154/203307 [20:35:10<209:57:32,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18155/203307 [20:35:14<209:57:25,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18155/203307 [20:35:14<209:57:25,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18156/203307 [20:35:17<209:57:18,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18156/203307 [20:35:17<209:57:18,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18157/203307 [20:35:22<209:57:15,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18157/203307 [20:35:22<209:57:15,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18158/203307 [20:35:26<209:57:13,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18158/203307 [20:35:26<209:57:13,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18159/203307 [20:35:30<209:57:12,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18159/203307 [20:35:30<209:57:12,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18160/203307 [20:35:34<209:57:05,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18160/203307 [20:35:34<209:57:05,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18161/203307 [20:35:38<209:57:04,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:   9%|▉         | 18161/203307 [20:35:38<209:57:04,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18162/203307 [20:35:42<209:57:00,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18162/203307 [20:35:42<209:57:00,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18163/203307 [20:35:47<209:56:59,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18163/203307 [20:35:47<209:56:59,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18164/203307 [20:35:51<209:56:51,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18164/203307 [20:35:51<209:56:52,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18165/203307 [20:35:54<209:56:43,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18165/203307 [20:35:54<209:56:44,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18166/203307 [20:35:59<209:56:40,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18166/203307 [20:35:59<209:56:41,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18167/203307 [20:36:03<209:56:39,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18167/203307 [20:36:03<209:56:39,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18168/203307 [20:36:07<209:56:37,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18168/203307 [20:36:07<209:56:37,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18169/203307 [20:36:12<209:56:36,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18169/203307 [20:36:12<209:56:36,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18170/203307 [20:36:16<209:56:31,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18170/203307 [20:36:16<209:56:31,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18171/203307 [20:36:19<209:56:24,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18171/203307 [20:36:19<209:56:24,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18172/203307 [20:36:24<209:56:23,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18172/203307 [20:36:24<209:56:23,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18173/203307 [20:36:27<209:56:16,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18173/203307 [20:36:28<209:56:16,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18174/203307 [20:36:31<209:56:10,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18174/203307 [20:36:31<209:56:10,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18175/203307 [20:36:36<209:56:08,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18175/203307 [20:36:36<209:56:08,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18176/203307 [20:36:40<209:56:05,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18176/203307 [20:36:40<209:56:05,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18177/203307 [20:36:44<209:55:58,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18177/203307 [20:36:44<209:55:58,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18178/203307 [20:36:48<209:56:00,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18178/203307 [20:36:48<209:56:00,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18179/203307 [20:36:52<209:55:52,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18179/203307 [20:36:52<209:55:52,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18180/203307 [20:36:56<209:55:51,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18180/203307 [20:36:56<209:55:51,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18181/203307 [20:37:00<209:55:43,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18181/203307 [20:37:00<209:55:43,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18182/203307 [20:37:04<209:55:38,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18182/203307 [20:37:04<209:55:38,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18183/203307 [20:37:08<209:55:35,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18183/203307 [20:37:08<209:55:35,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18184/203307 [20:37:13<209:55:33,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18184/203307 [20:37:13<209:55:33,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18185/203307 [20:37:16<209:55:25,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18185/203307 [20:37:16<209:55:25,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18186/203307 [20:37:21<209:55:28,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18186/203307 [20:37:21<209:55:28,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18187/203307 [20:37:25<209:55:22,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18187/203307 [20:37:25<209:55:22,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18188/203307 [20:37:29<209:55:15,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18188/203307 [20:37:29<209:55:15,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18189/203307 [20:37:33<209:55:15,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18189/203307 [20:37:33<209:55:15,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18190/203307 [20:37:37<209:55:10,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18190/203307 [20:37:37<209:55:10,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18191/203307 [20:37:41<209:55:02,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18191/203307 [20:37:41<209:55:02,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18192/203307 [20:37:45<209:55:02,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18192/203307 [20:37:45<209:55:02,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18193/203307 [20:37:50<209:55:00,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18193/203307 [20:37:50<209:55:00,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18194/203307 [20:37:54<209:55:02,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18194/203307 [20:37:54<209:55:02,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18195/203307 [20:37:58<209:54:54,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18195/203307 [20:37:58<209:54:54,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18196/203307 [20:38:02<209:54:47,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18196/203307 [20:38:02<209:54:47,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18197/203307 [20:38:06<209:54:39,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18197/203307 [20:38:06<209:54:39,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18198/203307 [20:38:10<209:54:42,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18198/203307 [20:38:10<209:54:42,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18199/203307 [20:38:14<209:54:34,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18199/203307 [20:38:14<209:54:35,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18200/203307 [20:38:18<209:54:32,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18200/203307 [20:38:18<209:54:32,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18201/203307 [20:38:23<209:54:30,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:   9%|▉         | 18201/203307 [20:38:23<209:54:30,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18202/203307 [20:38:27<209:54:27,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18202/203307 [20:38:27<209:54:27,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18203/203307 [20:38:31<209:54:27,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18203/203307 [20:38:31<209:54:27,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18204/203307 [20:38:35<209:54:20,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18204/203307 [20:38:35<209:54:20,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18205/203307 [20:38:39<209:54:11,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18205/203307 [20:38:39<209:54:11,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18206/203307 [20:38:43<209:54:14,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18206/203307 [20:38:43<209:54:14,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18207/203307 [20:38:47<209:54:07,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18207/203307 [20:38:47<209:54:07,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18208/203307 [20:38:52<209:54:05,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18208/203307 [20:38:52<209:54:05,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18209/203307 [20:38:56<209:54:04,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18209/203307 [20:38:56<209:54:04,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18210/203307 [20:39:00<209:53:59,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18210/203307 [20:39:00<209:53:59,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18211/203307 [20:39:04<209:53:59,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18211/203307 [20:39:04<209:53:59,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18212/203307 [20:39:08<209:53:52,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18212/203307 [20:39:08<209:53:52,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18213/203307 [20:39:12<209:53:44,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18213/203307 [20:39:12<209:53:44,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18214/203307 [20:39:16<209:53:40,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18214/203307 [20:39:16<209:53:40,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18215/203307 [20:39:21<209:53:41,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18215/203307 [20:39:21<209:53:41,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18216/203307 [20:39:24<209:53:34,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18216/203307 [20:39:24<209:53:34,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18217/203307 [20:39:29<209:53:33,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18217/203307 [20:39:29<209:53:33,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18218/203307 [20:39:33<209:53:35,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18218/203307 [20:39:33<209:53:35,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18219/203307 [20:39:38<209:53:34,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18219/203307 [20:39:38<209:53:34,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18220/203307 [20:39:42<209:53:32,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18220/203307 [20:39:42<209:53:32,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18221/203307 [20:39:46<209:53:25,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:   9%|▉         | 18221/203307 [20:39:46<209:53:25,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18222/203307 [20:39:50<209:53:19,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18222/203307 [20:39:50<209:53:19,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18223/203307 [20:39:54<209:53:13,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18223/203307 [20:39:54<209:53:13,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18224/203307 [20:39:58<209:53:14,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18224/203307 [20:39:58<209:53:14,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18225/203307 [20:40:03<209:53:12,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18225/203307 [20:40:03<209:53:12,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18226/203307 [20:40:07<209:53:12,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18226/203307 [20:40:07<209:53:12,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18227/203307 [20:40:11<209:53:05,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18227/203307 [20:40:11<209:53:05,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18228/203307 [20:40:15<209:53:05,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18228/203307 [20:40:15<209:53:05,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18229/203307 [20:40:20<209:53:03,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18229/203307 [20:40:20<209:53:03,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18230/203307 [20:40:24<209:52:58,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18230/203307 [20:40:24<209:52:58,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18231/203307 [20:40:27<209:52:50,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18231/203307 [20:40:27<209:52:50,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18232/203307 [20:40:32<209:52:50,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18232/203307 [20:40:32<209:52:50,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18233/203307 [20:40:36<209:52:49,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18233/203307 [20:40:36<209:52:49,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18234/203307 [20:40:41<209:52:50,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18234/203307 [20:40:41<209:52:50,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18235/203307 [20:40:45<209:52:45,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18235/203307 [20:40:45<209:52:45,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18236/203307 [20:40:49<209:52:44,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18236/203307 [20:40:49<209:52:44,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18237/203307 [20:40:53<209:52:37,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18237/203307 [20:40:53<209:52:37,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18238/203307 [20:40:57<209:52:34,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18238/203307 [20:40:57<209:52:34,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18239/203307 [20:41:01<209:52:30,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18239/203307 [20:41:01<209:52:30,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18240/203307 [20:41:05<209:52:22,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18240/203307 [20:41:05<209:52:22,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18241/203307 [20:41:09<209:52:23,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:   9%|▉         | 18241/203307 [20:41:09<209:52:23,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18242/203307 [20:41:14<209:52:21,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18242/203307 [20:41:14<209:52:21,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18243/203307 [20:41:18<209:52:22,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18243/203307 [20:41:18<209:52:22,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18244/203307 [20:41:23<209:52:22,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18244/203307 [20:41:23<209:52:22,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18245/203307 [20:41:27<209:52:15,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18245/203307 [20:41:27<209:52:15,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18246/203307 [20:41:31<209:52:09,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18246/203307 [20:41:31<209:52:09,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18247/203307 [20:41:35<209:52:10,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18247/203307 [20:41:35<209:52:10,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18248/203307 [20:41:39<209:52:03,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18248/203307 [20:41:39<209:52:03,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18249/203307 [20:41:43<209:51:55,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18249/203307 [20:41:43<209:51:55,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18250/203307 [20:41:47<209:51:58,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18250/203307 [20:41:47<209:51:58,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18251/203307 [20:41:52<209:51:59,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18251/203307 [20:41:52<209:51:59,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18252/203307 [20:41:56<209:51:52,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18252/203307 [20:41:56<209:51:52,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18253/203307 [20:42:00<209:51:51,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18253/203307 [20:42:00<209:51:51,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18254/203307 [20:42:04<209:51:46,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18254/203307 [20:42:04<209:51:46,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18255/203307 [20:42:08<209:51:41,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18255/203307 [20:42:08<209:51:41,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18256/203307 [20:42:12<209:51:39,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18256/203307 [20:42:12<209:51:39,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18257/203307 [20:42:16<209:51:32,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18257/203307 [20:42:16<209:51:32,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18258/203307 [20:42:21<209:51:35,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18258/203307 [20:42:21<209:51:35,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18259/203307 [20:42:26<209:51:36,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18259/203307 [20:42:26<209:51:36,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18260/203307 [20:42:29<209:51:29,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18260/203307 [20:42:29<209:51:29,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18261/203307 [20:42:34<209:51:28,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:   9%|▉         | 18261/203307 [20:42:34<209:51:28,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18262/203307 [20:42:38<209:51:24,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18262/203307 [20:42:38<209:51:24,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18263/203307 [20:42:42<209:51:20,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18263/203307 [20:42:42<209:51:20,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18264/203307 [20:42:46<209:51:12,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18264/203307 [20:42:46<209:51:12,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18265/203307 [20:42:50<209:51:10,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18265/203307 [20:42:50<209:51:10,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18266/203307 [20:42:54<209:51:05,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18266/203307 [20:42:54<209:51:05,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18267/203307 [20:42:59<209:51:08,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18267/203307 [20:42:59<209:51:08,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18268/203307 [20:43:03<209:51:06,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18268/203307 [20:43:03<209:51:06,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18269/203307 [20:43:07<209:51:05,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18269/203307 [20:43:07<209:51:05,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18270/203307 [20:43:11<209:51:00,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18270/203307 [20:43:11<209:51:00,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18271/203307 [20:43:15<209:50:56,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18271/203307 [20:43:15<209:50:56,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18272/203307 [20:43:19<209:50:49,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18272/203307 [20:43:19<209:50:49,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18273/203307 [20:43:23<209:50:41,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18273/203307 [20:43:23<209:50:41,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18274/203307 [20:43:27<209:50:39,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18274/203307 [20:43:27<209:50:39,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18275/203307 [20:43:32<209:50:40,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18275/203307 [20:43:32<209:50:40,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18276/203307 [20:43:36<209:50:41,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18276/203307 [20:43:36<209:50:41,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18277/203307 [20:43:40<209:50:34,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18277/203307 [20:43:40<209:50:34,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18278/203307 [20:43:45<209:50:36,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18278/203307 [20:43:45<209:50:36,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18279/203307 [20:43:49<209:50:31,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18279/203307 [20:43:49<209:50:31,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18280/203307 [20:43:53<209:50:24,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18280/203307 [20:43:53<209:50:24,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18281/203307 [20:43:56<209:50:16,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 18281/203307 [20:43:56<209:50:16,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18282/203307 [20:44:00<209:50:12,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18282/203307 [20:44:01<209:50:12,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18283/203307 [20:44:05<209:50:12,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18283/203307 [20:44:05<209:50:12,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18284/203307 [20:44:10<209:50:13,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18284/203307 [20:44:10<209:50:13,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18285/203307 [20:44:13<209:50:05,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18285/203307 [20:44:13<209:50:05,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18286/203307 [20:44:18<209:50:08,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18286/203307 [20:44:18<209:50:08,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18287/203307 [20:44:22<209:50:02,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18287/203307 [20:44:22<209:50:03,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18288/203307 [20:44:26<209:49:55,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18288/203307 [20:44:26<209:49:55,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18289/203307 [20:44:29<209:49:47,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18289/203307 [20:44:29<209:49:47,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18290/203307 [20:44:34<209:49:43,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18290/203307 [20:44:34<209:49:43,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18291/203307 [20:44:38<209:49:38,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18291/203307 [20:44:38<209:49:38,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18292/203307 [20:44:42<209:49:37,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18292/203307 [20:44:42<209:49:37,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18293/203307 [20:44:46<209:49:37,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18293/203307 [20:44:46<209:49:37,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18294/203307 [20:44:51<209:49:38,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18294/203307 [20:44:51<209:49:38,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18295/203307 [20:44:55<209:49:33,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18295/203307 [20:44:55<209:49:33,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18296/203307 [20:44:59<209:49:25,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18296/203307 [20:44:59<209:49:25,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18297/203307 [20:45:02<209:49:17,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18297/203307 [20:45:02<209:49:17,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18298/203307 [20:45:06<209:49:13,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18298/203307 [20:45:06<209:49:13,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18299/203307 [20:45:11<209:49:09,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18299/203307 [20:45:11<209:49:09,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18300/203307 [20:45:15<209:49:06,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18300/203307 [20:45:15<209:49:06,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18301/203307 [20:45:19<209:49:04,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:   9%|▉         | 18301/203307 [20:45:19<209:49:04,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18302/203307 [20:45:24<209:49:06,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18302/203307 [20:45:24<209:49:06,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18303/203307 [20:45:28<209:49:08,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18303/203307 [20:45:28<209:49:08,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18304/203307 [20:45:32<209:49:01,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18304/203307 [20:45:32<209:49:01,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18305/203307 [20:45:36<209:48:55,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18305/203307 [20:45:36<209:48:55,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18306/203307 [20:45:40<209:48:50,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18306/203307 [20:45:40<209:48:50,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18307/203307 [20:45:44<209:48:45,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18307/203307 [20:45:44<209:48:45,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18308/203307 [20:45:48<209:48:43,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18308/203307 [20:45:48<209:48:43,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18309/203307 [20:45:53<209:48:42,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18309/203307 [20:45:53<209:48:42,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18310/203307 [20:45:57<209:48:44,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18310/203307 [20:45:57<209:48:45,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18311/203307 [20:46:02<209:48:46,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18311/203307 [20:46:02<209:48:46,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18312/203307 [20:46:06<209:48:39,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18312/203307 [20:46:06<209:48:39,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18313/203307 [20:46:10<209:48:31,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18313/203307 [20:46:10<209:48:31,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18314/203307 [20:46:14<209:48:27,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18314/203307 [20:46:14<209:48:27,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18315/203307 [20:46:18<209:48:23,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18315/203307 [20:46:18<209:48:23,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18316/203307 [20:46:22<209:48:16,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18316/203307 [20:46:22<209:48:16,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18317/203307 [20:46:26<209:48:14,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18317/203307 [20:46:26<209:48:14,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18318/203307 [20:46:31<209:48:16,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18318/203307 [20:46:31<209:48:16,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18319/203307 [20:46:35<209:48:18,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18319/203307 [20:46:35<209:48:18,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18320/203307 [20:46:39<209:48:11,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18320/203307 [20:46:39<209:48:11,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18321/203307 [20:46:43<209:48:06,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:   9%|▉         | 18321/203307 [20:46:43<209:48:06,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18322/203307 [20:46:47<209:48:01,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18322/203307 [20:46:47<209:48:01,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18323/203307 [20:46:51<209:47:56,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18323/203307 [20:46:51<209:47:56,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18324/203307 [20:46:55<209:47:49,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18324/203307 [20:46:55<209:47:49,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18325/203307 [20:46:59<209:47:46,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18325/203307 [20:46:59<209:47:46,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18326/203307 [20:47:04<209:47:47,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18326/203307 [20:47:04<209:47:47,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18327/203307 [20:47:08<209:47:42,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18327/203307 [20:47:08<209:47:42,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18328/203307 [20:47:12<209:47:43,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18328/203307 [20:47:12<209:47:43,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18329/203307 [20:47:16<209:47:36,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18329/203307 [20:47:16<209:47:36,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18330/203307 [20:47:20<209:47:32,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18330/203307 [20:47:20<209:47:32,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18331/203307 [20:47:24<209:47:27,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18331/203307 [20:47:24<209:47:27,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18332/203307 [20:47:28<209:47:21,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18332/203307 [20:47:28<209:47:21,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18333/203307 [20:47:32<209:47:18,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18333/203307 [20:47:32<209:47:18,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18334/203307 [20:47:37<209:47:19,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18334/203307 [20:47:37<209:47:19,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18335/203307 [20:47:41<209:47:14,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18335/203307 [20:47:41<209:47:14,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18336/203307 [20:47:45<209:47:15,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18336/203307 [20:47:45<209:47:15,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18337/203307 [20:47:50<209:47:13,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18337/203307 [20:47:50<209:47:13,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18338/203307 [20:47:54<209:47:08,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18338/203307 [20:47:54<209:47:08,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18339/203307 [20:47:57<209:47:02,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18339/203307 [20:47:57<209:47:02,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18340/203307 [20:48:01<209:46:56,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18340/203307 [20:48:01<209:46:56,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18341/203307 [20:48:05<209:46:48,  0.24it/s, v_num=t5e6, training/loss=0.0952]Epoch 0:   9%|▉         | 18341/203307 [20:48:05<209:46:48,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18342/203307 [20:48:09<209:46:46,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18342/203307 [20:48:09<209:46:46,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18343/203307 [20:48:14<209:46:49,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18343/203307 [20:48:14<209:46:49,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18344/203307 [20:48:19<209:46:49,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18344/203307 [20:48:19<209:46:49,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18345/203307 [20:48:23<209:46:49,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18345/203307 [20:48:23<209:46:49,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18346/203307 [20:48:27<209:46:46,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18346/203307 [20:48:27<209:46:46,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18347/203307 [20:48:31<209:46:41,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18347/203307 [20:48:31<209:46:41,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18348/203307 [20:48:35<209:46:34,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18348/203307 [20:48:35<209:46:34,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18349/203307 [20:48:39<209:46:28,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18349/203307 [20:48:39<209:46:28,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18350/203307 [20:48:43<209:46:27,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18350/203307 [20:48:43<209:46:27,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18351/203307 [20:48:48<209:46:27,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18351/203307 [20:48:48<209:46:27,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18352/203307 [20:48:52<209:46:20,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18352/203307 [20:48:52<209:46:20,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18353/203307 [20:48:56<209:46:20,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18353/203307 [20:48:56<209:46:20,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18354/203307 [20:49:01<209:46:22,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18354/203307 [20:49:01<209:46:22,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18355/203307 [20:49:05<209:46:22,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18355/203307 [20:49:05<209:46:22,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18356/203307 [20:49:09<209:46:14,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18356/203307 [20:49:09<209:46:14,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18357/203307 [20:49:13<209:46:06,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18357/203307 [20:49:13<209:46:07,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18358/203307 [20:49:17<209:46:05,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18358/203307 [20:49:17<209:46:05,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18359/203307 [20:49:22<209:46:06,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18359/203307 [20:49:22<209:46:06,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18360/203307 [20:49:25<209:45:59,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18360/203307 [20:49:25<209:45:59,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18361/203307 [20:49:30<209:45:58,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:   9%|▉         | 18361/203307 [20:49:30<209:45:58,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18362/203307 [20:49:34<209:45:59,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18362/203307 [20:49:34<209:45:59,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18363/203307 [20:49:38<209:45:54,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18363/203307 [20:49:38<209:45:54,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18364/203307 [20:49:43<209:45:52,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18364/203307 [20:49:43<209:45:52,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18365/203307 [20:49:46<209:45:44,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18365/203307 [20:49:46<209:45:44,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18366/203307 [20:49:50<209:45:40,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18366/203307 [20:49:50<209:45:40,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18367/203307 [20:49:55<209:45:40,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18367/203307 [20:49:55<209:45:40,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18368/203307 [20:49:59<209:45:38,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18368/203307 [20:49:59<209:45:38,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18369/203307 [20:50:04<209:45:38,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18369/203307 [20:50:04<209:45:38,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18370/203307 [20:50:08<209:45:33,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18370/203307 [20:50:08<209:45:33,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18371/203307 [20:50:12<209:45:34,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18371/203307 [20:50:12<209:45:34,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18372/203307 [20:50:16<209:45:26,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18372/203307 [20:50:16<209:45:26,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18373/203307 [20:50:20<209:45:23,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18373/203307 [20:50:20<209:45:23,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18374/203307 [20:50:24<209:45:18,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18374/203307 [20:50:24<209:45:18,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18375/203307 [20:50:29<209:45:17,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18375/203307 [20:50:29<209:45:17,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18376/203307 [20:50:33<209:45:15,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18376/203307 [20:50:33<209:45:16,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18377/203307 [20:50:37<209:45:09,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18377/203307 [20:50:37<209:45:09,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18378/203307 [20:50:42<209:45:11,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18378/203307 [20:50:42<209:45:12,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18379/203307 [20:50:46<209:45:08,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18379/203307 [20:50:46<209:45:08,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18380/203307 [20:50:50<209:45:08,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18380/203307 [20:50:50<209:45:08,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18381/203307 [20:50:54<209:45:01,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 18381/203307 [20:50:54<209:45:01,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18382/203307 [20:50:58<209:44:59,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18382/203307 [20:50:58<209:44:59,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18383/203307 [20:51:03<209:44:59,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18383/203307 [20:51:03<209:44:59,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18384/203307 [20:51:07<209:44:59,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18384/203307 [20:51:07<209:44:59,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18385/203307 [20:51:11<209:44:51,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18385/203307 [20:51:11<209:44:51,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18386/203307 [20:51:16<209:44:54,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18386/203307 [20:51:16<209:44:54,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18387/203307 [20:51:20<209:44:49,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18387/203307 [20:51:20<209:44:49,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18388/203307 [20:51:24<209:44:49,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18388/203307 [20:51:24<209:44:49,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18389/203307 [20:51:28<209:44:42,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18389/203307 [20:51:28<209:44:42,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18390/203307 [20:51:32<209:44:37,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18390/203307 [20:51:32<209:44:37,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18391/203307 [20:51:36<209:44:37,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18391/203307 [20:51:36<209:44:37,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18392/203307 [20:51:41<209:44:35,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18392/203307 [20:51:41<209:44:35,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18393/203307 [20:51:45<209:44:34,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18393/203307 [20:51:45<209:44:34,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18394/203307 [20:51:50<209:44:37,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18394/203307 [20:51:50<209:44:37,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18395/203307 [20:51:54<209:44:32,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18395/203307 [20:51:54<209:44:32,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18396/203307 [20:51:58<209:44:24,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18396/203307 [20:51:58<209:44:24,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18397/203307 [20:52:02<209:44:24,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18397/203307 [20:52:02<209:44:24,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18398/203307 [20:52:06<209:44:19,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18398/203307 [20:52:06<209:44:19,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18399/203307 [20:52:10<209:44:14,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18399/203307 [20:52:10<209:44:14,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18400/203307 [20:52:14<209:44:12,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18400/203307 [20:52:14<209:44:12,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18401/203307 [20:52:19<209:44:11,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:   9%|▉         | 18401/203307 [20:52:19<209:44:11,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18402/203307 [20:52:23<209:44:06,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18402/203307 [20:52:23<209:44:06,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18403/203307 [20:52:28<209:44:09,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18403/203307 [20:52:28<209:44:09,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18404/203307 [20:52:31<209:44:01,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18404/203307 [20:52:31<209:44:01,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18405/203307 [20:52:35<209:43:54,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18405/203307 [20:52:35<209:43:54,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18406/203307 [20:52:40<209:43:56,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18406/203307 [20:52:40<209:43:56,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18407/203307 [20:52:44<209:43:51,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18407/203307 [20:52:44<209:43:51,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18408/203307 [20:52:48<209:43:49,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18408/203307 [20:52:48<209:43:49,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18409/203307 [20:52:52<209:43:48,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18409/203307 [20:52:52<209:43:48,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18410/203307 [20:52:56<209:43:43,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18410/203307 [20:52:56<209:43:43,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18411/203307 [20:53:01<209:43:45,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18411/203307 [20:53:01<209:43:45,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18412/203307 [20:53:05<209:43:38,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18412/203307 [20:53:05<209:43:38,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18413/203307 [20:53:09<209:43:30,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18413/203307 [20:53:09<209:43:30,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18414/203307 [20:53:13<209:43:32,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18414/203307 [20:53:13<209:43:32,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18415/203307 [20:53:17<209:43:27,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18415/203307 [20:53:17<209:43:27,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18416/203307 [20:53:21<209:43:22,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18416/203307 [20:53:21<209:43:22,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18417/203307 [20:53:26<209:43:21,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18417/203307 [20:53:26<209:43:21,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18418/203307 [20:53:30<209:43:21,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18418/203307 [20:53:30<209:43:22,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18419/203307 [20:53:35<209:43:23,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18419/203307 [20:53:35<209:43:23,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18420/203307 [20:53:39<209:43:16,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18420/203307 [20:53:39<209:43:16,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18421/203307 [20:53:42<209:43:09,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:   9%|▉         | 18421/203307 [20:53:42<209:43:09,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18422/203307 [20:53:46<209:43:04,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18422/203307 [20:53:46<209:43:04,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18423/203307 [20:53:51<209:43:07,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18423/203307 [20:53:51<209:43:07,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18424/203307 [20:53:55<209:43:00,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18424/203307 [20:53:55<209:43:00,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18425/203307 [20:53:59<209:42:58,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18425/203307 [20:53:59<209:42:58,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18426/203307 [20:54:04<209:42:58,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18426/203307 [20:54:04<209:42:58,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18427/203307 [20:54:08<209:42:58,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18427/203307 [20:54:08<209:42:58,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18428/203307 [20:54:13<209:42:58,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18428/203307 [20:54:13<209:42:58,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18429/203307 [20:54:17<209:42:51,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18429/203307 [20:54:17<209:42:51,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18430/203307 [20:54:21<209:42:46,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18430/203307 [20:54:21<209:42:46,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18431/203307 [20:54:25<209:42:41,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18431/203307 [20:54:25<209:42:41,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18432/203307 [20:54:29<209:42:41,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18432/203307 [20:54:29<209:42:41,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18433/203307 [20:54:33<209:42:39,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18433/203307 [20:54:33<209:42:39,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18434/203307 [20:54:38<209:42:39,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18434/203307 [20:54:38<209:42:39,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18435/203307 [20:54:42<209:42:34,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18435/203307 [20:54:42<209:42:34,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18436/203307 [20:54:46<209:42:34,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18436/203307 [20:54:46<209:42:34,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18437/203307 [20:54:50<209:42:27,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18437/203307 [20:54:50<209:42:27,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18438/203307 [20:54:54<209:42:22,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18438/203307 [20:54:54<209:42:22,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18439/203307 [20:54:58<209:42:17,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18439/203307 [20:54:58<209:42:17,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18440/203307 [20:55:03<209:42:17,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18440/203307 [20:55:03<209:42:17,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18441/203307 [20:55:06<209:42:11,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18441/203307 [20:55:06<209:42:11,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18442/203307 [20:55:11<209:42:09,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18442/203307 [20:55:11<209:42:09,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18443/203307 [20:55:15<209:42:10,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18443/203307 [20:55:15<209:42:10,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18444/203307 [20:55:20<209:42:10,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18444/203307 [20:55:20<209:42:10,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18445/203307 [20:55:24<209:42:06,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18445/203307 [20:55:24<209:42:07,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18446/203307 [20:55:28<209:42:01,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18446/203307 [20:55:28<209:42:01,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18447/203307 [20:55:32<209:41:56,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18447/203307 [20:55:32<209:41:56,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18448/203307 [20:55:36<209:41:49,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18448/203307 [20:55:36<209:41:49,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18449/203307 [20:55:40<209:41:49,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18449/203307 [20:55:40<209:41:50,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18450/203307 [20:55:44<209:41:47,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18450/203307 [20:55:44<209:41:47,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18451/203307 [20:55:49<209:41:47,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18451/203307 [20:55:49<209:41:47,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18452/203307 [20:55:53<209:41:40,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18452/203307 [20:55:53<209:41:40,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18453/203307 [20:55:57<209:41:39,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18453/203307 [20:55:57<209:41:39,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18454/203307 [20:56:01<209:41:36,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18454/203307 [20:56:01<209:41:36,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18455/203307 [20:56:05<209:41:32,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18455/203307 [20:56:05<209:41:32,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18456/203307 [20:56:09<209:41:25,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18456/203307 [20:56:09<209:41:25,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18457/203307 [20:56:13<209:41:18,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18457/203307 [20:56:13<209:41:18,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18458/203307 [20:56:18<209:41:18,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18458/203307 [20:56:18<209:41:18,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18459/203307 [20:56:22<209:41:19,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18459/203307 [20:56:22<209:41:19,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18460/203307 [20:56:26<209:41:13,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18460/203307 [20:56:26<209:41:13,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18461/203307 [20:56:30<209:41:12,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:   9%|▉         | 18461/203307 [20:56:30<209:41:12,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18462/203307 [20:56:34<209:41:08,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18462/203307 [20:56:34<209:41:08,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18463/203307 [20:56:39<209:41:08,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18463/203307 [20:56:39<209:41:08,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18464/203307 [20:56:43<209:41:02,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18464/203307 [20:56:43<209:41:02,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18465/203307 [20:56:47<209:40:54,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18465/203307 [20:56:47<209:40:54,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18466/203307 [20:56:51<209:40:56,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18466/203307 [20:56:51<209:40:56,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18467/203307 [20:56:55<209:40:53,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18467/203307 [20:56:55<209:40:53,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18468/203307 [20:57:00<209:40:51,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18468/203307 [20:57:00<209:40:51,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18469/203307 [20:57:04<209:40:49,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18469/203307 [20:57:04<209:40:49,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18470/203307 [20:57:08<209:40:44,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18470/203307 [20:57:08<209:40:44,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18471/203307 [20:57:12<209:40:39,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18471/203307 [20:57:12<209:40:39,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18472/203307 [20:57:16<209:40:36,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18472/203307 [20:57:16<209:40:36,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18473/203307 [20:57:20<209:40:29,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18473/203307 [20:57:20<209:40:29,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18474/203307 [20:57:24<209:40:23,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18474/203307 [20:57:24<209:40:23,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18475/203307 [20:57:28<209:40:24,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18475/203307 [20:57:28<209:40:24,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18476/203307 [20:57:33<209:40:23,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18476/203307 [20:57:33<209:40:23,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18477/203307 [20:57:37<209:40:16,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18477/203307 [20:57:37<209:40:16,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18478/203307 [20:57:41<209:40:18,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18478/203307 [20:57:41<209:40:18,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18479/203307 [20:57:45<209:40:13,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18479/203307 [20:57:45<209:40:13,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18480/203307 [20:57:49<209:40:06,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18480/203307 [20:57:49<209:40:06,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18481/203307 [20:57:53<209:40:05,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18481/203307 [20:57:53<209:40:05,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18482/203307 [20:57:57<209:40:00,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18482/203307 [20:57:57<209:40:00,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18483/203307 [20:58:02<209:39:59,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18483/203307 [20:58:02<209:39:59,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18484/203307 [20:58:06<209:39:59,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18484/203307 [20:58:06<209:39:59,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18485/203307 [20:58:10<209:39:51,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18485/203307 [20:58:10<209:39:51,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18486/203307 [20:58:15<209:39:53,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18486/203307 [20:58:15<209:39:53,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18487/203307 [20:58:19<209:39:48,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18487/203307 [20:58:19<209:39:48,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18488/203307 [20:58:23<209:39:41,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18488/203307 [20:58:23<209:39:41,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18489/203307 [20:58:26<209:39:34,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18489/203307 [20:58:26<209:39:34,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18490/203307 [20:58:31<209:39:32,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18490/203307 [20:58:31<209:39:32,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18491/203307 [20:58:35<209:39:26,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18491/203307 [20:58:35<209:39:26,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18492/203307 [20:58:39<209:39:26,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18492/203307 [20:58:39<209:39:26,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18493/203307 [20:58:43<209:39:25,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18493/203307 [20:58:43<209:39:25,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18494/203307 [20:58:48<209:39:27,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18494/203307 [20:58:48<209:39:27,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18495/203307 [20:58:52<209:39:21,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18495/203307 [20:58:52<209:39:22,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18496/203307 [20:58:56<209:39:14,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18496/203307 [20:58:56<209:39:14,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18497/203307 [20:59:00<209:39:06,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18497/203307 [20:59:00<209:39:06,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18498/203307 [20:59:03<209:39:01,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18498/203307 [20:59:03<209:39:01,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18499/203307 [20:59:08<209:39:02,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18499/203307 [20:59:08<209:39:02,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18500/203307 [20:59:12<209:38:59,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18500/203307 [20:59:12<209:38:59,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18501/203307 [20:59:17<209:38:59,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:   9%|▉         | 18501/203307 [20:59:17<209:38:59,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18502/203307 [20:59:21<209:38:54,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18502/203307 [20:59:21<209:38:54,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18503/203307 [20:59:26<209:38:57,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18503/203307 [20:59:26<209:38:57,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18504/203307 [20:59:29<209:38:50,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18504/203307 [20:59:29<209:38:50,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18505/203307 [20:59:33<209:38:42,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18505/203307 [20:59:33<209:38:42,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18506/203307 [20:59:37<209:38:38,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18506/203307 [20:59:37<209:38:38,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18507/203307 [20:59:41<209:38:33,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18507/203307 [20:59:41<209:38:33,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18508/203307 [20:59:45<209:38:31,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18508/203307 [20:59:45<209:38:31,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18509/203307 [20:59:50<209:38:31,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18509/203307 [20:59:50<209:38:31,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18510/203307 [20:59:55<209:38:33,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18510/203307 [20:59:55<209:38:33,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18511/203307 [20:59:59<209:38:35,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18511/203307 [20:59:59<209:38:35,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18512/203307 [21:00:03<209:38:27,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18512/203307 [21:00:03<209:38:28,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18513/203307 [21:00:07<209:38:20,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18513/203307 [21:00:07<209:38:20,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18514/203307 [21:00:11<209:38:15,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18514/203307 [21:00:11<209:38:15,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18515/203307 [21:00:15<209:38:10,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18515/203307 [21:00:15<209:38:10,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18516/203307 [21:00:19<209:38:04,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18516/203307 [21:00:19<209:38:04,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18517/203307 [21:00:23<209:38:01,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18517/203307 [21:00:23<209:38:01,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18518/203307 [21:00:27<209:38:03,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18518/203307 [21:00:27<209:38:03,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18519/203307 [21:00:32<209:38:05,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18519/203307 [21:00:32<209:38:05,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18520/203307 [21:00:36<209:37:57,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18520/203307 [21:00:36<209:37:57,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18521/203307 [21:00:40<209:37:50,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:   9%|▉         | 18521/203307 [21:00:40<209:37:50,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18522/203307 [21:00:44<209:37:45,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18522/203307 [21:00:44<209:37:45,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18523/203307 [21:00:48<209:37:40,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18523/203307 [21:00:48<209:37:40,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18524/203307 [21:00:52<209:37:34,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18524/203307 [21:00:52<209:37:34,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18525/203307 [21:00:56<209:37:32,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18525/203307 [21:00:56<209:37:32,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18526/203307 [21:01:00<209:37:32,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18526/203307 [21:01:00<209:37:33,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18527/203307 [21:01:05<209:37:35,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18527/203307 [21:01:05<209:37:35,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18528/203307 [21:01:10<209:37:34,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18528/203307 [21:01:10<209:37:34,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18529/203307 [21:01:13<209:37:27,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18529/203307 [21:01:13<209:37:27,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18530/203307 [21:01:17<209:37:23,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18530/203307 [21:01:17<209:37:23,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18531/203307 [21:01:21<209:37:17,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18531/203307 [21:01:21<209:37:17,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18532/203307 [21:01:25<209:37:09,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18532/203307 [21:01:25<209:37:09,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18533/203307 [21:01:29<209:37:07,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18533/203307 [21:01:29<209:37:07,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18534/203307 [21:01:34<209:37:08,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18534/203307 [21:01:34<209:37:08,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18535/203307 [21:01:38<209:37:07,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18535/203307 [21:01:38<209:37:07,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18536/203307 [21:01:43<209:37:07,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18536/203307 [21:01:43<209:37:07,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18537/203307 [21:01:47<209:36:59,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18537/203307 [21:01:47<209:36:59,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18538/203307 [21:01:51<209:36:54,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18538/203307 [21:01:51<209:36:54,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18539/203307 [21:01:55<209:36:49,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18539/203307 [21:01:55<209:36:50,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18540/203307 [21:01:58<209:36:44,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18540/203307 [21:01:58<209:36:44,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18541/203307 [21:02:02<209:36:36,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:   9%|▉         | 18541/203307 [21:02:02<209:36:36,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18542/203307 [21:02:06<209:36:34,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18542/203307 [21:02:06<209:36:34,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18543/203307 [21:02:11<209:36:35,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18543/203307 [21:02:11<209:36:35,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18544/203307 [21:02:16<209:36:37,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18544/203307 [21:02:16<209:36:38,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18545/203307 [21:02:19<209:36:29,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18545/203307 [21:02:19<209:36:29,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18546/203307 [21:02:23<209:36:24,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18546/203307 [21:02:23<209:36:24,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18547/203307 [21:02:27<209:36:20,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18547/203307 [21:02:27<209:36:20,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18548/203307 [21:02:31<209:36:12,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18548/203307 [21:02:31<209:36:12,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18549/203307 [21:02:35<209:36:05,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18549/203307 [21:02:35<209:36:05,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18550/203307 [21:02:39<209:36:04,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18550/203307 [21:02:39<209:36:04,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18551/203307 [21:02:44<209:36:04,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18551/203307 [21:02:44<209:36:04,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18552/203307 [21:02:48<209:35:57,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18552/203307 [21:02:48<209:35:57,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18553/203307 [21:02:52<209:35:58,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18553/203307 [21:02:52<209:35:58,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18554/203307 [21:02:56<209:35:53,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18554/203307 [21:02:56<209:35:53,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18555/203307 [21:03:00<209:35:47,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18555/203307 [21:03:00<209:35:47,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18556/203307 [21:03:04<209:35:40,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18556/203307 [21:03:04<209:35:40,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18557/203307 [21:03:08<209:35:32,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18557/203307 [21:03:08<209:35:32,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18558/203307 [21:03:12<209:35:30,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18558/203307 [21:03:12<209:35:30,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18559/203307 [21:03:17<209:35:31,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18559/203307 [21:03:17<209:35:31,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18560/203307 [21:03:20<209:35:24,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18560/203307 [21:03:20<209:35:24,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18561/203307 [21:03:25<209:35:25,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:   9%|▉         | 18561/203307 [21:03:25<209:35:25,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18562/203307 [21:03:30<209:35:28,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18562/203307 [21:03:30<209:35:28,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18563/203307 [21:03:34<209:35:22,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18563/203307 [21:03:34<209:35:22,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18564/203307 [21:03:37<209:35:15,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18564/203307 [21:03:37<209:35:15,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18565/203307 [21:03:41<209:35:09,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18565/203307 [21:03:41<209:35:09,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18566/203307 [21:03:45<209:35:04,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18566/203307 [21:03:45<209:35:04,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18567/203307 [21:03:50<209:35:05,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18567/203307 [21:03:50<209:35:05,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18568/203307 [21:03:54<209:35:03,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18568/203307 [21:03:54<209:35:03,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18569/203307 [21:03:59<209:35:02,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18569/203307 [21:03:59<209:35:02,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18570/203307 [21:04:03<209:35:04,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18570/203307 [21:04:03<209:35:04,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18571/203307 [21:04:08<209:35:04,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18571/203307 [21:04:08<209:35:04,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18572/203307 [21:04:11<209:34:56,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18572/203307 [21:04:11<209:34:56,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18573/203307 [21:04:15<209:34:49,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18573/203307 [21:04:15<209:34:49,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18574/203307 [21:04:19<209:34:44,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18574/203307 [21:04:19<209:34:44,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18575/203307 [21:04:24<209:34:44,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18575/203307 [21:04:24<209:34:44,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18576/203307 [21:04:28<209:34:43,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18576/203307 [21:04:28<209:34:43,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18577/203307 [21:04:32<209:34:36,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18577/203307 [21:04:32<209:34:36,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18578/203307 [21:04:37<209:34:38,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18578/203307 [21:04:37<209:34:38,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18579/203307 [21:04:41<209:34:41,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18579/203307 [21:04:41<209:34:41,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18580/203307 [21:04:46<209:34:39,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18580/203307 [21:04:46<209:34:39,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18581/203307 [21:04:49<209:34:31,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:   9%|▉         | 18581/203307 [21:04:49<209:34:31,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18582/203307 [21:04:53<209:34:26,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18582/203307 [21:04:53<209:34:26,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18583/203307 [21:04:58<209:34:26,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18583/203307 [21:04:58<209:34:26,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18584/203307 [21:05:02<209:34:25,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18584/203307 [21:05:02<209:34:25,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18585/203307 [21:05:06<209:34:18,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18585/203307 [21:05:06<209:34:18,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18586/203307 [21:05:11<209:34:19,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18586/203307 [21:05:11<209:34:19,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18587/203307 [21:05:15<209:34:14,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18587/203307 [21:05:15<209:34:14,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18588/203307 [21:05:19<209:34:15,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18588/203307 [21:05:19<209:34:15,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18589/203307 [21:05:23<209:34:12,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18589/203307 [21:05:23<209:34:12,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18590/203307 [21:05:27<209:34:06,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18590/203307 [21:05:27<209:34:06,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18591/203307 [21:05:31<209:34:01,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18591/203307 [21:05:31<209:34:01,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18592/203307 [21:05:36<209:34:01,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18592/203307 [21:05:36<209:34:01,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18593/203307 [21:05:40<209:34:00,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18593/203307 [21:05:40<209:34:00,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18594/203307 [21:05:45<209:34:01,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18594/203307 [21:05:45<209:34:01,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18595/203307 [21:05:49<209:33:56,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18595/203307 [21:05:49<209:33:56,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18596/203307 [21:05:53<209:33:55,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18596/203307 [21:05:53<209:33:55,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18597/203307 [21:05:57<209:33:49,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18597/203307 [21:05:57<209:33:49,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18598/203307 [21:06:02<209:33:48,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18598/203307 [21:06:02<209:33:48,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18599/203307 [21:06:05<209:33:43,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18599/203307 [21:06:05<209:33:43,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18600/203307 [21:06:10<209:33:41,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18600/203307 [21:06:10<209:33:41,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18601/203307 [21:06:14<209:33:39,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:   9%|▉         | 18601/203307 [21:06:14<209:33:39,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18602/203307 [21:06:18<209:33:34,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18602/203307 [21:06:18<209:33:34,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18603/203307 [21:06:23<209:33:35,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18603/203307 [21:06:23<209:33:35,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18604/203307 [21:06:26<209:33:27,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18604/203307 [21:06:26<209:33:27,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18605/203307 [21:06:31<209:33:27,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18605/203307 [21:06:31<209:33:27,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18606/203307 [21:06:35<209:33:22,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18606/203307 [21:06:35<209:33:22,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18607/203307 [21:06:39<209:33:23,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18607/203307 [21:06:39<209:33:23,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18608/203307 [21:06:44<209:33:22,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18608/203307 [21:06:44<209:33:22,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18609/203307 [21:06:48<209:33:20,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18609/203307 [21:06:48<209:33:20,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18610/203307 [21:06:52<209:33:14,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18610/203307 [21:06:52<209:33:15,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18611/203307 [21:06:57<209:33:17,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18611/203307 [21:06:57<209:33:17,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18612/203307 [21:07:01<209:33:10,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18612/203307 [21:07:01<209:33:10,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18613/203307 [21:07:04<209:33:03,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18613/203307 [21:07:04<209:33:03,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18614/203307 [21:07:09<209:33:05,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18614/203307 [21:07:09<209:33:05,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18615/203307 [21:07:13<209:33:00,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18615/203307 [21:07:13<209:33:00,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18616/203307 [21:07:17<209:32:58,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18616/203307 [21:07:17<209:32:58,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18617/203307 [21:07:22<209:32:57,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18617/203307 [21:07:22<209:32:57,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18618/203307 [21:07:26<209:32:57,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18618/203307 [21:07:26<209:32:57,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18619/203307 [21:07:31<209:32:59,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18619/203307 [21:07:31<209:32:59,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18620/203307 [21:07:35<209:32:51,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18620/203307 [21:07:35<209:32:51,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18621/203307 [21:07:38<209:32:43,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:   9%|▉         | 18621/203307 [21:07:38<209:32:43,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18622/203307 [21:07:43<209:32:44,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18622/203307 [21:07:43<209:32:44,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18623/203307 [21:07:47<209:32:39,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18623/203307 [21:07:47<209:32:39,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18624/203307 [21:07:51<209:32:32,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18624/203307 [21:07:51<209:32:32,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18625/203307 [21:07:55<209:32:30,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18625/203307 [21:07:55<209:32:30,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18626/203307 [21:08:00<209:32:31,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18626/203307 [21:08:00<209:32:31,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18627/203307 [21:08:04<209:32:26,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18627/203307 [21:08:04<209:32:27,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18628/203307 [21:08:08<209:32:26,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18628/203307 [21:08:08<209:32:26,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18629/203307 [21:08:12<209:32:18,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18629/203307 [21:08:12<209:32:18,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18630/203307 [21:08:16<209:32:13,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18630/203307 [21:08:16<209:32:13,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18631/203307 [21:08:21<209:32:16,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18631/203307 [21:08:21<209:32:16,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18632/203307 [21:08:24<209:32:09,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18632/203307 [21:08:24<209:32:09,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18633/203307 [21:08:29<209:32:07,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18633/203307 [21:08:29<209:32:07,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18634/203307 [21:08:33<209:32:08,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18634/203307 [21:08:33<209:32:08,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18635/203307 [21:08:37<209:32:04,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18635/203307 [21:08:37<209:32:04,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18636/203307 [21:08:42<209:32:03,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18636/203307 [21:08:42<209:32:03,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18637/203307 [21:08:46<209:31:56,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18637/203307 [21:08:46<209:31:56,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18638/203307 [21:08:49<209:31:51,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18638/203307 [21:08:49<209:31:51,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18639/203307 [21:08:53<209:31:45,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18639/203307 [21:08:53<209:31:46,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18640/203307 [21:08:58<209:31:46,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18640/203307 [21:08:58<209:31:46,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18641/203307 [21:09:02<209:31:38,  0.24it/s, v_num=t5e6, training/loss=0.0754]Epoch 0:   9%|▉         | 18641/203307 [21:09:02<209:31:38,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18642/203307 [21:09:06<209:31:38,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18642/203307 [21:09:06<209:31:38,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18643/203307 [21:09:11<209:31:39,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18643/203307 [21:09:11<209:31:39,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18644/203307 [21:09:15<209:31:39,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18644/203307 [21:09:15<209:31:39,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18645/203307 [21:09:19<209:31:31,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18645/203307 [21:09:19<209:31:31,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18646/203307 [21:09:23<209:31:27,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18646/203307 [21:09:23<209:31:27,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18647/203307 [21:09:27<209:31:22,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18647/203307 [21:09:27<209:31:22,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18648/203307 [21:09:32<209:31:22,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18648/203307 [21:09:32<209:31:23,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18649/203307 [21:09:35<209:31:16,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18649/203307 [21:09:35<209:31:16,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18650/203307 [21:09:40<209:31:13,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18650/203307 [21:09:40<209:31:13,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18651/203307 [21:09:44<209:31:14,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18651/203307 [21:09:44<209:31:14,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18652/203307 [21:09:49<209:31:12,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18652/203307 [21:09:49<209:31:12,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18653/203307 [21:09:53<209:31:12,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18653/203307 [21:09:53<209:31:12,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18654/203307 [21:09:57<209:31:07,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18654/203307 [21:09:57<209:31:07,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18655/203307 [21:10:01<209:31:02,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18655/203307 [21:10:01<209:31:02,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18656/203307 [21:10:05<209:30:56,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18656/203307 [21:10:05<209:30:56,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18657/203307 [21:10:09<209:30:56,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18657/203307 [21:10:09<209:30:56,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18658/203307 [21:10:14<209:30:54,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18658/203307 [21:10:14<209:30:54,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18659/203307 [21:10:18<209:30:54,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18659/203307 [21:10:18<209:30:55,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18660/203307 [21:10:22<209:30:48,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18660/203307 [21:10:22<209:30:48,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18661/203307 [21:10:27<209:30:48,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:   9%|▉         | 18661/203307 [21:10:27<209:30:49,  0.24it/s, v_num=t5e6, training/loss=0.089] Epoch 0:   9%|▉         | 18662/203307 [21:10:31<209:30:43,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18662/203307 [21:10:31<209:30:43,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18663/203307 [21:10:35<209:30:39,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18663/203307 [21:10:35<209:30:39,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18664/203307 [21:10:39<209:30:32,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18664/203307 [21:10:39<209:30:32,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18665/203307 [21:10:42<209:30:25,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18665/203307 [21:10:42<209:30:25,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18666/203307 [21:10:47<209:30:28,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18666/203307 [21:10:47<209:30:28,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18667/203307 [21:10:52<209:30:28,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18667/203307 [21:10:52<209:30:28,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18668/203307 [21:10:56<209:30:26,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18668/203307 [21:10:56<209:30:26,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18669/203307 [21:11:00<209:30:25,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18669/203307 [21:11:00<209:30:25,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18670/203307 [21:11:05<209:30:23,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18670/203307 [21:11:05<209:30:23,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18671/203307 [21:11:08<209:30:17,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18671/203307 [21:11:08<209:30:17,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18672/203307 [21:11:12<209:30:11,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18672/203307 [21:11:12<209:30:11,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18673/203307 [21:11:16<209:30:03,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18673/203307 [21:11:16<209:30:03,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18674/203307 [21:11:21<209:30:06,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18674/203307 [21:11:21<209:30:06,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18675/203307 [21:11:25<209:30:06,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18675/203307 [21:11:25<209:30:06,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18676/203307 [21:11:30<209:30:04,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18676/203307 [21:11:30<209:30:04,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18677/203307 [21:11:34<209:29:58,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18677/203307 [21:11:34<209:29:58,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18678/203307 [21:11:38<209:30:00,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18678/203307 [21:11:38<209:30:00,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18679/203307 [21:11:43<209:30:00,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18679/203307 [21:11:43<209:30:00,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18680/203307 [21:11:46<209:29:53,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18680/203307 [21:11:46<209:29:53,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18681/203307 [21:11:50<209:29:44,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:   9%|▉         | 18681/203307 [21:11:50<209:29:45,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18682/203307 [21:11:54<209:29:39,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18682/203307 [21:11:54<209:29:39,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18683/203307 [21:11:59<209:29:42,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18683/203307 [21:11:59<209:29:42,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18684/203307 [21:12:03<209:29:40,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18684/203307 [21:12:03<209:29:40,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18685/203307 [21:12:07<209:29:33,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18685/203307 [21:12:07<209:29:33,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18686/203307 [21:12:12<209:29:34,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18686/203307 [21:12:12<209:29:34,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18687/203307 [21:12:16<209:29:28,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18687/203307 [21:12:16<209:29:28,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18688/203307 [21:12:20<209:29:26,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18688/203307 [21:12:20<209:29:26,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18689/203307 [21:12:24<209:29:19,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18689/203307 [21:12:24<209:29:19,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18690/203307 [21:12:28<209:29:14,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18690/203307 [21:12:28<209:29:14,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18691/203307 [21:12:32<209:29:09,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18691/203307 [21:12:32<209:29:09,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18692/203307 [21:12:36<209:29:10,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18692/203307 [21:12:36<209:29:10,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18693/203307 [21:12:40<209:29:08,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18693/203307 [21:12:40<209:29:08,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18694/203307 [21:12:45<209:29:09,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18694/203307 [21:12:45<209:29:10,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18695/203307 [21:12:49<209:29:04,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18695/203307 [21:12:49<209:29:04,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18696/203307 [21:12:53<209:28:57,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18696/203307 [21:12:53<209:28:57,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18697/203307 [21:12:57<209:28:55,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18697/203307 [21:12:57<209:28:55,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18698/203307 [21:13:01<209:28:51,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18698/203307 [21:13:01<209:28:51,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18699/203307 [21:13:05<209:28:45,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18699/203307 [21:13:05<209:28:46,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18700/203307 [21:13:10<209:28:45,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18700/203307 [21:13:10<209:28:45,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18701/203307 [21:13:14<209:28:43,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:   9%|▉         | 18701/203307 [21:13:14<209:28:44,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18702/203307 [21:13:18<209:28:39,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18702/203307 [21:13:18<209:28:39,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18703/203307 [21:13:23<209:28:41,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18703/203307 [21:13:23<209:28:41,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18704/203307 [21:13:26<209:28:33,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18704/203307 [21:13:26<209:28:33,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18705/203307 [21:13:30<209:28:26,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18705/203307 [21:13:30<209:28:26,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18706/203307 [21:13:35<209:28:24,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18706/203307 [21:13:35<209:28:25,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18707/203307 [21:13:39<209:28:20,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18707/203307 [21:13:39<209:28:20,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18708/203307 [21:13:43<209:28:18,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18708/203307 [21:13:43<209:28:18,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18709/203307 [21:13:47<209:28:18,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18709/203307 [21:13:47<209:28:18,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18710/203307 [21:13:51<209:28:12,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18710/203307 [21:13:51<209:28:12,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18711/203307 [21:13:56<209:28:14,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18711/203307 [21:13:56<209:28:14,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18712/203307 [21:14:00<209:28:07,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18712/203307 [21:14:00<209:28:07,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18713/203307 [21:14:03<209:27:59,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18713/203307 [21:14:03<209:27:59,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18714/203307 [21:14:07<209:27:54,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18714/203307 [21:14:07<209:27:54,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18715/203307 [21:14:12<209:27:54,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18715/203307 [21:14:12<209:27:54,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18716/203307 [21:14:16<209:27:48,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18716/203307 [21:14:16<209:27:48,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18717/203307 [21:14:20<209:27:47,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18717/203307 [21:14:20<209:27:47,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18718/203307 [21:14:25<209:27:49,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18718/203307 [21:14:25<209:27:49,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18719/203307 [21:14:30<209:27:51,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18719/203307 [21:14:30<209:27:51,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18720/203307 [21:14:33<209:27:42,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18720/203307 [21:14:33<209:27:43,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18721/203307 [21:14:37<209:27:36,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:   9%|▉         | 18721/203307 [21:14:37<209:27:36,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18722/203307 [21:14:41<209:27:32,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18722/203307 [21:14:41<209:27:32,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18723/203307 [21:14:45<209:27:28,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18723/203307 [21:14:45<209:27:28,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18724/203307 [21:14:49<209:27:25,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18724/203307 [21:14:49<209:27:25,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18725/203307 [21:14:54<209:27:23,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18725/203307 [21:14:54<209:27:23,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18726/203307 [21:14:58<209:27:25,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18726/203307 [21:14:58<209:27:25,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18727/203307 [21:15:02<209:27:19,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18727/203307 [21:15:02<209:27:19,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18728/203307 [21:15:07<209:27:19,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18728/203307 [21:15:07<209:27:19,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18729/203307 [21:15:11<209:27:11,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18729/203307 [21:15:11<209:27:11,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18730/203307 [21:15:15<209:27:06,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18730/203307 [21:15:15<209:27:06,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18731/203307 [21:15:18<209:27:01,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18731/203307 [21:15:19<209:27:01,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18732/203307 [21:15:22<209:26:53,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18732/203307 [21:15:22<209:26:54,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18733/203307 [21:15:27<209:26:52,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18733/203307 [21:15:27<209:26:52,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18734/203307 [21:15:31<209:26:53,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18734/203307 [21:15:31<209:26:53,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18735/203307 [21:15:36<209:26:54,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18735/203307 [21:15:36<209:26:54,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18736/203307 [21:15:40<209:26:54,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18736/203307 [21:15:40<209:26:54,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18737/203307 [21:15:44<209:26:46,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18737/203307 [21:15:44<209:26:46,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18738/203307 [21:15:48<209:26:42,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18738/203307 [21:15:48<209:26:42,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18739/203307 [21:15:52<209:26:37,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18739/203307 [21:15:52<209:26:37,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18740/203307 [21:15:56<209:26:29,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18740/203307 [21:15:56<209:26:29,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18741/203307 [21:16:00<209:26:23,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:   9%|▉         | 18741/203307 [21:16:00<209:26:24,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18742/203307 [21:16:04<209:26:22,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18742/203307 [21:16:04<209:26:23,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18743/203307 [21:16:09<209:26:23,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18743/203307 [21:16:09<209:26:23,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18744/203307 [21:16:13<209:26:23,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18744/203307 [21:16:13<209:26:23,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18745/203307 [21:16:17<209:26:18,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18745/203307 [21:16:17<209:26:18,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18746/203307 [21:16:21<209:26:12,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18746/203307 [21:16:21<209:26:12,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18747/203307 [21:16:25<209:26:08,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18747/203307 [21:16:25<209:26:08,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18748/203307 [21:16:29<209:26:02,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18748/203307 [21:16:29<209:26:02,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18749/203307 [21:16:33<209:25:55,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18749/203307 [21:16:33<209:25:55,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18750/203307 [21:16:37<209:25:54,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18750/203307 [21:16:37<209:25:54,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18751/203307 [21:16:42<209:25:54,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18751/203307 [21:16:42<209:25:54,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18752/203307 [21:16:46<209:25:53,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18752/203307 [21:16:46<209:25:53,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18753/203307 [21:16:51<209:25:54,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18753/203307 [21:16:51<209:25:54,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18754/203307 [21:16:55<209:25:48,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18754/203307 [21:16:55<209:25:48,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18755/203307 [21:16:59<209:25:43,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18755/203307 [21:16:59<209:25:43,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18756/203307 [21:17:02<209:25:36,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18756/203307 [21:17:02<209:25:36,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18757/203307 [21:17:06<209:25:28,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18757/203307 [21:17:06<209:25:28,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18758/203307 [21:17:10<209:25:26,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18758/203307 [21:17:10<209:25:26,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18759/203307 [21:17:15<209:25:26,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18759/203307 [21:17:15<209:25:26,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18760/203307 [21:17:19<209:25:23,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18760/203307 [21:17:19<209:25:23,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18761/203307 [21:17:24<209:25:23,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:   9%|▉         | 18761/203307 [21:17:24<209:25:23,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18762/203307 [21:17:28<209:25:19,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18762/203307 [21:17:28<209:25:19,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18763/203307 [21:17:32<209:25:13,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18763/203307 [21:17:32<209:25:13,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18764/203307 [21:17:35<209:25:07,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18764/203307 [21:17:35<209:25:07,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18765/203307 [21:17:39<209:24:59,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18765/203307 [21:17:39<209:24:59,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18766/203307 [21:17:43<209:24:55,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18766/203307 [21:17:43<209:24:55,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18767/203307 [21:17:48<209:24:55,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18767/203307 [21:17:48<209:24:55,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18768/203307 [21:17:52<209:24:54,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18768/203307 [21:17:52<209:24:54,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18769/203307 [21:17:57<209:24:54,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18769/203307 [21:17:57<209:24:54,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18770/203307 [21:18:01<209:24:57,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18770/203307 [21:18:01<209:24:57,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18771/203307 [21:18:05<209:24:50,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18771/203307 [21:18:05<209:24:51,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18772/203307 [21:18:09<209:24:43,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18772/203307 [21:18:09<209:24:43,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18773/203307 [21:18:13<209:24:36,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18773/203307 [21:18:13<209:24:36,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18774/203307 [21:18:17<209:24:31,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18774/203307 [21:18:17<209:24:31,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18775/203307 [21:18:21<209:24:32,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18775/203307 [21:18:21<209:24:32,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18776/203307 [21:18:26<209:24:31,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18776/203307 [21:18:26<209:24:31,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18777/203307 [21:18:30<209:24:24,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18777/203307 [21:18:30<209:24:24,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18778/203307 [21:18:34<209:24:27,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18778/203307 [21:18:34<209:24:28,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18779/203307 [21:18:38<209:24:23,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18779/203307 [21:18:38<209:24:23,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18780/203307 [21:18:42<209:24:16,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18780/203307 [21:18:42<209:24:16,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18781/203307 [21:18:46<209:24:09,  0.24it/s, v_num=t5e6, training/loss=0.0976]Epoch 0:   9%|▉         | 18781/203307 [21:18:46<209:24:09,  0.24it/s, v_num=t5e6, training/loss=0.096] Epoch 0:   9%|▉         | 18782/203307 [21:18:50<209:24:05,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18782/203307 [21:18:50<209:24:05,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18783/203307 [21:18:55<209:24:06,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18783/203307 [21:18:55<209:24:06,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18784/203307 [21:18:59<209:24:05,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18784/203307 [21:18:59<209:24:05,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18785/203307 [21:19:03<209:23:58,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18785/203307 [21:19:03<209:23:58,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18786/203307 [21:19:08<209:24:00,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18786/203307 [21:19:08<209:24:00,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18787/203307 [21:19:12<209:24:01,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18787/203307 [21:19:12<209:24:01,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18788/203307 [21:19:16<209:23:54,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18788/203307 [21:19:16<209:23:54,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18789/203307 [21:19:20<209:23:47,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18789/203307 [21:19:20<209:23:47,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18790/203307 [21:19:24<209:23:43,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18790/203307 [21:19:24<209:23:43,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18791/203307 [21:19:28<209:23:38,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18791/203307 [21:19:28<209:23:38,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18792/203307 [21:19:32<209:23:37,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18792/203307 [21:19:32<209:23:37,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18793/203307 [21:19:37<209:23:36,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18793/203307 [21:19:37<209:23:36,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18794/203307 [21:19:41<209:23:37,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18794/203307 [21:19:41<209:23:37,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18795/203307 [21:19:45<209:23:32,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18795/203307 [21:19:45<209:23:32,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18796/203307 [21:19:50<209:23:33,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18796/203307 [21:19:50<209:23:33,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18797/203307 [21:19:54<209:23:26,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18797/203307 [21:19:54<209:23:26,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18798/203307 [21:19:58<209:23:21,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18798/203307 [21:19:58<209:23:21,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18799/203307 [21:20:02<209:23:17,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18799/203307 [21:20:02<209:23:17,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18800/203307 [21:20:06<209:23:15,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18800/203307 [21:20:06<209:23:16,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18801/203307 [21:20:10<209:23:13,  0.24it/s, v_num=t5e6, training/loss=0.096]Epoch 0:   9%|▉         | 18801/203307 [21:20:10<209:23:13,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18802/203307 [21:20:14<209:23:09,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18802/203307 [21:20:14<209:23:09,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18803/203307 [21:20:19<209:23:10,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18803/203307 [21:20:19<209:23:10,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18804/203307 [21:20:24<209:23:10,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18804/203307 [21:20:24<209:23:10,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18805/203307 [21:20:28<209:23:08,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18805/203307 [21:20:28<209:23:08,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18806/203307 [21:20:32<209:23:02,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18806/203307 [21:20:32<209:23:02,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18807/203307 [21:20:36<209:22:57,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18807/203307 [21:20:36<209:22:57,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18808/203307 [21:20:40<209:22:54,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18808/203307 [21:20:40<209:22:54,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18809/203307 [21:20:44<209:22:54,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18809/203307 [21:20:44<209:22:54,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18810/203307 [21:20:48<209:22:49,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18810/203307 [21:20:48<209:22:49,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18811/203307 [21:20:53<209:22:50,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18811/203307 [21:20:53<209:22:50,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18812/203307 [21:20:57<209:22:43,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18812/203307 [21:20:57<209:22:43,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18813/203307 [21:21:01<209:22:43,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18813/203307 [21:21:01<209:22:43,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18814/203307 [21:21:06<209:22:41,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18814/203307 [21:21:06<209:22:41,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18815/203307 [21:21:10<209:22:35,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18815/203307 [21:21:10<209:22:35,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18816/203307 [21:21:13<209:22:29,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18816/203307 [21:21:13<209:22:29,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18817/203307 [21:21:18<209:22:27,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18817/203307 [21:21:18<209:22:27,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18818/203307 [21:21:22<209:22:28,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18818/203307 [21:21:22<209:22:28,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18819/203307 [21:21:27<209:22:29,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18819/203307 [21:21:27<209:22:29,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18820/203307 [21:21:31<209:22:22,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18820/203307 [21:21:31<209:22:22,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18821/203307 [21:21:34<209:22:15,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:   9%|▉         | 18821/203307 [21:21:35<209:22:15,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18822/203307 [21:21:39<209:22:18,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18822/203307 [21:21:39<209:22:18,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18823/203307 [21:21:44<209:22:18,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18823/203307 [21:21:44<209:22:18,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18824/203307 [21:21:48<209:22:10,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18824/203307 [21:21:48<209:22:11,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18825/203307 [21:21:52<209:22:08,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18825/203307 [21:21:52<209:22:08,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18826/203307 [21:21:56<209:22:08,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18826/203307 [21:21:56<209:22:09,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18827/203307 [21:22:00<209:22:04,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18827/203307 [21:22:00<209:22:04,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18828/203307 [21:22:05<209:22:05,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18828/203307 [21:22:05<209:22:05,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18829/203307 [21:22:09<209:22:01,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18829/203307 [21:22:09<209:22:01,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18830/203307 [21:22:14<209:22:02,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18830/203307 [21:22:14<209:22:02,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18831/203307 [21:22:18<209:21:58,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18831/203307 [21:22:18<209:21:58,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18832/203307 [21:22:22<209:21:56,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18832/203307 [21:22:22<209:21:56,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18833/203307 [21:22:26<209:21:55,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18833/203307 [21:22:26<209:21:55,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18834/203307 [21:22:31<209:21:55,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18834/203307 [21:22:31<209:21:55,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18835/203307 [21:22:35<209:21:50,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18835/203307 [21:22:35<209:21:50,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18836/203307 [21:22:40<209:21:50,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18836/203307 [21:22:40<209:21:50,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18837/203307 [21:22:43<209:21:42,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18837/203307 [21:22:43<209:21:42,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18838/203307 [21:22:47<209:21:37,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18838/203307 [21:22:47<209:21:37,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18839/203307 [21:22:52<209:21:39,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18839/203307 [21:22:52<209:21:39,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18840/203307 [21:22:56<209:21:31,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18840/203307 [21:22:56<209:21:31,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18841/203307 [21:23:00<209:21:29,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:   9%|▉         | 18841/203307 [21:23:00<209:21:29,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18842/203307 [21:23:04<209:21:28,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18842/203307 [21:23:04<209:21:28,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18843/203307 [21:23:09<209:21:29,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18843/203307 [21:23:09<209:21:29,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18844/203307 [21:23:13<209:21:28,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18844/203307 [21:23:13<209:21:28,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18845/203307 [21:23:17<209:21:22,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18845/203307 [21:23:17<209:21:22,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18846/203307 [21:23:21<209:21:18,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18846/203307 [21:23:21<209:21:18,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18847/203307 [21:23:25<209:21:13,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18847/203307 [21:23:25<209:21:13,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18848/203307 [21:23:30<209:21:14,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18848/203307 [21:23:30<209:21:14,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18849/203307 [21:23:34<209:21:07,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18849/203307 [21:23:34<209:21:07,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18850/203307 [21:23:38<209:21:05,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18850/203307 [21:23:38<209:21:05,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18851/203307 [21:23:43<209:21:06,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18851/203307 [21:23:43<209:21:06,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18852/203307 [21:23:46<209:20:59,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18852/203307 [21:23:46<209:21:00,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18853/203307 [21:23:51<209:20:59,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18853/203307 [21:23:51<209:20:59,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18854/203307 [21:23:55<209:20:55,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18854/203307 [21:23:55<209:20:55,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18855/203307 [21:23:59<209:20:50,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18855/203307 [21:23:59<209:20:50,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18856/203307 [21:24:03<209:20:50,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18856/203307 [21:24:03<209:20:50,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18857/203307 [21:24:07<209:20:43,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18857/203307 [21:24:07<209:20:43,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18858/203307 [21:24:11<209:20:40,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18858/203307 [21:24:11<209:20:41,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18859/203307 [21:24:16<209:20:41,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18859/203307 [21:24:16<209:20:41,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18860/203307 [21:24:20<209:20:35,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18860/203307 [21:24:20<209:20:35,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18861/203307 [21:24:24<209:20:34,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:   9%|▉         | 18861/203307 [21:24:24<209:20:35,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18862/203307 [21:24:28<209:20:30,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18862/203307 [21:24:28<209:20:30,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18863/203307 [21:24:32<209:20:25,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18863/203307 [21:24:32<209:20:25,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18864/203307 [21:24:36<209:20:18,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18864/203307 [21:24:36<209:20:18,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18865/203307 [21:24:41<209:20:19,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18865/203307 [21:24:41<209:20:19,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18866/203307 [21:24:45<209:20:14,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18866/203307 [21:24:45<209:20:14,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18867/203307 [21:24:49<209:20:11,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18867/203307 [21:24:49<209:20:11,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18868/203307 [21:24:53<209:20:09,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18868/203307 [21:24:53<209:20:10,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18869/203307 [21:24:58<209:20:09,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18869/203307 [21:24:58<209:20:09,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18870/203307 [21:25:02<209:20:05,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18870/203307 [21:25:02<209:20:05,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18871/203307 [21:25:06<209:19:59,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18871/203307 [21:25:06<209:19:59,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18872/203307 [21:25:10<209:19:52,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18872/203307 [21:25:10<209:19:52,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18873/203307 [21:25:13<209:19:45,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18873/203307 [21:25:13<209:19:45,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18874/203307 [21:25:18<209:19:49,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18874/203307 [21:25:18<209:19:49,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18875/203307 [21:25:23<209:19:48,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18875/203307 [21:25:23<209:19:48,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18876/203307 [21:25:27<209:19:47,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18876/203307 [21:25:27<209:19:47,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18877/203307 [21:25:31<209:19:44,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18877/203307 [21:25:31<209:19:44,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18878/203307 [21:25:36<209:19:45,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18878/203307 [21:25:36<209:19:45,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18879/203307 [21:25:40<209:19:40,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18879/203307 [21:25:40<209:19:40,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18880/203307 [21:25:44<209:19:33,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18880/203307 [21:25:44<209:19:33,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18881/203307 [21:25:47<209:19:25,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:   9%|▉         | 18881/203307 [21:25:47<209:19:25,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18882/203307 [21:25:52<209:19:28,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18882/203307 [21:25:52<209:19:28,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18883/203307 [21:25:57<209:19:27,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18883/203307 [21:25:57<209:19:27,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18884/203307 [21:26:01<209:19:25,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18884/203307 [21:26:01<209:19:25,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18885/203307 [21:26:05<209:19:17,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18885/203307 [21:26:05<209:19:17,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18886/203307 [21:26:09<209:19:19,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18886/203307 [21:26:09<209:19:20,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18887/203307 [21:26:13<209:19:14,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18887/203307 [21:26:13<209:19:14,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18888/203307 [21:26:17<209:19:08,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18888/203307 [21:26:17<209:19:08,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18889/203307 [21:26:21<209:19:01,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18889/203307 [21:26:21<209:19:01,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18890/203307 [21:26:25<209:18:56,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18890/203307 [21:26:25<209:18:56,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18891/203307 [21:26:30<209:18:59,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18891/203307 [21:26:30<209:18:59,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18892/203307 [21:26:34<209:18:58,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18892/203307 [21:26:34<209:18:58,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18893/203307 [21:26:38<209:18:56,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18893/203307 [21:26:38<209:18:56,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18894/203307 [21:26:43<209:18:57,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18894/203307 [21:26:43<209:18:57,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18895/203307 [21:26:48<209:18:57,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18895/203307 [21:26:48<209:18:57,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18896/203307 [21:26:51<209:18:49,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18896/203307 [21:26:51<209:18:49,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18897/203307 [21:26:55<209:18:42,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18897/203307 [21:26:55<209:18:42,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18898/203307 [21:26:59<209:18:38,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18898/203307 [21:26:59<209:18:38,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18899/203307 [21:27:03<209:18:33,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18899/203307 [21:27:03<209:18:33,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18900/203307 [21:27:08<209:18:33,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18900/203307 [21:27:08<209:18:33,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18901/203307 [21:27:12<209:18:32,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18901/203307 [21:27:12<209:18:32,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18902/203307 [21:27:16<209:18:27,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18902/203307 [21:27:16<209:18:27,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18903/203307 [21:27:21<209:18:29,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18903/203307 [21:27:21<209:18:29,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18904/203307 [21:27:25<209:18:26,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18904/203307 [21:27:25<209:18:26,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18905/203307 [21:27:29<209:18:20,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18905/203307 [21:27:29<209:18:20,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18906/203307 [21:27:33<209:18:15,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18906/203307 [21:27:33<209:18:15,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18907/203307 [21:27:37<209:18:11,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18907/203307 [21:27:37<209:18:11,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18908/203307 [21:27:41<209:18:11,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18908/203307 [21:27:41<209:18:11,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18909/203307 [21:27:46<209:18:10,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18909/203307 [21:27:46<209:18:10,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18910/203307 [21:27:50<209:18:06,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18910/203307 [21:27:50<209:18:06,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18911/203307 [21:27:55<209:18:07,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18911/203307 [21:27:55<209:18:07,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18912/203307 [21:27:58<209:18:00,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18912/203307 [21:27:58<209:18:00,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18913/203307 [21:28:03<209:17:58,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18913/203307 [21:28:03<209:17:58,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18914/203307 [21:28:07<209:17:53,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18914/203307 [21:28:07<209:17:53,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18915/203307 [21:28:11<209:17:48,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18915/203307 [21:28:11<209:17:49,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18916/203307 [21:28:14<209:17:42,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18916/203307 [21:28:14<209:17:42,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18917/203307 [21:28:19<209:17:43,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18917/203307 [21:28:19<209:17:43,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18918/203307 [21:28:24<209:17:43,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18918/203307 [21:28:24<209:17:43,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18919/203307 [21:28:28<209:17:45,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18919/203307 [21:28:28<209:17:45,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18920/203307 [21:28:32<209:17:37,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18920/203307 [21:28:32<209:17:37,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18921/203307 [21:28:36<209:17:31,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:   9%|▉         | 18921/203307 [21:28:36<209:17:31,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18922/203307 [21:28:40<209:17:30,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18922/203307 [21:28:40<209:17:30,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18923/203307 [21:28:44<209:17:25,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18923/203307 [21:28:44<209:17:25,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18924/203307 [21:28:48<209:17:18,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18924/203307 [21:28:48<209:17:18,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18925/203307 [21:28:52<209:17:16,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18925/203307 [21:28:52<209:17:16,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18926/203307 [21:28:57<209:17:18,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18926/203307 [21:28:57<209:17:18,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18927/203307 [21:29:01<209:17:13,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18927/203307 [21:29:01<209:17:13,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18928/203307 [21:29:06<209:17:14,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18928/203307 [21:29:06<209:17:14,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18929/203307 [21:29:09<209:17:07,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18929/203307 [21:29:09<209:17:07,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18930/203307 [21:29:13<209:17:02,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18930/203307 [21:29:13<209:17:02,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18931/203307 [21:29:18<209:17:02,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18931/203307 [21:29:18<209:17:02,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18932/203307 [21:29:22<209:16:55,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18932/203307 [21:29:22<209:16:55,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18933/203307 [21:29:26<209:16:52,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18933/203307 [21:29:26<209:16:52,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18934/203307 [21:29:31<209:16:55,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18934/203307 [21:29:31<209:16:55,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18935/203307 [21:29:35<209:16:49,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18935/203307 [21:29:35<209:16:49,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18936/203307 [21:29:39<209:16:49,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18936/203307 [21:29:39<209:16:49,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18937/203307 [21:29:43<209:16:42,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18937/203307 [21:29:43<209:16:42,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18938/203307 [21:29:47<209:16:37,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18938/203307 [21:29:47<209:16:38,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18939/203307 [21:29:51<209:16:32,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18939/203307 [21:29:51<209:16:32,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18940/203307 [21:29:55<209:16:29,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18940/203307 [21:29:55<209:16:29,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18941/203307 [21:29:59<209:16:21,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:   9%|▉         | 18941/203307 [21:29:59<209:16:21,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18942/203307 [21:30:03<209:16:20,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18942/203307 [21:30:03<209:16:20,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18943/203307 [21:30:08<209:16:22,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18943/203307 [21:30:08<209:16:22,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18944/203307 [21:30:12<209:16:22,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18944/203307 [21:30:12<209:16:22,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18945/203307 [21:30:16<209:16:15,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18945/203307 [21:30:16<209:16:15,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18946/203307 [21:30:20<209:16:08,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18946/203307 [21:30:20<209:16:08,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18947/203307 [21:30:24<209:16:03,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18947/203307 [21:30:24<209:16:03,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18948/203307 [21:30:28<209:15:56,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18948/203307 [21:30:28<209:15:56,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18949/203307 [21:30:32<209:15:54,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18949/203307 [21:30:32<209:15:54,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18950/203307 [21:30:36<209:15:51,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18950/203307 [21:30:36<209:15:51,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18951/203307 [21:30:41<209:15:52,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18951/203307 [21:30:41<209:15:52,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18952/203307 [21:30:45<209:15:52,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18952/203307 [21:30:45<209:15:52,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18953/203307 [21:30:50<209:15:51,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18953/203307 [21:30:50<209:15:51,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18954/203307 [21:30:53<209:15:43,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18954/203307 [21:30:53<209:15:43,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18955/203307 [21:30:57<209:15:38,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18955/203307 [21:30:57<209:15:38,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18956/203307 [21:31:01<209:15:30,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18956/203307 [21:31:01<209:15:31,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18957/203307 [21:31:05<209:15:22,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18957/203307 [21:31:05<209:15:22,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18958/203307 [21:31:09<209:15:21,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18958/203307 [21:31:09<209:15:21,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18959/203307 [21:31:14<209:15:22,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18959/203307 [21:31:14<209:15:22,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18960/203307 [21:31:18<209:15:23,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18960/203307 [21:31:18<209:15:23,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18961/203307 [21:31:23<209:15:23,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:   9%|▉         | 18961/203307 [21:31:23<209:15:23,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18962/203307 [21:31:27<209:15:16,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18962/203307 [21:31:27<209:15:17,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18963/203307 [21:31:31<209:15:11,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18963/203307 [21:31:31<209:15:11,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18964/203307 [21:31:35<209:15:05,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18964/203307 [21:31:35<209:15:05,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18965/203307 [21:31:38<209:14:58,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18965/203307 [21:31:38<209:14:58,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18966/203307 [21:31:42<209:14:53,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18966/203307 [21:31:42<209:14:53,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18967/203307 [21:31:47<209:14:53,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18967/203307 [21:31:47<209:14:53,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18968/203307 [21:31:51<209:14:52,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18968/203307 [21:31:51<209:14:52,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18969/203307 [21:31:56<209:14:51,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18969/203307 [21:31:56<209:14:51,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18970/203307 [21:31:59<209:14:44,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18970/203307 [21:31:59<209:14:44,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18971/203307 [21:32:03<209:14:39,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18971/203307 [21:32:04<209:14:39,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18972/203307 [21:32:07<209:14:31,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18972/203307 [21:32:07<209:14:31,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18973/203307 [21:32:11<209:14:24,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18973/203307 [21:32:11<209:14:24,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18974/203307 [21:32:15<209:14:17,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18974/203307 [21:32:15<209:14:18,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18975/203307 [21:32:19<209:14:18,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18975/203307 [21:32:19<209:14:18,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18976/203307 [21:32:24<209:14:17,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18976/203307 [21:32:24<209:14:17,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18977/203307 [21:32:28<209:14:10,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18977/203307 [21:32:28<209:14:10,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18978/203307 [21:32:32<209:14:09,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18978/203307 [21:32:32<209:14:09,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18979/203307 [21:32:36<209:14:05,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18979/203307 [21:32:36<209:14:05,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18980/203307 [21:32:40<209:13:57,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18980/203307 [21:32:40<209:13:57,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18981/203307 [21:32:43<209:13:50,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:   9%|▉         | 18981/203307 [21:32:43<209:13:50,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18982/203307 [21:32:47<209:13:41,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18982/203307 [21:32:47<209:13:41,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18983/203307 [21:32:52<209:13:41,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18983/203307 [21:32:52<209:13:41,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18984/203307 [21:32:56<209:13:40,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18984/203307 [21:32:56<209:13:41,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18985/203307 [21:33:00<209:13:37,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18985/203307 [21:33:00<209:13:37,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18986/203307 [21:33:05<209:13:36,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18986/203307 [21:33:05<209:13:37,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18987/203307 [21:33:09<209:13:31,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18987/203307 [21:33:09<209:13:31,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18988/203307 [21:33:12<209:13:23,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18988/203307 [21:33:12<209:13:23,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18989/203307 [21:33:16<209:13:16,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18989/203307 [21:33:16<209:13:16,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18990/203307 [21:33:20<209:13:10,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18990/203307 [21:33:20<209:13:10,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18991/203307 [21:33:24<209:13:05,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18991/203307 [21:33:24<209:13:05,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18992/203307 [21:33:28<209:13:04,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18992/203307 [21:33:28<209:13:04,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18993/203307 [21:33:33<209:13:02,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18993/203307 [21:33:33<209:13:02,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18994/203307 [21:33:37<209:13:02,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18994/203307 [21:33:37<209:13:02,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18995/203307 [21:33:42<209:13:04,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18995/203307 [21:33:42<209:13:04,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18996/203307 [21:33:45<209:12:55,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18996/203307 [21:33:45<209:12:55,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18997/203307 [21:33:49<209:12:47,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18997/203307 [21:33:49<209:12:47,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18998/203307 [21:33:53<209:12:40,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18998/203307 [21:33:53<209:12:40,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18999/203307 [21:33:57<209:12:35,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 18999/203307 [21:33:57<209:12:35,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 19000/203307 [21:34:01<209:12:32,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 19000/203307 [21:34:01<209:12:32,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 19001/203307 [21:34:06<209:12:31,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:   9%|▉         | 19001/203307 [21:34:06<209:12:31,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19002/203307 [21:34:09<209:12:23,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19002/203307 [21:34:09<209:12:23,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19003/203307 [21:34:14<209:12:25,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19003/203307 [21:34:14<209:12:25,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19004/203307 [21:34:18<209:12:24,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19004/203307 [21:34:18<209:12:24,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19005/203307 [21:34:22<209:12:16,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19005/203307 [21:34:22<209:12:16,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19006/203307 [21:34:26<209:12:09,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19006/203307 [21:34:26<209:12:09,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19007/203307 [21:34:30<209:12:03,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19007/203307 [21:34:30<209:12:04,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19008/203307 [21:34:34<209:12:03,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19008/203307 [21:34:34<209:12:03,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19009/203307 [21:34:39<209:12:02,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19009/203307 [21:34:39<209:12:02,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19010/203307 [21:34:43<209:11:57,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19010/203307 [21:34:43<209:11:58,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19011/203307 [21:34:47<209:11:58,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19011/203307 [21:34:47<209:11:59,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19012/203307 [21:34:52<209:11:58,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19012/203307 [21:34:52<209:11:58,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19013/203307 [21:34:55<209:11:50,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19013/203307 [21:34:55<209:11:50,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19014/203307 [21:34:59<209:11:42,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19014/203307 [21:34:59<209:11:42,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19015/203307 [21:35:03<209:11:37,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19015/203307 [21:35:03<209:11:37,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19016/203307 [21:35:07<209:11:29,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19016/203307 [21:35:07<209:11:30,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19017/203307 [21:35:11<209:11:28,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19017/203307 [21:35:11<209:11:28,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19018/203307 [21:35:16<209:11:27,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19018/203307 [21:35:16<209:11:27,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19019/203307 [21:35:20<209:11:28,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19019/203307 [21:35:20<209:11:28,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19020/203307 [21:35:24<209:11:21,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19020/203307 [21:35:24<209:11:21,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19021/203307 [21:35:28<209:11:21,  0.24it/s, v_num=t5e6, training/loss=0.0937]Epoch 0:   9%|▉         | 19021/203307 [21:35:28<209:11:21,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19022/203307 [21:35:32<209:11:14,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19022/203307 [21:35:32<209:11:14,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19023/203307 [21:35:36<209:11:08,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19023/203307 [21:35:36<209:11:08,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19024/203307 [21:35:40<209:11:01,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19024/203307 [21:35:40<209:11:01,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19025/203307 [21:35:44<209:10:59,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19025/203307 [21:35:44<209:10:59,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19026/203307 [21:35:49<209:10:57,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19026/203307 [21:35:49<209:10:57,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19027/203307 [21:35:53<209:10:52,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19027/203307 [21:35:53<209:10:52,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19028/203307 [21:35:57<209:10:53,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19028/203307 [21:35:57<209:10:53,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19029/203307 [21:36:01<209:10:45,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19029/203307 [21:36:01<209:10:45,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19030/203307 [21:36:05<209:10:45,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19030/203307 [21:36:05<209:10:45,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19031/203307 [21:36:09<209:10:39,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19031/203307 [21:36:09<209:10:39,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19032/203307 [21:36:13<209:10:32,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19032/203307 [21:36:13<209:10:32,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19033/203307 [21:36:17<209:10:30,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19033/203307 [21:36:17<209:10:30,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19034/203307 [21:36:22<209:10:29,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19034/203307 [21:36:22<209:10:29,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19035/203307 [21:36:26<209:10:23,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19035/203307 [21:36:26<209:10:23,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19036/203307 [21:36:30<209:10:24,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19036/203307 [21:36:30<209:10:24,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19037/203307 [21:36:34<209:10:17,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19037/203307 [21:36:34<209:10:17,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19038/203307 [21:36:39<209:10:18,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19038/203307 [21:36:39<209:10:18,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19039/203307 [21:36:43<209:10:16,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19039/203307 [21:36:43<209:10:16,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19040/203307 [21:36:47<209:10:10,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19040/203307 [21:36:47<209:10:10,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19041/203307 [21:36:51<209:10:03,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:   9%|▉         | 19041/203307 [21:36:51<209:10:03,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19042/203307 [21:36:55<209:10:01,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19042/203307 [21:36:55<209:10:01,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19043/203307 [21:36:59<209:10:02,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19043/203307 [21:36:59<209:10:02,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19044/203307 [21:37:04<209:10:01,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19044/203307 [21:37:04<209:10:01,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19045/203307 [21:37:08<209:09:53,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19045/203307 [21:37:08<209:09:53,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19046/203307 [21:37:12<209:09:48,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19046/203307 [21:37:12<209:09:48,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19047/203307 [21:37:17<209:09:55,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19047/203307 [21:37:17<209:09:55,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19048/203307 [21:37:21<209:09:50,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19048/203307 [21:37:21<209:09:50,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19049/203307 [21:37:25<209:09:44,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19049/203307 [21:37:25<209:09:44,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19050/203307 [21:37:29<209:09:42,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19050/203307 [21:37:29<209:09:42,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19051/203307 [21:37:34<209:09:42,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19051/203307 [21:37:34<209:09:42,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19052/203307 [21:37:37<209:09:35,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19052/203307 [21:37:37<209:09:35,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19053/203307 [21:37:42<209:09:36,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19053/203307 [21:37:42<209:09:36,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19054/203307 [21:37:46<209:09:31,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19054/203307 [21:37:46<209:09:31,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19055/203307 [21:37:50<209:09:27,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19055/203307 [21:37:50<209:09:27,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19056/203307 [21:37:54<209:09:27,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19056/203307 [21:37:55<209:09:27,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19057/203307 [21:37:59<209:09:24,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19057/203307 [21:37:59<209:09:24,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19058/203307 [21:38:03<209:09:21,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19058/203307 [21:38:03<209:09:22,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19059/203307 [21:38:08<209:09:22,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19059/203307 [21:38:08<209:09:22,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19060/203307 [21:38:11<209:09:14,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19060/203307 [21:38:11<209:09:14,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19061/203307 [21:38:16<209:09:14,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:   9%|▉         | 19061/203307 [21:38:16<209:09:14,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19062/203307 [21:38:20<209:09:09,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19062/203307 [21:38:20<209:09:09,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19063/203307 [21:38:24<209:09:03,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19063/203307 [21:38:24<209:09:03,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19064/203307 [21:38:28<209:09:02,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19064/203307 [21:38:28<209:09:02,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19065/203307 [21:38:32<209:08:54,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19065/203307 [21:38:32<209:08:54,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19066/203307 [21:38:36<209:08:53,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19066/203307 [21:38:36<209:08:53,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19067/203307 [21:38:41<209:08:55,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19067/203307 [21:38:41<209:08:55,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19068/203307 [21:38:45<209:08:53,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19068/203307 [21:38:45<209:08:53,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19069/203307 [21:38:50<209:08:53,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19069/203307 [21:38:50<209:08:53,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19070/203307 [21:38:54<209:08:48,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19070/203307 [21:38:54<209:08:48,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19071/203307 [21:38:58<209:08:44,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19071/203307 [21:38:58<209:08:44,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19072/203307 [21:39:02<209:08:38,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19072/203307 [21:39:02<209:08:38,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19073/203307 [21:39:06<209:08:38,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19073/203307 [21:39:06<209:08:38,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19074/203307 [21:39:10<209:08:33,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19074/203307 [21:39:10<209:08:33,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19075/203307 [21:39:15<209:08:34,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19075/203307 [21:39:15<209:08:34,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19076/203307 [21:39:19<209:08:33,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19076/203307 [21:39:19<209:08:33,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19077/203307 [21:39:23<209:08:26,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19077/203307 [21:39:23<209:08:26,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19078/203307 [21:39:28<209:08:28,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19078/203307 [21:39:28<209:08:28,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19079/203307 [21:39:32<209:08:24,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19079/203307 [21:39:32<209:08:24,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19080/203307 [21:39:35<209:08:16,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19080/203307 [21:39:35<209:08:16,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19081/203307 [21:39:39<209:08:09,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:   9%|▉         | 19081/203307 [21:39:39<209:08:09,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19082/203307 [21:39:44<209:08:10,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19082/203307 [21:39:44<209:08:10,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19083/203307 [21:39:48<209:08:11,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19083/203307 [21:39:48<209:08:11,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19084/203307 [21:39:53<209:08:10,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19084/203307 [21:39:53<209:08:10,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19085/203307 [21:39:57<209:08:03,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19085/203307 [21:39:57<209:08:03,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19086/203307 [21:40:01<209:08:04,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19086/203307 [21:40:01<209:08:04,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19087/203307 [21:40:05<209:07:59,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19087/203307 [21:40:05<209:07:59,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19088/203307 [21:40:09<209:07:51,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19088/203307 [21:40:09<209:07:51,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19089/203307 [21:40:13<209:07:44,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19089/203307 [21:40:13<209:07:44,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19090/203307 [21:40:17<209:07:44,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19090/203307 [21:40:17<209:07:44,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19091/203307 [21:40:21<209:07:38,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19091/203307 [21:40:21<209:07:38,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19092/203307 [21:40:25<209:07:36,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19092/203307 [21:40:25<209:07:36,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19093/203307 [21:40:30<209:07:35,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19093/203307 [21:40:30<209:07:36,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19094/203307 [21:40:35<209:07:38,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19094/203307 [21:40:35<209:07:38,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19095/203307 [21:40:39<209:07:35,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19095/203307 [21:40:39<209:07:35,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19096/203307 [21:40:43<209:07:27,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19096/203307 [21:40:43<209:07:27,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19097/203307 [21:40:46<209:07:20,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19097/203307 [21:40:46<209:07:20,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19098/203307 [21:40:50<209:07:16,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19098/203307 [21:40:50<209:07:16,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19099/203307 [21:40:55<209:07:18,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19099/203307 [21:40:55<209:07:18,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19100/203307 [21:40:59<209:07:16,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19100/203307 [21:40:59<209:07:16,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19101/203307 [21:41:04<209:07:14,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:   9%|▉         | 19101/203307 [21:41:04<209:07:14,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19102/203307 [21:41:08<209:07:13,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19102/203307 [21:41:08<209:07:13,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19103/203307 [21:41:13<209:07:13,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19103/203307 [21:41:13<209:07:13,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19104/203307 [21:41:16<209:07:05,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19104/203307 [21:41:16<209:07:05,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19105/203307 [21:41:20<209:07:00,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19105/203307 [21:41:20<209:07:00,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19106/203307 [21:41:24<209:06:55,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19106/203307 [21:41:24<209:06:55,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19107/203307 [21:41:28<209:06:50,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19107/203307 [21:41:28<209:06:50,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19108/203307 [21:41:33<209:06:50,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19108/203307 [21:41:33<209:06:51,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19109/203307 [21:41:37<209:06:49,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19109/203307 [21:41:37<209:06:49,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19110/203307 [21:41:41<209:06:45,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19110/203307 [21:41:41<209:06:45,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19111/203307 [21:41:46<209:06:46,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19111/203307 [21:41:46<209:06:46,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19112/203307 [21:41:50<209:06:40,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19112/203307 [21:41:50<209:06:40,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19113/203307 [21:41:53<209:06:32,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19113/203307 [21:41:54<209:06:32,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19114/203307 [21:41:58<209:06:28,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19114/203307 [21:41:58<209:06:28,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19115/203307 [21:42:02<209:06:24,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19115/203307 [21:42:02<209:06:24,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19116/203307 [21:42:06<209:06:23,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19116/203307 [21:42:06<209:06:24,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19117/203307 [21:42:10<209:06:22,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19117/203307 [21:42:10<209:06:22,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19118/203307 [21:42:15<209:06:22,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19118/203307 [21:42:15<209:06:23,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19119/203307 [21:42:20<209:06:25,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19119/203307 [21:42:20<209:06:25,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19120/203307 [21:42:24<209:06:22,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19120/203307 [21:42:24<209:06:22,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19121/203307 [21:42:28<209:06:16,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:   9%|▉         | 19121/203307 [21:42:28<209:06:16,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19122/203307 [21:42:32<209:06:11,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19122/203307 [21:42:32<209:06:11,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19123/203307 [21:42:36<209:06:06,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19123/203307 [21:42:36<209:06:07,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19124/203307 [21:42:40<209:05:59,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19124/203307 [21:42:40<209:05:59,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19125/203307 [21:42:44<209:05:58,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19125/203307 [21:42:44<209:05:58,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19126/203307 [21:42:49<209:05:58,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19126/203307 [21:42:49<209:05:58,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19127/203307 [21:42:53<209:05:53,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19127/203307 [21:42:53<209:05:53,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19128/203307 [21:42:57<209:05:53,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19128/203307 [21:42:57<209:05:53,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19129/203307 [21:43:01<209:05:50,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19129/203307 [21:43:01<209:05:50,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19130/203307 [21:43:05<209:05:45,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19130/203307 [21:43:05<209:05:45,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19131/203307 [21:43:09<209:05:40,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19131/203307 [21:43:09<209:05:40,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19132/203307 [21:43:13<209:05:32,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19132/203307 [21:43:13<209:05:32,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19133/203307 [21:43:17<209:05:29,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19133/203307 [21:43:17<209:05:29,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19134/203307 [21:43:22<209:05:32,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19134/203307 [21:43:22<209:05:32,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19135/203307 [21:43:26<209:05:27,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19135/203307 [21:43:26<209:05:27,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19136/203307 [21:43:30<209:05:27,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19136/203307 [21:43:30<209:05:27,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19137/203307 [21:43:34<209:05:21,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19137/203307 [21:43:34<209:05:21,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19138/203307 [21:43:39<209:05:19,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19138/203307 [21:43:39<209:05:19,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19139/203307 [21:43:43<209:05:13,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19139/203307 [21:43:43<209:05:13,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19140/203307 [21:43:46<209:05:05,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19140/203307 [21:43:46<209:05:05,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19141/203307 [21:43:50<209:04:57,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:   9%|▉         | 19141/203307 [21:43:50<209:04:57,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19142/203307 [21:43:55<209:05:03,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19142/203307 [21:43:55<209:05:03,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19143/203307 [21:44:00<209:05:04,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19143/203307 [21:44:00<209:05:04,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19144/203307 [21:44:04<209:05:02,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19144/203307 [21:44:04<209:05:02,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19145/203307 [21:44:08<209:04:54,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19145/203307 [21:44:08<209:04:54,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19146/203307 [21:44:12<209:04:50,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19146/203307 [21:44:12<209:04:50,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19147/203307 [21:44:16<209:04:48,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19147/203307 [21:44:16<209:04:48,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19148/203307 [21:44:20<209:04:41,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19148/203307 [21:44:20<209:04:41,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19149/203307 [21:44:24<209:04:33,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19149/203307 [21:44:24<209:04:33,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19150/203307 [21:44:28<209:04:31,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19150/203307 [21:44:28<209:04:31,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19151/203307 [21:44:32<209:04:30,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19151/203307 [21:44:32<209:04:30,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19152/203307 [21:44:36<209:04:23,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19152/203307 [21:44:36<209:04:23,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19153/203307 [21:44:41<209:04:24,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19153/203307 [21:44:41<209:04:24,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19154/203307 [21:44:45<209:04:19,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19154/203307 [21:44:45<209:04:20,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19155/203307 [21:44:49<209:04:14,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19155/203307 [21:44:49<209:04:14,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19156/203307 [21:44:53<209:04:13,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19156/203307 [21:44:53<209:04:13,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19157/203307 [21:44:57<209:04:06,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19157/203307 [21:44:57<209:04:06,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19158/203307 [21:45:01<209:04:06,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19158/203307 [21:45:01<209:04:06,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19159/203307 [21:45:06<209:04:07,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19159/203307 [21:45:06<209:04:07,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19160/203307 [21:45:10<209:04:06,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19160/203307 [21:45:10<209:04:06,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19161/203307 [21:45:15<209:04:05,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:   9%|▉         | 19161/203307 [21:45:15<209:04:05,  0.24it/s, v_num=t5e6, training/loss=0.083] Epoch 0:   9%|▉         | 19162/203307 [21:45:19<209:03:59,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19162/203307 [21:45:19<209:03:59,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19163/203307 [21:45:23<209:03:53,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19163/203307 [21:45:23<209:03:53,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19164/203307 [21:45:26<209:03:46,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19164/203307 [21:45:26<209:03:46,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19165/203307 [21:45:31<209:03:43,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19165/203307 [21:45:31<209:03:43,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19166/203307 [21:45:34<209:03:38,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19166/203307 [21:45:34<209:03:38,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19167/203307 [21:45:39<209:03:38,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19167/203307 [21:45:39<209:03:38,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19168/203307 [21:45:43<209:03:37,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19168/203307 [21:45:43<209:03:37,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19169/203307 [21:45:48<209:03:38,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19169/203307 [21:45:48<209:03:38,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19170/203307 [21:45:52<209:03:31,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19170/203307 [21:45:52<209:03:32,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19171/203307 [21:45:56<209:03:27,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19171/203307 [21:45:56<209:03:27,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19172/203307 [21:46:00<209:03:20,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19172/203307 [21:46:00<209:03:20,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19173/203307 [21:46:04<209:03:13,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19173/203307 [21:46:04<209:03:13,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19174/203307 [21:46:08<209:03:11,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19174/203307 [21:46:08<209:03:11,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19175/203307 [21:46:12<209:03:11,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19175/203307 [21:46:12<209:03:11,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19176/203307 [21:46:17<209:03:10,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19176/203307 [21:46:17<209:03:10,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19177/203307 [21:46:21<209:03:10,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19177/203307 [21:46:21<209:03:10,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19178/203307 [21:46:26<209:03:09,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19178/203307 [21:46:26<209:03:09,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19179/203307 [21:46:30<209:03:04,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19179/203307 [21:46:30<209:03:04,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19180/203307 [21:46:33<209:02:57,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19180/203307 [21:46:33<209:02:57,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19181/203307 [21:46:37<209:02:50,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:   9%|▉         | 19181/203307 [21:46:37<209:02:50,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19182/203307 [21:46:41<209:02:43,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19182/203307 [21:46:41<209:02:43,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19183/203307 [21:46:45<209:02:43,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19183/203307 [21:46:45<209:02:43,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19184/203307 [21:46:50<209:02:42,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19184/203307 [21:46:50<209:02:42,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19185/203307 [21:46:54<209:02:34,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19185/203307 [21:46:54<209:02:34,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19186/203307 [21:46:58<209:02:34,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19186/203307 [21:46:58<209:02:34,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19187/203307 [21:47:02<209:02:27,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19187/203307 [21:47:02<209:02:27,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19188/203307 [21:47:06<209:02:19,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19188/203307 [21:47:06<209:02:19,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19189/203307 [21:47:09<209:02:11,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19189/203307 [21:47:09<209:02:11,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19190/203307 [21:47:13<209:02:05,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19190/203307 [21:47:13<209:02:05,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19191/203307 [21:47:17<209:01:57,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19191/203307 [21:47:17<209:01:57,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19192/203307 [21:47:21<209:01:57,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19192/203307 [21:47:21<209:01:57,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19193/203307 [21:47:26<209:01:56,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19193/203307 [21:47:26<209:01:56,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19194/203307 [21:47:30<209:01:56,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19194/203307 [21:47:30<209:01:56,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19195/203307 [21:47:34<209:01:49,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19195/203307 [21:47:34<209:01:49,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19196/203307 [21:47:38<209:01:42,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19196/203307 [21:47:38<209:01:42,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19197/203307 [21:47:42<209:01:34,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19197/203307 [21:47:42<209:01:34,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19198/203307 [21:47:45<209:01:28,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19198/203307 [21:47:45<209:01:28,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19199/203307 [21:47:49<209:01:20,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19199/203307 [21:47:49<209:01:20,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19200/203307 [21:47:53<209:01:19,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19200/203307 [21:47:53<209:01:19,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19201/203307 [21:47:58<209:01:17,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:   9%|▉         | 19201/203307 [21:47:58<209:01:17,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19202/203307 [21:48:02<209:01:11,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19202/203307 [21:48:02<209:01:11,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19203/203307 [21:48:06<209:01:10,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19203/203307 [21:48:06<209:01:10,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19204/203307 [21:48:10<209:01:03,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19204/203307 [21:48:10<209:01:03,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19205/203307 [21:48:14<209:00:56,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19205/203307 [21:48:14<209:00:56,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19206/203307 [21:48:18<209:00:50,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19206/203307 [21:48:18<209:00:50,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19207/203307 [21:48:21<209:00:43,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19207/203307 [21:48:21<209:00:43,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19208/203307 [21:48:26<209:00:42,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19208/203307 [21:48:26<209:00:42,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19209/203307 [21:48:30<209:00:42,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19209/203307 [21:48:30<209:00:42,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19210/203307 [21:48:35<209:00:40,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19210/203307 [21:48:35<209:00:40,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19211/203307 [21:48:39<209:00:40,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19211/203307 [21:48:39<209:00:40,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19212/203307 [21:48:44<209:00:42,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19212/203307 [21:48:44<209:00:42,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19213/203307 [21:48:47<209:00:34,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19213/203307 [21:48:47<209:00:34,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19214/203307 [21:48:51<209:00:26,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19214/203307 [21:48:51<209:00:27,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19215/203307 [21:48:55<209:00:20,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19215/203307 [21:48:55<209:00:20,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19216/203307 [21:48:59<209:00:13,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19216/203307 [21:48:59<209:00:13,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19217/203307 [21:49:03<209:00:12,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19217/203307 [21:49:03<209:00:12,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19218/203307 [21:49:08<209:00:11,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19218/203307 [21:49:08<209:00:11,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19219/203307 [21:49:12<209:00:09,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19219/203307 [21:49:12<209:00:09,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19220/203307 [21:49:16<209:00:09,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19220/203307 [21:49:16<209:00:09,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19221/203307 [21:49:20<209:00:02,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:   9%|▉         | 19221/203307 [21:49:20<209:00:02,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19222/203307 [21:49:24<208:59:55,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19222/203307 [21:49:24<208:59:55,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19223/203307 [21:49:28<208:59:48,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19223/203307 [21:49:28<208:59:48,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19224/203307 [21:49:32<208:59:42,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19224/203307 [21:49:32<208:59:42,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19225/203307 [21:49:36<208:59:40,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19225/203307 [21:49:36<208:59:41,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19226/203307 [21:49:40<208:59:39,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19226/203307 [21:49:40<208:59:39,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19227/203307 [21:49:44<208:59:31,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19227/203307 [21:49:44<208:59:31,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19228/203307 [21:49:49<208:59:31,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19228/203307 [21:49:49<208:59:31,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19229/203307 [21:49:53<208:59:31,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19229/203307 [21:49:53<208:59:31,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19230/203307 [21:49:57<208:59:24,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19230/203307 [21:49:57<208:59:24,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19231/203307 [21:50:01<208:59:16,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19231/203307 [21:50:01<208:59:16,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19232/203307 [21:50:04<208:59:10,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19232/203307 [21:50:04<208:59:10,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19233/203307 [21:50:09<208:59:07,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19233/203307 [21:50:09<208:59:07,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19234/203307 [21:50:13<208:59:06,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19234/203307 [21:50:13<208:59:06,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19235/203307 [21:50:17<208:58:59,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19235/203307 [21:50:17<208:58:59,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19236/203307 [21:50:21<208:58:58,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19236/203307 [21:50:21<208:58:58,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19237/203307 [21:50:26<208:58:56,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19237/203307 [21:50:26<208:58:56,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19238/203307 [21:50:30<208:58:55,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19238/203307 [21:50:30<208:58:55,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19239/203307 [21:50:34<208:58:48,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19239/203307 [21:50:34<208:58:48,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19240/203307 [21:50:37<208:58:41,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19240/203307 [21:50:37<208:58:41,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19241/203307 [21:50:41<208:58:33,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:   9%|▉         | 19241/203307 [21:50:41<208:58:33,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19242/203307 [21:50:46<208:58:32,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19242/203307 [21:50:46<208:58:32,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19243/203307 [21:50:50<208:58:30,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19243/203307 [21:50:50<208:58:30,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19244/203307 [21:50:54<208:58:30,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19244/203307 [21:50:54<208:58:30,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19245/203307 [21:50:58<208:58:25,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19245/203307 [21:50:58<208:58:25,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19246/203307 [21:51:03<208:58:25,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19246/203307 [21:51:03<208:58:25,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19247/203307 [21:51:07<208:58:18,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19247/203307 [21:51:07<208:58:18,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19248/203307 [21:51:11<208:58:11,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19248/203307 [21:51:11<208:58:11,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19249/203307 [21:51:14<208:58:05,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19249/203307 [21:51:14<208:58:05,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19250/203307 [21:51:19<208:58:03,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19250/203307 [21:51:19<208:58:03,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19251/203307 [21:51:23<208:58:02,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19251/203307 [21:51:23<208:58:02,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19252/203307 [21:51:27<208:57:56,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19252/203307 [21:51:27<208:57:56,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19253/203307 [21:51:31<208:57:55,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19253/203307 [21:51:31<208:57:55,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19254/203307 [21:51:35<208:57:50,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19254/203307 [21:51:35<208:57:50,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19255/203307 [21:51:40<208:57:50,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19255/203307 [21:51:40<208:57:50,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19256/203307 [21:51:44<208:57:44,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19256/203307 [21:51:44<208:57:44,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19257/203307 [21:51:48<208:57:37,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19257/203307 [21:51:48<208:57:37,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19258/203307 [21:51:52<208:57:34,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19258/203307 [21:51:52<208:57:34,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19259/203307 [21:51:56<208:57:32,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19259/203307 [21:51:56<208:57:32,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19260/203307 [21:52:00<208:57:28,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19260/203307 [21:52:00<208:57:28,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19261/203307 [21:52:05<208:57:27,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:   9%|▉         | 19261/203307 [21:52:05<208:57:27,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19262/203307 [21:52:08<208:57:19,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19262/203307 [21:52:08<208:57:19,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19263/203307 [21:52:12<208:57:11,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19263/203307 [21:52:12<208:57:11,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19264/203307 [21:52:17<208:57:13,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19264/203307 [21:52:17<208:57:13,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19265/203307 [21:52:20<208:57:05,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19265/203307 [21:52:20<208:57:05,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19266/203307 [21:52:24<208:56:58,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19266/203307 [21:52:24<208:56:58,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19267/203307 [21:52:28<208:56:56,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19267/203307 [21:52:28<208:56:56,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19268/203307 [21:52:33<208:56:54,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19268/203307 [21:52:33<208:56:54,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19269/203307 [21:52:37<208:56:53,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19269/203307 [21:52:37<208:56:53,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19270/203307 [21:52:41<208:56:47,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19270/203307 [21:52:41<208:56:47,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19271/203307 [21:52:45<208:56:39,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19271/203307 [21:52:45<208:56:39,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19272/203307 [21:52:49<208:56:40,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19272/203307 [21:52:49<208:56:40,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19273/203307 [21:52:53<208:56:36,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19273/203307 [21:52:53<208:56:36,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19274/203307 [21:52:57<208:56:28,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19274/203307 [21:52:57<208:56:28,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19275/203307 [21:53:01<208:56:26,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19275/203307 [21:53:01<208:56:26,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19276/203307 [21:53:06<208:56:25,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19276/203307 [21:53:06<208:56:25,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19277/203307 [21:53:10<208:56:17,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19277/203307 [21:53:10<208:56:17,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19278/203307 [21:53:14<208:56:16,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19278/203307 [21:53:14<208:56:16,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19279/203307 [21:53:18<208:56:10,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19279/203307 [21:53:18<208:56:10,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19280/203307 [21:53:22<208:56:02,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19280/203307 [21:53:22<208:56:03,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19281/203307 [21:53:26<208:56:04,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:   9%|▉         | 19281/203307 [21:53:26<208:56:04,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19282/203307 [21:53:30<208:56:01,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19282/203307 [21:53:30<208:56:01,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19283/203307 [21:53:35<208:55:58,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19283/203307 [21:53:35<208:55:58,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19284/203307 [21:53:39<208:55:57,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19284/203307 [21:53:39<208:55:57,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19285/203307 [21:53:43<208:55:50,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19285/203307 [21:53:43<208:55:50,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19286/203307 [21:53:47<208:55:50,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19286/203307 [21:53:47<208:55:50,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19287/203307 [21:53:51<208:55:42,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19287/203307 [21:53:51<208:55:42,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19288/203307 [21:53:55<208:55:35,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19288/203307 [21:53:55<208:55:35,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19289/203307 [21:53:58<208:55:27,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19289/203307 [21:53:58<208:55:27,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19290/203307 [21:54:03<208:55:28,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19290/203307 [21:54:03<208:55:28,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19291/203307 [21:54:07<208:55:26,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19291/203307 [21:54:07<208:55:26,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19292/203307 [21:54:12<208:55:25,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19292/203307 [21:54:12<208:55:25,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19293/203307 [21:54:16<208:55:24,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19293/203307 [21:54:16<208:55:24,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19294/203307 [21:54:21<208:55:23,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19294/203307 [21:54:21<208:55:23,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19295/203307 [21:54:24<208:55:16,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19295/203307 [21:54:24<208:55:16,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19296/203307 [21:54:28<208:55:09,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19296/203307 [21:54:28<208:55:09,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19297/203307 [21:54:32<208:55:02,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19297/203307 [21:54:32<208:55:02,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19298/203307 [21:54:36<208:55:02,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19298/203307 [21:54:36<208:55:02,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19299/203307 [21:54:40<208:54:56,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19299/203307 [21:54:40<208:54:56,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19300/203307 [21:54:45<208:54:54,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19300/203307 [21:54:45<208:54:54,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19301/203307 [21:54:49<208:54:52,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:   9%|▉         | 19301/203307 [21:54:49<208:54:52,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:   9%|▉         | 19302/203307 [21:54:53<208:54:44,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:   9%|▉         | 19302/203307 [21:54:53<208:54:44,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:   9%|▉         | 19303/203307 [21:54:57<208:54:43,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:   9%|▉         | 19303/203307 [21:54:57<208:54:43,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:   9%|▉         | 19304/203307 [21:55:01<208:54:35,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:   9%|▉         | 19304/203307 [21:55:01<208:54:35,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:   9%|▉         | 19305/203307 [21:55:05<208:54:28,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:   9%|▉         | 19305/203307 [21:55:05<208:54:28,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:   9%|▉         | 19306/203307 [21:55:08<208:54:21,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:   9%|▉         | 19306/203307 [21:55:08<208:54:21,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:   9%|▉         | 19307/203307 [21:55:13<208:54:21,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:   9%|▉         | 19307/203307 [21:55:13<208:54:21,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:   9%|▉         | 19308/203307 [21:55:17<208:54:19,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:   9%|▉         | 19308/203307 [21:55:17<208:54:19,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:   9%|▉         | 19309/203307 [21:55:22<208:54:18,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:   9%|▉         | 19309/203307 [21:55:22<208:54:18,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:   9%|▉         | 19310/203307 [21:55:25<208:54:11,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:   9%|▉         | 19310/203307 [21:55:25<208:54:11,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:   9%|▉         | 19311/203307 [21:55:30<208:54:10,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:   9%|▉         | 19311/203307 [21:55:30<208:54:10,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:   9%|▉         | 19312/203307 [21:55:33<208:54:03,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:   9%|▉         | 19312/203307 [21:55:33<208:54:03,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:   9%|▉         | 19313/203307 [21:55:37<208:53:55,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:   9%|▉         | 19313/203307 [21:55:37<208:53:56,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:   9%|▉         | 19314/203307 [21:55:41<208:53:48,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:   9%|▉         | 19314/203307 [21:55:41<208:53:48,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:  10%|▉         | 19315/203307 [21:55:45<208:53:40,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:  10%|▉         | 19315/203307 [21:55:45<208:53:40,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:  10%|▉         | 19316/203307 [21:55:49<208:53:41,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:  10%|▉         | 19316/203307 [21:55:49<208:53:42,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:  10%|▉         | 19317/203307 [21:55:54<208:53:40,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:  10%|▉         | 19317/203307 [21:55:54<208:53:40,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:  10%|▉         | 19318/203307 [21:55:58<208:53:38,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:  10%|▉         | 19318/203307 [21:55:58<208:53:38,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:  10%|▉         | 19319/203307 [21:56:02<208:53:36,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:  10%|▉         | 19319/203307 [21:56:02<208:53:36,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:  10%|▉         | 19320/203307 [21:56:06<208:53:29,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:  10%|▉         | 19320/203307 [21:56:06<208:53:29,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:  10%|▉         | 19321/203307 [21:56:10<208:53:21,  0.24it/s, v_num=t5e6, training/loss=0.0703]Epoch 0:  10%|▉         | 19321/203307 [21:56:10<208:53:21,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19322/203307 [21:56:14<208:53:14,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19322/203307 [21:56:14<208:53:14,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19323/203307 [21:56:17<208:53:07,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19323/203307 [21:56:17<208:53:07,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19324/203307 [21:56:22<208:53:06,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19324/203307 [21:56:22<208:53:06,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19325/203307 [21:56:26<208:53:05,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19325/203307 [21:56:26<208:53:05,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19326/203307 [21:56:30<208:53:04,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19326/203307 [21:56:31<208:53:04,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19327/203307 [21:56:35<208:53:01,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19327/203307 [21:56:35<208:53:01,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19328/203307 [21:56:39<208:53:01,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19328/203307 [21:56:39<208:53:01,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19329/203307 [21:56:43<208:52:53,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19329/203307 [21:56:43<208:52:53,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19330/203307 [21:56:47<208:52:46,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19330/203307 [21:56:47<208:52:46,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19331/203307 [21:56:51<208:52:39,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19331/203307 [21:56:51<208:52:39,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19332/203307 [21:56:54<208:52:31,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19332/203307 [21:56:54<208:52:31,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19333/203307 [21:56:59<208:52:31,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19333/203307 [21:56:59<208:52:31,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19334/203307 [21:57:03<208:52:29,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19334/203307 [21:57:03<208:52:29,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19335/203307 [21:57:07<208:52:22,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19335/203307 [21:57:07<208:52:22,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19336/203307 [21:57:11<208:52:21,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19336/203307 [21:57:11<208:52:21,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19337/203307 [21:57:15<208:52:13,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19337/203307 [21:57:15<208:52:13,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19338/203307 [21:57:19<208:52:06,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19338/203307 [21:57:19<208:52:06,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19339/203307 [21:57:23<208:52:00,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19339/203307 [21:57:23<208:52:00,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19340/203307 [21:57:26<208:51:53,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19340/203307 [21:57:26<208:51:53,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19341/203307 [21:57:30<208:51:47,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 19341/203307 [21:57:30<208:51:47,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19342/203307 [21:57:35<208:51:47,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19342/203307 [21:57:35<208:51:47,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19343/203307 [21:57:39<208:51:46,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19343/203307 [21:57:39<208:51:46,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19344/203307 [21:57:44<208:51:45,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19344/203307 [21:57:44<208:51:45,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19345/203307 [21:57:48<208:51:42,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19345/203307 [21:57:48<208:51:42,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19346/203307 [21:57:52<208:51:35,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19346/203307 [21:57:52<208:51:35,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19347/203307 [21:57:55<208:51:27,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19347/203307 [21:57:55<208:51:27,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19348/203307 [21:57:59<208:51:20,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19348/203307 [21:57:59<208:51:20,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19349/203307 [21:58:03<208:51:14,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19349/203307 [21:58:03<208:51:14,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19350/203307 [21:58:07<208:51:14,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19350/203307 [21:58:07<208:51:14,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19351/203307 [21:58:12<208:51:12,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19351/203307 [21:58:12<208:51:12,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19352/203307 [21:58:16<208:51:05,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19352/203307 [21:58:16<208:51:05,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19353/203307 [21:58:20<208:51:05,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19353/203307 [21:58:20<208:51:05,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19354/203307 [21:58:24<208:51:02,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19354/203307 [21:58:24<208:51:02,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19355/203307 [21:58:28<208:50:55,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19355/203307 [21:58:28<208:50:55,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19356/203307 [21:58:32<208:50:49,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19356/203307 [21:58:32<208:50:49,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19357/203307 [21:58:36<208:50:42,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19357/203307 [21:58:36<208:50:42,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19358/203307 [21:58:40<208:50:40,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19358/203307 [21:58:40<208:50:40,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19359/203307 [21:58:44<208:50:39,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19359/203307 [21:58:44<208:50:39,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19360/203307 [21:58:48<208:50:31,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19360/203307 [21:58:48<208:50:31,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19361/203307 [21:58:52<208:50:30,  0.24it/s, v_num=t5e6, training/loss=0.0774]Epoch 0:  10%|▉         | 19361/203307 [21:58:52<208:50:30,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19362/203307 [21:58:56<208:50:22,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19362/203307 [21:58:56<208:50:23,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19363/203307 [21:59:00<208:50:19,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19363/203307 [21:59:00<208:50:19,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19364/203307 [21:59:04<208:50:12,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19364/203307 [21:59:04<208:50:12,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19365/203307 [21:59:08<208:50:04,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19365/203307 [21:59:08<208:50:04,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19366/203307 [21:59:11<208:49:56,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19366/203307 [21:59:11<208:49:56,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19367/203307 [21:59:16<208:49:54,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19367/203307 [21:59:16<208:49:54,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19368/203307 [21:59:20<208:49:53,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19368/203307 [21:59:20<208:49:53,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19369/203307 [21:59:25<208:49:52,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19369/203307 [21:59:25<208:49:52,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19370/203307 [21:59:28<208:49:45,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19370/203307 [21:59:28<208:49:45,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19371/203307 [21:59:32<208:49:38,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19371/203307 [21:59:32<208:49:38,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19372/203307 [21:59:36<208:49:35,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19372/203307 [21:59:36<208:49:35,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19373/203307 [21:59:40<208:49:28,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19373/203307 [21:59:40<208:49:28,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19374/203307 [21:59:44<208:49:20,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19374/203307 [21:59:44<208:49:20,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19375/203307 [21:59:48<208:49:18,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19375/203307 [21:59:48<208:49:18,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19376/203307 [21:59:52<208:49:16,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19376/203307 [21:59:52<208:49:16,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19377/203307 [21:59:56<208:49:09,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19377/203307 [21:59:56<208:49:09,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19378/203307 [22:00:01<208:49:07,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19378/203307 [22:00:01<208:49:07,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19379/203307 [22:00:04<208:48:59,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19379/203307 [22:00:04<208:48:59,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19380/203307 [22:00:08<208:48:52,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19380/203307 [22:00:08<208:48:52,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19381/203307 [22:00:12<208:48:49,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  10%|▉         | 19381/203307 [22:00:12<208:48:49,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19382/203307 [22:00:16<208:48:42,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19382/203307 [22:00:16<208:48:42,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19383/203307 [22:00:20<208:48:39,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19383/203307 [22:00:20<208:48:39,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19384/203307 [22:00:24<208:48:37,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19384/203307 [22:00:24<208:48:37,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19385/203307 [22:00:29<208:48:35,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19385/203307 [22:00:29<208:48:35,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19386/203307 [22:00:33<208:48:33,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19386/203307 [22:00:33<208:48:33,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19387/203307 [22:00:37<208:48:26,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19387/203307 [22:00:37<208:48:26,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19388/203307 [22:00:41<208:48:19,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19388/203307 [22:00:41<208:48:19,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19389/203307 [22:00:44<208:48:11,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19389/203307 [22:00:44<208:48:11,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19390/203307 [22:00:49<208:48:09,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19390/203307 [22:00:49<208:48:09,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19391/203307 [22:00:52<208:48:01,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19391/203307 [22:00:52<208:48:01,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19392/203307 [22:00:57<208:47:58,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19392/203307 [22:00:57<208:47:58,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19393/203307 [22:01:01<208:47:56,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19393/203307 [22:01:01<208:47:56,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19394/203307 [22:01:05<208:47:56,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19394/203307 [22:01:05<208:47:56,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19395/203307 [22:01:09<208:47:48,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19395/203307 [22:01:09<208:47:48,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19396/203307 [22:01:13<208:47:40,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19396/203307 [22:01:13<208:47:40,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19397/203307 [22:01:17<208:47:34,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19397/203307 [22:01:17<208:47:34,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19398/203307 [22:01:20<208:47:27,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19398/203307 [22:01:20<208:47:27,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19399/203307 [22:01:25<208:47:24,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19399/203307 [22:01:25<208:47:24,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19400/203307 [22:01:29<208:47:22,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19400/203307 [22:01:29<208:47:22,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19401/203307 [22:01:33<208:47:19,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 19401/203307 [22:01:33<208:47:19,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19402/203307 [22:01:38<208:47:19,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19402/203307 [22:01:38<208:47:19,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19403/203307 [22:01:42<208:47:18,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19403/203307 [22:01:42<208:47:18,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19404/203307 [22:01:46<208:47:11,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19404/203307 [22:01:46<208:47:11,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19405/203307 [22:01:49<208:47:04,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19405/203307 [22:01:49<208:47:04,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19406/203307 [22:01:53<208:46:56,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19406/203307 [22:01:53<208:46:56,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19407/203307 [22:01:57<208:46:48,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19407/203307 [22:01:57<208:46:48,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19408/203307 [22:02:01<208:46:47,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19408/203307 [22:02:01<208:46:47,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19409/203307 [22:02:06<208:46:46,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19409/203307 [22:02:06<208:46:46,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19410/203307 [22:02:09<208:46:39,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19410/203307 [22:02:09<208:46:39,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19411/203307 [22:02:14<208:46:39,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19411/203307 [22:02:14<208:46:39,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19412/203307 [22:02:18<208:46:32,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19412/203307 [22:02:18<208:46:32,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19413/203307 [22:02:22<208:46:25,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19413/203307 [22:02:22<208:46:25,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19414/203307 [22:02:25<208:46:18,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19414/203307 [22:02:25<208:46:18,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19415/203307 [22:02:29<208:46:11,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19415/203307 [22:02:29<208:46:11,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19416/203307 [22:02:33<208:46:04,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19416/203307 [22:02:33<208:46:04,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19417/203307 [22:02:37<208:46:03,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19417/203307 [22:02:37<208:46:03,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19418/203307 [22:02:42<208:46:02,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19418/203307 [22:02:42<208:46:02,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19419/203307 [22:02:46<208:46:01,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19419/203307 [22:02:46<208:46:01,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19420/203307 [22:02:51<208:46:01,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19420/203307 [22:02:51<208:46:01,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19421/203307 [22:02:54<208:45:54,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|▉         | 19421/203307 [22:02:54<208:45:54,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19422/203307 [22:02:58<208:45:46,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19422/203307 [22:02:58<208:45:46,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19423/203307 [22:03:02<208:45:39,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19423/203307 [22:03:02<208:45:39,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19424/203307 [22:03:06<208:45:33,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19424/203307 [22:03:06<208:45:33,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19425/203307 [22:03:10<208:45:33,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19425/203307 [22:03:10<208:45:33,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19426/203307 [22:03:15<208:45:33,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19426/203307 [22:03:15<208:45:33,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19427/203307 [22:03:19<208:45:26,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19427/203307 [22:03:19<208:45:26,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19428/203307 [22:03:23<208:45:26,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19428/203307 [22:03:23<208:45:26,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19429/203307 [22:03:27<208:45:19,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19429/203307 [22:03:27<208:45:19,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19430/203307 [22:03:31<208:45:12,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19430/203307 [22:03:31<208:45:12,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19431/203307 [22:03:34<208:45:05,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19431/203307 [22:03:34<208:45:05,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19432/203307 [22:03:38<208:44:58,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19432/203307 [22:03:38<208:44:58,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19433/203307 [22:03:43<208:44:56,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19433/203307 [22:03:43<208:44:56,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19434/203307 [22:03:47<208:44:54,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19434/203307 [22:03:47<208:44:54,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19435/203307 [22:03:51<208:44:52,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19435/203307 [22:03:51<208:44:52,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19436/203307 [22:03:56<208:44:51,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19436/203307 [22:03:56<208:44:51,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19437/203307 [22:04:00<208:44:51,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19437/203307 [22:04:00<208:44:51,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19438/203307 [22:04:04<208:44:44,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19438/203307 [22:04:04<208:44:44,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19439/203307 [22:04:08<208:44:36,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19439/203307 [22:04:08<208:44:36,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19440/203307 [22:04:11<208:44:29,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19440/203307 [22:04:11<208:44:29,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19441/203307 [22:04:15<208:44:21,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  10%|▉         | 19441/203307 [22:04:15<208:44:22,  0.24it/s, v_num=t5e6, training/loss=0.089] Epoch 0:  10%|▉         | 19442/203307 [22:04:19<208:44:21,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19442/203307 [22:04:19<208:44:21,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19443/203307 [22:04:24<208:44:19,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19443/203307 [22:04:24<208:44:19,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19444/203307 [22:04:28<208:44:18,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19444/203307 [22:04:28<208:44:18,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19445/203307 [22:04:32<208:44:11,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19445/203307 [22:04:32<208:44:11,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19446/203307 [22:04:37<208:44:12,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19446/203307 [22:04:37<208:44:12,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19447/203307 [22:04:40<208:44:05,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19447/203307 [22:04:40<208:44:05,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19448/203307 [22:04:44<208:43:58,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19448/203307 [22:04:44<208:43:58,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19449/203307 [22:04:48<208:43:51,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19449/203307 [22:04:48<208:43:51,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19450/203307 [22:04:52<208:43:49,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19450/203307 [22:04:52<208:43:50,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19451/203307 [22:04:57<208:43:48,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19451/203307 [22:04:57<208:43:48,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19452/203307 [22:05:01<208:43:41,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19452/203307 [22:05:01<208:43:41,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19453/203307 [22:05:05<208:43:41,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19453/203307 [22:05:05<208:43:41,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19454/203307 [22:05:09<208:43:40,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19454/203307 [22:05:09<208:43:40,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19455/203307 [22:05:13<208:43:34,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19455/203307 [22:05:13<208:43:34,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19456/203307 [22:05:17<208:43:27,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19456/203307 [22:05:17<208:43:27,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19457/203307 [22:05:21<208:43:20,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19457/203307 [22:05:21<208:43:20,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19458/203307 [22:05:25<208:43:17,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19458/203307 [22:05:25<208:43:17,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19459/203307 [22:05:29<208:43:16,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19459/203307 [22:05:29<208:43:16,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19460/203307 [22:05:33<208:43:09,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19460/203307 [22:05:33<208:43:09,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19461/203307 [22:05:38<208:43:07,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 19461/203307 [22:05:38<208:43:07,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19462/203307 [22:05:42<208:43:04,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19462/203307 [22:05:42<208:43:04,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19463/203307 [22:05:46<208:43:04,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19463/203307 [22:05:46<208:43:04,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19464/203307 [22:05:50<208:42:57,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19464/203307 [22:05:50<208:42:57,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19465/203307 [22:05:54<208:42:52,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19465/203307 [22:05:54<208:42:52,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19466/203307 [22:05:58<208:42:44,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19466/203307 [22:05:58<208:42:44,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19467/203307 [22:06:02<208:42:41,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19467/203307 [22:06:02<208:42:41,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19468/203307 [22:06:06<208:42:39,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19468/203307 [22:06:06<208:42:39,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19469/203307 [22:06:11<208:42:38,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19469/203307 [22:06:11<208:42:38,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19470/203307 [22:06:14<208:42:30,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19470/203307 [22:06:14<208:42:30,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19471/203307 [22:06:19<208:42:27,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19471/203307 [22:06:19<208:42:27,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19472/203307 [22:06:23<208:42:27,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19472/203307 [22:06:23<208:42:27,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19473/203307 [22:06:27<208:42:20,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19473/203307 [22:06:27<208:42:20,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19474/203307 [22:06:31<208:42:13,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19474/203307 [22:06:31<208:42:13,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19475/203307 [22:06:35<208:42:11,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19475/203307 [22:06:35<208:42:11,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19476/203307 [22:06:40<208:42:12,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19476/203307 [22:06:40<208:42:12,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19477/203307 [22:06:43<208:42:05,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19477/203307 [22:06:43<208:42:05,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19478/203307 [22:06:48<208:42:05,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19478/203307 [22:06:48<208:42:05,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19479/203307 [22:06:51<208:41:57,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19479/203307 [22:06:51<208:41:57,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19480/203307 [22:06:56<208:41:57,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19480/203307 [22:06:56<208:41:57,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19481/203307 [22:07:00<208:41:50,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  10%|▉         | 19481/203307 [22:07:00<208:41:50,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19482/203307 [22:07:04<208:41:43,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19482/203307 [22:07:04<208:41:43,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19483/203307 [22:07:08<208:41:41,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19483/203307 [22:07:08<208:41:41,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19484/203307 [22:07:12<208:41:40,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19484/203307 [22:07:12<208:41:40,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19485/203307 [22:07:16<208:41:33,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19485/203307 [22:07:16<208:41:33,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19486/203307 [22:07:21<208:41:33,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19486/203307 [22:07:21<208:41:33,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19487/203307 [22:07:24<208:41:26,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19487/203307 [22:07:24<208:41:26,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19488/203307 [22:07:28<208:41:19,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19488/203307 [22:07:28<208:41:19,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19489/203307 [22:07:33<208:41:18,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19489/203307 [22:07:33<208:41:18,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19490/203307 [22:07:36<208:41:10,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19490/203307 [22:07:36<208:41:10,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19491/203307 [22:07:40<208:41:03,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19491/203307 [22:07:40<208:41:03,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19492/203307 [22:07:44<208:41:02,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19492/203307 [22:07:44<208:41:02,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19493/203307 [22:07:49<208:41:01,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19493/203307 [22:07:49<208:41:01,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19494/203307 [22:07:53<208:41:00,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19494/203307 [22:07:53<208:41:00,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19495/203307 [22:07:57<208:40:53,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19495/203307 [22:07:57<208:40:53,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19496/203307 [22:08:01<208:40:46,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19496/203307 [22:08:01<208:40:46,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19497/203307 [22:08:05<208:40:39,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19497/203307 [22:08:05<208:40:39,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19498/203307 [22:08:09<208:40:39,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19498/203307 [22:08:09<208:40:39,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19499/203307 [22:08:13<208:40:32,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19499/203307 [22:08:13<208:40:32,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19500/203307 [22:08:17<208:40:29,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19500/203307 [22:08:17<208:40:30,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19501/203307 [22:08:22<208:40:28,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|▉         | 19501/203307 [22:08:22<208:40:28,  0.24it/s, v_num=t5e6, training/loss=0.084] Epoch 0:  10%|▉         | 19502/203307 [22:08:25<208:40:22,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19502/203307 [22:08:25<208:40:22,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19503/203307 [22:08:30<208:40:22,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19503/203307 [22:08:30<208:40:22,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19504/203307 [22:08:34<208:40:17,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19504/203307 [22:08:34<208:40:17,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19505/203307 [22:08:38<208:40:09,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19505/203307 [22:08:38<208:40:09,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19506/203307 [22:08:42<208:40:09,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19506/203307 [22:08:42<208:40:09,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19507/203307 [22:08:46<208:40:06,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19507/203307 [22:08:46<208:40:06,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19508/203307 [22:08:51<208:40:03,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19508/203307 [22:08:51<208:40:03,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19509/203307 [22:08:55<208:40:01,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19509/203307 [22:08:55<208:40:01,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19510/203307 [22:08:59<208:39:54,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19510/203307 [22:08:59<208:39:54,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19511/203307 [22:09:03<208:39:54,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19511/203307 [22:09:03<208:39:54,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19512/203307 [22:09:07<208:39:47,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19512/203307 [22:09:07<208:39:47,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19513/203307 [22:09:11<208:39:39,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19513/203307 [22:09:11<208:39:39,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19514/203307 [22:09:14<208:39:31,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19514/203307 [22:09:14<208:39:31,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19515/203307 [22:09:19<208:39:31,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19515/203307 [22:09:19<208:39:31,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19516/203307 [22:09:23<208:39:29,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19516/203307 [22:09:23<208:39:29,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19517/203307 [22:09:27<208:39:27,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19517/203307 [22:09:27<208:39:27,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19518/203307 [22:09:32<208:39:25,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19518/203307 [22:09:32<208:39:25,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19519/203307 [22:09:36<208:39:23,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19519/203307 [22:09:36<208:39:23,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19520/203307 [22:09:40<208:39:16,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19520/203307 [22:09:40<208:39:16,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19521/203307 [22:09:43<208:39:08,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  10%|▉         | 19521/203307 [22:09:43<208:39:08,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19522/203307 [22:09:47<208:39:01,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19522/203307 [22:09:47<208:39:01,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19523/203307 [22:09:51<208:38:53,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19523/203307 [22:09:51<208:38:53,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19524/203307 [22:09:55<208:38:53,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19524/203307 [22:09:55<208:38:53,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19525/203307 [22:10:00<208:38:51,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19525/203307 [22:10:00<208:38:51,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19526/203307 [22:10:04<208:38:49,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19526/203307 [22:10:04<208:38:49,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19527/203307 [22:10:08<208:38:42,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19527/203307 [22:10:08<208:38:42,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19528/203307 [22:10:12<208:38:40,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19528/203307 [22:10:12<208:38:40,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19529/203307 [22:10:16<208:38:33,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19529/203307 [22:10:16<208:38:33,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19530/203307 [22:10:20<208:38:26,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19530/203307 [22:10:20<208:38:26,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19531/203307 [22:10:23<208:38:18,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19531/203307 [22:10:23<208:38:18,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19532/203307 [22:10:28<208:38:18,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19532/203307 [22:10:28<208:38:18,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19533/203307 [22:10:32<208:38:15,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19533/203307 [22:10:32<208:38:15,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19534/203307 [22:10:36<208:38:13,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19534/203307 [22:10:36<208:38:14,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19535/203307 [22:10:40<208:38:06,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19535/203307 [22:10:40<208:38:06,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19536/203307 [22:10:45<208:38:05,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19536/203307 [22:10:45<208:38:06,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19537/203307 [22:10:48<208:37:58,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19537/203307 [22:10:48<208:37:58,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19538/203307 [22:10:52<208:37:50,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19538/203307 [22:10:52<208:37:50,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19539/203307 [22:10:56<208:37:42,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19539/203307 [22:10:56<208:37:42,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19540/203307 [22:10:59<208:37:34,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19540/203307 [22:10:59<208:37:34,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19541/203307 [22:11:04<208:37:34,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  10%|▉         | 19541/203307 [22:11:04<208:37:34,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19542/203307 [22:11:08<208:37:32,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19542/203307 [22:11:08<208:37:32,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19543/203307 [22:11:13<208:37:30,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19543/203307 [22:11:13<208:37:30,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19544/203307 [22:11:17<208:37:29,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19544/203307 [22:11:17<208:37:29,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19545/203307 [22:11:21<208:37:21,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19545/203307 [22:11:21<208:37:21,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19546/203307 [22:11:24<208:37:14,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19546/203307 [22:11:24<208:37:14,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19547/203307 [22:11:28<208:37:08,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19547/203307 [22:11:28<208:37:08,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19548/203307 [22:11:32<208:37:01,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19548/203307 [22:11:32<208:37:01,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19549/203307 [22:11:36<208:36:53,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19549/203307 [22:11:36<208:36:53,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19550/203307 [22:11:40<208:36:53,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19550/203307 [22:11:40<208:36:53,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19551/203307 [22:11:45<208:36:51,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19551/203307 [22:11:45<208:36:51,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19552/203307 [22:11:49<208:36:48,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19552/203307 [22:11:49<208:36:48,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19553/203307 [22:11:53<208:36:47,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19553/203307 [22:11:53<208:36:47,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19554/203307 [22:11:57<208:36:39,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19554/203307 [22:11:57<208:36:39,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19555/203307 [22:12:01<208:36:31,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19555/203307 [22:12:01<208:36:31,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19556/203307 [22:12:04<208:36:24,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19556/203307 [22:12:04<208:36:24,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19557/203307 [22:12:08<208:36:16,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19557/203307 [22:12:08<208:36:17,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19558/203307 [22:12:12<208:36:16,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19558/203307 [22:12:12<208:36:16,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19559/203307 [22:12:17<208:36:14,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19559/203307 [22:12:17<208:36:14,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19560/203307 [22:12:21<208:36:07,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19560/203307 [22:12:21<208:36:07,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19561/203307 [22:12:25<208:36:07,  0.24it/s, v_num=t5e6, training/loss=0.0965]Epoch 0:  10%|▉         | 19561/203307 [22:12:25<208:36:07,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19562/203307 [22:12:29<208:36:00,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19562/203307 [22:12:29<208:36:00,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19563/203307 [22:12:33<208:35:53,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19563/203307 [22:12:33<208:35:53,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19564/203307 [22:12:36<208:35:45,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19564/203307 [22:12:36<208:35:45,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19565/203307 [22:12:40<208:35:37,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19565/203307 [22:12:40<208:35:37,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19566/203307 [22:12:44<208:35:31,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19566/203307 [22:12:44<208:35:31,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19567/203307 [22:12:48<208:35:32,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19567/203307 [22:12:48<208:35:32,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19568/203307 [22:12:53<208:35:30,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19568/203307 [22:12:53<208:35:30,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19569/203307 [22:12:57<208:35:29,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19569/203307 [22:12:57<208:35:29,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19570/203307 [22:13:01<208:35:25,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19570/203307 [22:13:01<208:35:25,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19571/203307 [22:13:05<208:35:17,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19571/203307 [22:13:05<208:35:17,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19572/203307 [22:13:09<208:35:10,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19572/203307 [22:13:09<208:35:10,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19573/203307 [22:13:13<208:35:04,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19573/203307 [22:13:13<208:35:04,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19574/203307 [22:13:16<208:34:56,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19574/203307 [22:13:16<208:34:56,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19575/203307 [22:13:21<208:34:54,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19575/203307 [22:13:21<208:34:54,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19576/203307 [22:13:25<208:34:54,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19576/203307 [22:13:25<208:34:54,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19577/203307 [22:13:29<208:34:46,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19577/203307 [22:13:29<208:34:46,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19578/203307 [22:13:33<208:34:46,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19578/203307 [22:13:33<208:34:46,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19579/203307 [22:13:38<208:34:43,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19579/203307 [22:13:38<208:34:43,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19580/203307 [22:13:41<208:34:36,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19580/203307 [22:13:41<208:34:36,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19581/203307 [22:13:45<208:34:28,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 19581/203307 [22:13:45<208:34:28,  0.24it/s, v_num=t5e6, training/loss=0.085] Epoch 0:  10%|▉         | 19582/203307 [22:13:49<208:34:21,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19582/203307 [22:13:49<208:34:21,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19583/203307 [22:13:53<208:34:18,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19583/203307 [22:13:53<208:34:18,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19584/203307 [22:13:57<208:34:18,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19584/203307 [22:13:57<208:34:18,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19585/203307 [22:14:01<208:34:12,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19585/203307 [22:14:01<208:34:12,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19586/203307 [22:14:06<208:34:11,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19586/203307 [22:14:06<208:34:11,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19587/203307 [22:14:09<208:34:03,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19587/203307 [22:14:09<208:34:03,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19588/203307 [22:14:14<208:33:59,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19588/203307 [22:14:14<208:33:59,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19589/203307 [22:14:17<208:33:52,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19589/203307 [22:14:17<208:33:52,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19590/203307 [22:14:21<208:33:45,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19590/203307 [22:14:21<208:33:45,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19591/203307 [22:14:25<208:33:37,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19591/203307 [22:14:25<208:33:37,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19592/203307 [22:14:29<208:33:37,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19592/203307 [22:14:29<208:33:37,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19593/203307 [22:14:34<208:33:36,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19593/203307 [22:14:34<208:33:36,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19594/203307 [22:14:38<208:33:35,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19594/203307 [22:14:38<208:33:35,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19595/203307 [22:14:42<208:33:28,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19595/203307 [22:14:42<208:33:28,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19596/203307 [22:14:46<208:33:21,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19596/203307 [22:14:46<208:33:21,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19597/203307 [22:14:50<208:33:18,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19597/203307 [22:14:50<208:33:18,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19598/203307 [22:14:54<208:33:11,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19598/203307 [22:14:54<208:33:11,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19599/203307 [22:14:57<208:33:03,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19599/203307 [22:14:57<208:33:03,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19600/203307 [22:15:02<208:33:02,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19600/203307 [22:15:02<208:33:02,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19601/203307 [22:15:06<208:33:00,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  10%|▉         | 19601/203307 [22:15:06<208:33:00,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19602/203307 [22:15:11<208:33:00,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19602/203307 [22:15:11<208:33:00,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19603/203307 [22:15:15<208:32:59,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19603/203307 [22:15:15<208:32:59,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19604/203307 [22:15:19<208:32:52,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19604/203307 [22:15:19<208:32:52,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19605/203307 [22:15:22<208:32:45,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19605/203307 [22:15:22<208:32:45,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19606/203307 [22:15:27<208:32:42,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19606/203307 [22:15:27<208:32:42,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19607/203307 [22:15:31<208:32:35,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19607/203307 [22:15:31<208:32:35,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19608/203307 [22:15:35<208:32:33,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19608/203307 [22:15:35<208:32:33,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19609/203307 [22:15:39<208:32:31,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19609/203307 [22:15:39<208:32:31,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19610/203307 [22:15:44<208:32:30,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19610/203307 [22:15:44<208:32:30,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19611/203307 [22:15:48<208:32:28,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19611/203307 [22:15:48<208:32:28,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19612/203307 [22:15:52<208:32:21,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19612/203307 [22:15:52<208:32:21,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19613/203307 [22:15:55<208:32:13,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19613/203307 [22:15:55<208:32:13,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19614/203307 [22:15:59<208:32:06,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19614/203307 [22:15:59<208:32:06,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19615/203307 [22:16:03<208:32:03,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19615/203307 [22:16:03<208:32:03,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19616/203307 [22:16:07<208:31:55,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19616/203307 [22:16:07<208:31:55,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19617/203307 [22:16:11<208:31:52,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19617/203307 [22:16:11<208:31:52,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19618/203307 [22:16:16<208:31:51,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19618/203307 [22:16:16<208:31:51,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19619/203307 [22:16:20<208:31:50,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19619/203307 [22:16:20<208:31:50,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19620/203307 [22:16:24<208:31:42,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19620/203307 [22:16:24<208:31:42,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19621/203307 [22:16:27<208:31:35,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  10%|▉         | 19621/203307 [22:16:27<208:31:35,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19622/203307 [22:16:31<208:31:27,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19622/203307 [22:16:31<208:31:27,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19623/203307 [22:16:35<208:31:20,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19623/203307 [22:16:35<208:31:20,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19624/203307 [22:16:39<208:31:18,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19624/203307 [22:16:39<208:31:18,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19625/203307 [22:16:43<208:31:15,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19625/203307 [22:16:43<208:31:15,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19626/203307 [22:16:48<208:31:12,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19626/203307 [22:16:48<208:31:12,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19627/203307 [22:16:51<208:31:05,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19627/203307 [22:16:51<208:31:05,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19628/203307 [22:16:56<208:31:04,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19628/203307 [22:16:56<208:31:04,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19629/203307 [22:16:59<208:30:56,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19629/203307 [22:16:59<208:30:56,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19630/203307 [22:17:03<208:30:48,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19630/203307 [22:17:03<208:30:48,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19631/203307 [22:17:07<208:30:41,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19631/203307 [22:17:07<208:30:41,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19632/203307 [22:17:11<208:30:33,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19632/203307 [22:17:11<208:30:33,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19633/203307 [22:17:15<208:30:32,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19633/203307 [22:17:15<208:30:32,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19634/203307 [22:17:19<208:30:31,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19634/203307 [22:17:19<208:30:31,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19635/203307 [22:17:23<208:30:23,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19635/203307 [22:17:23<208:30:23,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19636/203307 [22:17:28<208:30:24,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19636/203307 [22:17:28<208:30:24,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19637/203307 [22:17:31<208:30:17,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19637/203307 [22:17:31<208:30:17,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19638/203307 [22:17:35<208:30:10,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19638/203307 [22:17:35<208:30:11,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19639/203307 [22:17:39<208:30:03,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19639/203307 [22:17:39<208:30:03,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19640/203307 [22:17:43<208:29:57,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19640/203307 [22:17:43<208:29:57,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19641/203307 [22:17:47<208:29:50,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19641/203307 [22:17:47<208:29:50,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19642/203307 [22:17:51<208:29:49,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19642/203307 [22:17:51<208:29:49,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19643/203307 [22:17:55<208:29:47,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19643/203307 [22:17:55<208:29:47,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19644/203307 [22:18:00<208:29:46,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19644/203307 [22:18:00<208:29:46,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19645/203307 [22:18:04<208:29:45,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19645/203307 [22:18:04<208:29:45,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19646/203307 [22:18:08<208:29:38,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19646/203307 [22:18:08<208:29:38,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19647/203307 [22:18:12<208:29:30,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19647/203307 [22:18:12<208:29:30,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19648/203307 [22:18:16<208:29:24,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19648/203307 [22:18:16<208:29:24,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19649/203307 [22:18:19<208:29:17,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19649/203307 [22:18:19<208:29:17,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19650/203307 [22:18:24<208:29:16,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19650/203307 [22:18:24<208:29:16,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19651/203307 [22:18:28<208:29:13,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19651/203307 [22:18:28<208:29:14,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19652/203307 [22:18:32<208:29:06,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19652/203307 [22:18:32<208:29:06,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19653/203307 [22:18:36<208:29:06,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19653/203307 [22:18:36<208:29:06,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19654/203307 [22:18:41<208:29:05,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19654/203307 [22:18:41<208:29:05,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19655/203307 [22:18:44<208:28:58,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19655/203307 [22:18:44<208:28:58,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19656/203307 [22:18:48<208:28:50,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19656/203307 [22:18:48<208:28:50,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19657/203307 [22:18:52<208:28:43,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19657/203307 [22:18:52<208:28:43,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19658/203307 [22:18:56<208:28:41,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19658/203307 [22:18:56<208:28:41,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19659/203307 [22:19:01<208:28:40,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19659/203307 [22:19:01<208:28:40,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19660/203307 [22:19:05<208:28:38,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19660/203307 [22:19:05<208:28:38,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19661/203307 [22:19:09<208:28:36,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  10%|▉         | 19661/203307 [22:19:09<208:28:36,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19662/203307 [22:19:14<208:28:36,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19662/203307 [22:19:14<208:28:36,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19663/203307 [22:19:17<208:28:29,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19663/203307 [22:19:17<208:28:29,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19664/203307 [22:19:21<208:28:22,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19664/203307 [22:19:21<208:28:22,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19665/203307 [22:19:25<208:28:15,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19665/203307 [22:19:25<208:28:15,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19666/203307 [22:19:29<208:28:08,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19666/203307 [22:19:29<208:28:08,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19667/203307 [22:19:33<208:28:07,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19667/203307 [22:19:33<208:28:07,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19668/203307 [22:19:38<208:28:05,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19668/203307 [22:19:38<208:28:05,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19669/203307 [22:19:42<208:28:04,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19669/203307 [22:19:42<208:28:04,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19670/203307 [22:19:46<208:27:56,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19670/203307 [22:19:46<208:27:56,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19671/203307 [22:19:50<208:27:55,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19671/203307 [22:19:50<208:27:55,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19672/203307 [22:19:54<208:27:48,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19672/203307 [22:19:54<208:27:48,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19673/203307 [22:19:58<208:27:40,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19673/203307 [22:19:58<208:27:41,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19674/203307 [22:20:01<208:27:33,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19674/203307 [22:20:01<208:27:33,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19675/203307 [22:20:06<208:27:31,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19675/203307 [22:20:06<208:27:31,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19676/203307 [22:20:10<208:27:29,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19676/203307 [22:20:10<208:27:29,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19677/203307 [22:20:14<208:27:22,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19677/203307 [22:20:14<208:27:22,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19678/203307 [22:20:18<208:27:22,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19678/203307 [22:20:18<208:27:23,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19679/203307 [22:20:22<208:27:15,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19679/203307 [22:20:22<208:27:15,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19680/203307 [22:20:26<208:27:14,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19680/203307 [22:20:26<208:27:14,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19681/203307 [22:20:30<208:27:06,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  10%|▉         | 19681/203307 [22:20:30<208:27:06,  0.24it/s, v_num=t5e6, training/loss=0.079] Epoch 0:  10%|▉         | 19682/203307 [22:20:34<208:26:58,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19682/203307 [22:20:34<208:26:58,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19683/203307 [22:20:38<208:26:56,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19683/203307 [22:20:38<208:26:56,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19684/203307 [22:20:42<208:26:54,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19684/203307 [22:20:42<208:26:54,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19685/203307 [22:20:46<208:26:46,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19685/203307 [22:20:46<208:26:46,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19686/203307 [22:20:50<208:26:45,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19686/203307 [22:20:51<208:26:46,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19687/203307 [22:20:55<208:26:42,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19687/203307 [22:20:55<208:26:42,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19688/203307 [22:20:59<208:26:41,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19688/203307 [22:20:59<208:26:41,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19689/203307 [22:21:03<208:26:33,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19689/203307 [22:21:03<208:26:33,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19690/203307 [22:21:06<208:26:26,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19690/203307 [22:21:06<208:26:26,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19691/203307 [22:21:10<208:26:18,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19691/203307 [22:21:10<208:26:18,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19692/203307 [22:21:15<208:26:16,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19692/203307 [22:21:15<208:26:16,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19693/203307 [22:21:19<208:26:15,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19693/203307 [22:21:19<208:26:15,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19694/203307 [22:21:23<208:26:13,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19694/203307 [22:21:23<208:26:13,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19695/203307 [22:21:27<208:26:06,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19695/203307 [22:21:27<208:26:06,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19696/203307 [22:21:31<208:26:02,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19696/203307 [22:21:31<208:26:02,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19697/203307 [22:21:36<208:26:02,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19697/203307 [22:21:36<208:26:02,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19698/203307 [22:21:39<208:25:55,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19698/203307 [22:21:39<208:25:55,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19699/203307 [22:21:43<208:25:47,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19699/203307 [22:21:43<208:25:47,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19700/203307 [22:21:47<208:25:45,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19700/203307 [22:21:47<208:25:45,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19701/203307 [22:21:52<208:25:43,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|▉         | 19701/203307 [22:21:52<208:25:43,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19702/203307 [22:21:55<208:25:36,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19702/203307 [22:21:55<208:25:36,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19703/203307 [22:22:00<208:25:35,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19703/203307 [22:22:00<208:25:35,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19704/203307 [22:22:04<208:25:27,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19704/203307 [22:22:04<208:25:27,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19705/203307 [22:22:08<208:25:25,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19705/203307 [22:22:08<208:25:25,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19706/203307 [22:22:12<208:25:24,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19706/203307 [22:22:12<208:25:24,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19707/203307 [22:22:16<208:25:16,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19707/203307 [22:22:16<208:25:17,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19708/203307 [22:22:20<208:25:14,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19708/203307 [22:22:20<208:25:14,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19709/203307 [22:22:25<208:25:13,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19709/203307 [22:22:25<208:25:13,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19710/203307 [22:22:28<208:25:06,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19710/203307 [22:22:28<208:25:06,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19711/203307 [22:22:33<208:25:05,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19711/203307 [22:22:33<208:25:05,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19712/203307 [22:22:37<208:24:58,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19712/203307 [22:22:37<208:24:58,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19713/203307 [22:22:40<208:24:50,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19713/203307 [22:22:40<208:24:50,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19714/203307 [22:22:45<208:24:50,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19714/203307 [22:22:45<208:24:50,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19715/203307 [22:22:48<208:24:42,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19715/203307 [22:22:49<208:24:42,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19716/203307 [22:22:52<208:24:35,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19716/203307 [22:22:52<208:24:35,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19717/203307 [22:22:57<208:24:33,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19717/203307 [22:22:57<208:24:33,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19718/203307 [22:23:01<208:24:31,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19718/203307 [22:23:01<208:24:31,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19719/203307 [22:23:05<208:24:29,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19719/203307 [22:23:05<208:24:29,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19720/203307 [22:23:09<208:24:22,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19720/203307 [22:23:09<208:24:22,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19721/203307 [22:23:13<208:24:15,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  10%|▉         | 19721/203307 [22:23:13<208:24:15,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19722/203307 [22:23:16<208:24:07,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19722/203307 [22:23:16<208:24:07,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19723/203307 [22:23:21<208:24:08,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19723/203307 [22:23:21<208:24:08,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19724/203307 [22:23:25<208:24:00,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19724/203307 [22:23:25<208:24:00,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19725/203307 [22:23:29<208:23:57,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19725/203307 [22:23:29<208:23:58,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19726/203307 [22:23:33<208:23:56,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19726/203307 [22:23:33<208:23:56,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19727/203307 [22:23:37<208:23:48,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19727/203307 [22:23:37<208:23:48,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19728/203307 [22:23:41<208:23:47,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19728/203307 [22:23:41<208:23:47,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19729/203307 [22:23:45<208:23:39,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19729/203307 [22:23:45<208:23:39,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19730/203307 [22:23:49<208:23:32,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19730/203307 [22:23:49<208:23:32,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19731/203307 [22:23:53<208:23:24,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19731/203307 [22:23:53<208:23:24,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19732/203307 [22:23:57<208:23:24,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19732/203307 [22:23:57<208:23:24,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19733/203307 [22:24:01<208:23:21,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19733/203307 [22:24:01<208:23:21,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19734/203307 [22:24:06<208:23:19,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19734/203307 [22:24:06<208:23:19,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19735/203307 [22:24:09<208:23:12,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19735/203307 [22:24:09<208:23:12,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19736/203307 [22:24:14<208:23:10,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19736/203307 [22:24:14<208:23:10,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19737/203307 [22:24:17<208:23:03,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19737/203307 [22:24:17<208:23:03,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19738/203307 [22:24:21<208:22:56,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19738/203307 [22:24:21<208:22:56,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19739/203307 [22:24:25<208:22:49,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19739/203307 [22:24:25<208:22:49,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19740/203307 [22:24:29<208:22:48,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19740/203307 [22:24:29<208:22:48,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19741/203307 [22:24:34<208:22:45,  0.24it/s, v_num=t5e6, training/loss=0.0915]Epoch 0:  10%|▉         | 19741/203307 [22:24:34<208:22:45,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19742/203307 [22:24:38<208:22:42,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19742/203307 [22:24:38<208:22:42,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19743/203307 [22:24:42<208:22:40,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19743/203307 [22:24:42<208:22:40,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19744/203307 [22:24:46<208:22:38,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19744/203307 [22:24:46<208:22:38,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19745/203307 [22:24:50<208:22:31,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19745/203307 [22:24:50<208:22:31,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19746/203307 [22:24:54<208:22:22,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19746/203307 [22:24:54<208:22:22,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19747/203307 [22:24:57<208:22:14,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19747/203307 [22:24:57<208:22:14,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19748/203307 [22:25:01<208:22:07,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19748/203307 [22:25:01<208:22:07,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19749/203307 [22:25:06<208:22:07,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19749/203307 [22:25:06<208:22:07,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19750/203307 [22:25:10<208:22:05,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19750/203307 [22:25:10<208:22:05,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19751/203307 [22:25:14<208:22:02,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19751/203307 [22:25:14<208:22:02,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19752/203307 [22:25:18<208:21:55,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19752/203307 [22:25:18<208:21:56,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19753/203307 [22:25:22<208:21:54,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19753/203307 [22:25:22<208:21:54,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19754/203307 [22:25:26<208:21:46,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19754/203307 [22:25:26<208:21:46,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19755/203307 [22:25:30<208:21:38,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19755/203307 [22:25:30<208:21:38,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19756/203307 [22:25:33<208:21:30,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19756/203307 [22:25:33<208:21:30,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19757/203307 [22:25:37<208:21:23,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19757/203307 [22:25:37<208:21:23,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19758/203307 [22:25:42<208:21:23,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19758/203307 [22:25:42<208:21:23,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19759/203307 [22:25:46<208:21:20,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19759/203307 [22:25:46<208:21:20,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19760/203307 [22:25:50<208:21:12,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19760/203307 [22:25:50<208:21:12,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19761/203307 [22:25:54<208:21:11,  0.24it/s, v_num=t5e6, training/loss=0.0936]Epoch 0:  10%|▉         | 19761/203307 [22:25:54<208:21:11,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19762/203307 [22:25:58<208:21:03,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19762/203307 [22:25:58<208:21:03,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19763/203307 [22:26:01<208:20:55,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19763/203307 [22:26:01<208:20:55,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19764/203307 [22:26:05<208:20:47,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19764/203307 [22:26:05<208:20:47,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19765/203307 [22:26:09<208:20:39,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19765/203307 [22:26:09<208:20:39,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19766/203307 [22:26:13<208:20:38,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19766/203307 [22:26:13<208:20:38,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19767/203307 [22:26:17<208:20:35,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19767/203307 [22:26:17<208:20:35,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19768/203307 [22:26:22<208:20:33,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19768/203307 [22:26:22<208:20:33,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19769/203307 [22:26:26<208:20:31,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19769/203307 [22:26:26<208:20:31,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19770/203307 [22:26:30<208:20:24,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19770/203307 [22:26:30<208:20:24,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19771/203307 [22:26:33<208:20:16,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19771/203307 [22:26:33<208:20:16,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19772/203307 [22:26:37<208:20:09,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19772/203307 [22:26:37<208:20:09,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19773/203307 [22:26:41<208:20:01,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19773/203307 [22:26:41<208:20:01,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19774/203307 [22:26:44<208:19:53,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19774/203307 [22:26:44<208:19:53,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19775/203307 [22:26:49<208:19:52,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19775/203307 [22:26:49<208:19:52,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19776/203307 [22:26:53<208:19:50,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19776/203307 [22:26:53<208:19:50,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19777/203307 [22:26:57<208:19:47,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19777/203307 [22:26:57<208:19:47,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19778/203307 [22:27:02<208:19:45,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19778/203307 [22:27:02<208:19:45,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19779/203307 [22:27:05<208:19:37,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19779/203307 [22:27:05<208:19:37,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19780/203307 [22:27:09<208:19:29,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19780/203307 [22:27:09<208:19:29,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19781/203307 [22:27:13<208:19:21,  0.24it/s, v_num=t5e6, training/loss=0.0945]Epoch 0:  10%|▉         | 19781/203307 [22:27:13<208:19:21,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19782/203307 [22:27:16<208:19:14,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19782/203307 [22:27:16<208:19:14,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19783/203307 [22:27:21<208:19:11,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19783/203307 [22:27:21<208:19:12,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19784/203307 [22:27:25<208:19:11,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19784/203307 [22:27:25<208:19:11,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19785/203307 [22:27:29<208:19:03,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19785/203307 [22:27:29<208:19:03,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19786/203307 [22:27:33<208:19:02,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19786/203307 [22:27:33<208:19:02,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19787/203307 [22:27:37<208:18:54,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19787/203307 [22:27:37<208:18:54,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19788/203307 [22:27:41<208:18:46,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19788/203307 [22:27:41<208:18:47,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19789/203307 [22:27:44<208:18:39,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19789/203307 [22:27:44<208:18:39,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19790/203307 [22:27:48<208:18:32,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19790/203307 [22:27:48<208:18:32,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19791/203307 [22:27:52<208:18:23,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19791/203307 [22:27:52<208:18:23,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19792/203307 [22:27:56<208:18:24,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19792/203307 [22:27:56<208:18:24,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19793/203307 [22:28:01<208:18:21,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19793/203307 [22:28:01<208:18:21,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19794/203307 [22:28:05<208:18:19,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19794/203307 [22:28:05<208:18:19,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19795/203307 [22:28:09<208:18:16,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19795/203307 [22:28:09<208:18:16,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19796/203307 [22:28:13<208:18:08,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19796/203307 [22:28:13<208:18:08,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19797/203307 [22:28:16<208:18:00,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19797/203307 [22:28:16<208:18:00,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19798/203307 [22:28:20<208:17:54,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19798/203307 [22:28:20<208:17:54,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19799/203307 [22:28:24<208:17:47,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19799/203307 [22:28:24<208:17:47,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19800/203307 [22:28:28<208:17:45,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19800/203307 [22:28:28<208:17:45,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19801/203307 [22:28:33<208:17:45,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|▉         | 19801/203307 [22:28:33<208:17:45,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19802/203307 [22:28:37<208:17:37,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19802/203307 [22:28:37<208:17:37,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19803/203307 [22:28:41<208:17:36,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19803/203307 [22:28:41<208:17:36,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19804/203307 [22:28:45<208:17:34,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19804/203307 [22:28:45<208:17:34,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19805/203307 [22:28:49<208:17:27,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19805/203307 [22:28:49<208:17:27,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19806/203307 [22:28:53<208:17:20,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19806/203307 [22:28:53<208:17:20,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19807/203307 [22:28:57<208:17:13,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19807/203307 [22:28:57<208:17:13,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19808/203307 [22:29:01<208:17:10,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19808/203307 [22:29:01<208:17:10,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19809/203307 [22:29:05<208:17:09,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19809/203307 [22:29:05<208:17:09,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19810/203307 [22:29:10<208:17:09,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19810/203307 [22:29:10<208:17:09,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19811/203307 [22:29:14<208:17:07,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19811/203307 [22:29:14<208:17:08,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19812/203307 [22:29:18<208:17:01,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19812/203307 [22:29:18<208:17:01,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19813/203307 [22:29:22<208:16:58,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19813/203307 [22:29:22<208:16:58,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19814/203307 [22:29:26<208:16:51,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19814/203307 [22:29:26<208:16:51,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19815/203307 [22:29:30<208:16:45,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19815/203307 [22:29:30<208:16:45,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19816/203307 [22:29:34<208:16:38,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19816/203307 [22:29:34<208:16:38,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19817/203307 [22:29:38<208:16:36,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19817/203307 [22:29:38<208:16:36,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19818/203307 [22:29:42<208:16:35,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19818/203307 [22:29:42<208:16:35,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19819/203307 [22:29:47<208:16:35,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19819/203307 [22:29:47<208:16:35,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19820/203307 [22:29:51<208:16:28,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19820/203307 [22:29:51<208:16:28,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19821/203307 [22:29:54<208:16:21,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  10%|▉         | 19821/203307 [22:29:54<208:16:21,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19822/203307 [22:29:59<208:16:19,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19822/203307 [22:29:59<208:16:19,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19823/203307 [22:30:02<208:16:12,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19823/203307 [22:30:02<208:16:12,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19824/203307 [22:30:06<208:16:05,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19824/203307 [22:30:06<208:16:05,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19825/203307 [22:30:10<208:16:02,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19825/203307 [22:30:10<208:16:02,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19826/203307 [22:30:15<208:16:01,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19826/203307 [22:30:15<208:16:01,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19827/203307 [22:30:19<208:16:01,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19827/203307 [22:30:19<208:16:01,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19828/203307 [22:30:24<208:16:00,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19828/203307 [22:30:24<208:16:00,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19829/203307 [22:30:28<208:15:53,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19829/203307 [22:30:28<208:15:53,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19830/203307 [22:30:31<208:15:46,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19830/203307 [22:30:31<208:15:46,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19831/203307 [22:30:36<208:15:43,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19831/203307 [22:30:36<208:15:43,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19832/203307 [22:30:39<208:15:35,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19832/203307 [22:30:39<208:15:35,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19833/203307 [22:30:43<208:15:32,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19833/203307 [22:30:43<208:15:32,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19834/203307 [22:30:48<208:15:31,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19834/203307 [22:30:48<208:15:31,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19835/203307 [22:30:52<208:15:23,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19835/203307 [22:30:52<208:15:24,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19836/203307 [22:30:56<208:15:24,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19836/203307 [22:30:56<208:15:24,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19837/203307 [22:31:00<208:15:16,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19837/203307 [22:31:00<208:15:16,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19838/203307 [22:31:03<208:15:08,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19838/203307 [22:31:03<208:15:08,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19839/203307 [22:31:07<208:15:01,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19839/203307 [22:31:07<208:15:01,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19840/203307 [22:31:11<208:14:58,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19840/203307 [22:31:11<208:14:58,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19841/203307 [22:31:15<208:14:50,  0.24it/s, v_num=t5e6, training/loss=0.0713]Epoch 0:  10%|▉         | 19841/203307 [22:31:15<208:14:50,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19842/203307 [22:31:19<208:14:49,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19842/203307 [22:31:19<208:14:49,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19843/203307 [22:31:24<208:14:47,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19843/203307 [22:31:24<208:14:47,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19844/203307 [22:31:28<208:14:46,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19844/203307 [22:31:28<208:14:46,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19845/203307 [22:31:32<208:14:39,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19845/203307 [22:31:32<208:14:39,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19846/203307 [22:31:36<208:14:33,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19846/203307 [22:31:36<208:14:33,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19847/203307 [22:31:40<208:14:25,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19847/203307 [22:31:40<208:14:25,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19848/203307 [22:31:43<208:14:18,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19848/203307 [22:31:43<208:14:18,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19849/203307 [22:31:48<208:14:16,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19849/203307 [22:31:48<208:14:16,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19850/203307 [22:31:52<208:14:14,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19850/203307 [22:31:52<208:14:14,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19851/203307 [22:31:56<208:14:12,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19851/203307 [22:31:56<208:14:12,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19852/203307 [22:32:00<208:14:05,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19852/203307 [22:32:00<208:14:05,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19853/203307 [22:32:04<208:14:04,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19853/203307 [22:32:04<208:14:04,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19854/203307 [22:32:08<208:13:56,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19854/203307 [22:32:08<208:13:56,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19855/203307 [22:32:12<208:13:48,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19855/203307 [22:32:12<208:13:48,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19856/203307 [22:32:16<208:13:41,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19856/203307 [22:32:16<208:13:41,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19857/203307 [22:32:19<208:13:34,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19857/203307 [22:32:19<208:13:34,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19858/203307 [22:32:24<208:13:32,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19858/203307 [22:32:24<208:13:32,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19859/203307 [22:32:28<208:13:30,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19859/203307 [22:32:28<208:13:30,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19860/203307 [22:32:32<208:13:23,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19860/203307 [22:32:32<208:13:23,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19861/203307 [22:32:36<208:13:22,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|▉         | 19861/203307 [22:32:36<208:13:23,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19862/203307 [22:32:41<208:13:21,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19862/203307 [22:32:41<208:13:21,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19863/203307 [22:32:44<208:13:14,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19863/203307 [22:32:44<208:13:14,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19864/203307 [22:32:48<208:13:06,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19864/203307 [22:32:48<208:13:06,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19865/203307 [22:32:52<208:12:59,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19865/203307 [22:32:52<208:12:59,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19866/203307 [22:32:56<208:12:52,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19866/203307 [22:32:56<208:12:52,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19867/203307 [22:33:00<208:12:51,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19867/203307 [22:33:00<208:12:51,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19868/203307 [22:33:04<208:12:49,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19868/203307 [22:33:04<208:12:49,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19869/203307 [22:33:09<208:12:47,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19869/203307 [22:33:09<208:12:47,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19870/203307 [22:33:13<208:12:46,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19870/203307 [22:33:13<208:12:46,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19871/203307 [22:33:17<208:12:39,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19871/203307 [22:33:17<208:12:39,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19872/203307 [22:33:20<208:12:32,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19872/203307 [22:33:20<208:12:32,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19873/203307 [22:33:24<208:12:24,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19873/203307 [22:33:24<208:12:24,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19874/203307 [22:33:28<208:12:17,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19874/203307 [22:33:28<208:12:17,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19875/203307 [22:33:32<208:12:15,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19875/203307 [22:33:32<208:12:15,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19876/203307 [22:33:37<208:12:13,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19876/203307 [22:33:37<208:12:13,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19877/203307 [22:33:40<208:12:06,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19877/203307 [22:33:40<208:12:06,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19878/203307 [22:33:45<208:12:05,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19878/203307 [22:33:45<208:12:05,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19879/203307 [22:33:49<208:12:04,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19879/203307 [22:33:49<208:12:04,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19880/203307 [22:33:53<208:11:56,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19880/203307 [22:33:53<208:11:56,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19881/203307 [22:33:57<208:11:49,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  10%|▉         | 19881/203307 [22:33:57<208:11:49,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19882/203307 [22:34:00<208:11:41,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19882/203307 [22:34:00<208:11:41,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19883/203307 [22:34:05<208:11:38,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19883/203307 [22:34:05<208:11:38,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19884/203307 [22:34:09<208:11:37,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19884/203307 [22:34:09<208:11:37,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19885/203307 [22:34:13<208:11:35,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19885/203307 [22:34:13<208:11:35,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19886/203307 [22:34:18<208:11:33,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19886/203307 [22:34:18<208:11:33,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19887/203307 [22:34:21<208:11:25,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19887/203307 [22:34:21<208:11:26,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19888/203307 [22:34:26<208:11:25,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19888/203307 [22:34:26<208:11:25,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19889/203307 [22:34:29<208:11:17,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19889/203307 [22:34:29<208:11:18,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19890/203307 [22:34:33<208:11:10,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19890/203307 [22:34:33<208:11:10,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19891/203307 [22:34:37<208:11:02,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19891/203307 [22:34:37<208:11:03,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19892/203307 [22:34:41<208:11:00,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19892/203307 [22:34:41<208:11:00,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19893/203307 [22:34:46<208:10:59,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19893/203307 [22:34:46<208:10:59,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19894/203307 [22:34:50<208:10:57,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19894/203307 [22:34:50<208:10:58,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19895/203307 [22:34:54<208:10:50,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19895/203307 [22:34:54<208:10:50,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19896/203307 [22:34:58<208:10:49,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19896/203307 [22:34:58<208:10:49,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19897/203307 [22:35:02<208:10:42,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19897/203307 [22:35:02<208:10:42,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19898/203307 [22:35:06<208:10:35,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19898/203307 [22:35:06<208:10:35,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19899/203307 [22:35:09<208:10:28,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19899/203307 [22:35:09<208:10:28,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19900/203307 [22:35:14<208:10:25,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19900/203307 [22:35:14<208:10:25,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19901/203307 [22:35:18<208:10:24,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  10%|▉         | 19901/203307 [22:35:18<208:10:24,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19902/203307 [22:35:22<208:10:17,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19902/203307 [22:35:22<208:10:17,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19903/203307 [22:35:26<208:10:16,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19903/203307 [22:35:26<208:10:16,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19904/203307 [22:35:30<208:10:09,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19904/203307 [22:35:30<208:10:09,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19905/203307 [22:35:34<208:10:08,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19905/203307 [22:35:34<208:10:08,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19906/203307 [22:35:38<208:10:01,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19906/203307 [22:35:38<208:10:01,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19907/203307 [22:35:42<208:09:53,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19907/203307 [22:35:42<208:09:54,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19908/203307 [22:35:46<208:09:50,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19908/203307 [22:35:46<208:09:50,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19909/203307 [22:35:50<208:09:49,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19909/203307 [22:35:50<208:09:49,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19910/203307 [22:35:54<208:09:42,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19910/203307 [22:35:54<208:09:42,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19911/203307 [22:35:59<208:09:41,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19911/203307 [22:35:59<208:09:41,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19912/203307 [22:36:03<208:09:38,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19912/203307 [22:36:03<208:09:38,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19913/203307 [22:36:07<208:09:31,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19913/203307 [22:36:07<208:09:31,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19914/203307 [22:36:11<208:09:30,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19914/203307 [22:36:11<208:09:30,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19915/203307 [22:36:15<208:09:23,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19915/203307 [22:36:15<208:09:23,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19916/203307 [22:36:18<208:09:15,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19916/203307 [22:36:18<208:09:15,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19917/203307 [22:36:23<208:09:13,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19917/203307 [22:36:23<208:09:13,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19918/203307 [22:36:27<208:09:11,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19918/203307 [22:36:27<208:09:11,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19919/203307 [22:36:31<208:09:10,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19919/203307 [22:36:31<208:09:10,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19920/203307 [22:36:35<208:09:03,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19920/203307 [22:36:35<208:09:03,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19921/203307 [22:36:40<208:09:01,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 19921/203307 [22:36:40<208:09:01,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19922/203307 [22:36:44<208:08:59,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19922/203307 [22:36:44<208:08:59,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19923/203307 [22:36:48<208:08:52,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19923/203307 [22:36:48<208:08:52,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19924/203307 [22:36:51<208:08:44,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19924/203307 [22:36:51<208:08:44,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19925/203307 [22:36:56<208:08:42,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19925/203307 [22:36:56<208:08:42,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19926/203307 [22:37:00<208:08:39,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19926/203307 [22:37:00<208:08:40,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19927/203307 [22:37:04<208:08:32,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19927/203307 [22:37:04<208:08:32,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19928/203307 [22:37:08<208:08:31,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19928/203307 [22:37:08<208:08:31,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19929/203307 [22:37:12<208:08:22,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19929/203307 [22:37:12<208:08:22,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19930/203307 [22:37:16<208:08:19,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19930/203307 [22:37:16<208:08:19,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19931/203307 [22:37:20<208:08:19,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19931/203307 [22:37:20<208:08:19,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19932/203307 [22:37:24<208:08:12,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19932/203307 [22:37:24<208:08:12,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19933/203307 [22:37:28<208:08:10,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19933/203307 [22:37:28<208:08:10,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19934/203307 [22:37:33<208:08:09,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19934/203307 [22:37:33<208:08:09,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19935/203307 [22:37:37<208:08:03,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19935/203307 [22:37:37<208:08:03,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19936/203307 [22:37:41<208:08:02,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19936/203307 [22:37:41<208:08:02,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19937/203307 [22:37:45<208:07:57,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19937/203307 [22:37:45<208:07:57,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19938/203307 [22:37:49<208:07:49,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19938/203307 [22:37:49<208:07:49,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19939/203307 [22:37:53<208:07:46,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19939/203307 [22:37:53<208:07:46,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19940/203307 [22:37:57<208:07:46,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19940/203307 [22:37:57<208:07:46,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19941/203307 [22:38:01<208:07:39,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  10%|▉         | 19941/203307 [22:38:01<208:07:39,  0.24it/s, v_num=t5e6, training/loss=0.090] Epoch 0:  10%|▉         | 19942/203307 [22:38:05<208:07:36,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19942/203307 [22:38:05<208:07:36,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19943/203307 [22:38:10<208:07:35,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19943/203307 [22:38:10<208:07:35,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19944/203307 [22:38:14<208:07:33,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19944/203307 [22:38:14<208:07:33,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19945/203307 [22:38:18<208:07:27,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19945/203307 [22:38:18<208:07:27,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19946/203307 [22:38:22<208:07:20,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19946/203307 [22:38:22<208:07:20,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19947/203307 [22:38:25<208:07:12,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19947/203307 [22:38:25<208:07:12,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19948/203307 [22:38:30<208:07:12,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19948/203307 [22:38:30<208:07:12,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19949/203307 [22:38:34<208:07:04,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19949/203307 [22:38:34<208:07:05,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19950/203307 [22:38:38<208:07:02,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19950/203307 [22:38:38<208:07:02,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19951/203307 [22:38:42<208:07:00,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19951/203307 [22:38:42<208:07:00,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19952/203307 [22:38:46<208:06:52,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19952/203307 [22:38:46<208:06:52,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19953/203307 [22:38:50<208:06:51,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19953/203307 [22:38:50<208:06:51,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19954/203307 [22:38:54<208:06:43,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19954/203307 [22:38:54<208:06:43,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19955/203307 [22:38:58<208:06:36,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19955/203307 [22:38:58<208:06:36,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19956/203307 [22:39:02<208:06:28,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19956/203307 [22:39:02<208:06:28,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19957/203307 [22:39:06<208:06:28,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19957/203307 [22:39:06<208:06:28,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19958/203307 [22:39:10<208:06:25,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19958/203307 [22:39:10<208:06:25,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19959/203307 [22:39:15<208:06:23,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19959/203307 [22:39:15<208:06:23,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19960/203307 [22:39:18<208:06:16,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19960/203307 [22:39:18<208:06:16,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19961/203307 [22:39:23<208:06:14,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|▉         | 19961/203307 [22:39:23<208:06:14,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19962/203307 [22:39:26<208:06:06,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19962/203307 [22:39:26<208:06:06,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19963/203307 [22:39:30<208:05:59,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19963/203307 [22:39:30<208:05:59,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19964/203307 [22:39:34<208:05:51,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19964/203307 [22:39:34<208:05:51,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19965/203307 [22:39:37<208:05:43,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19965/203307 [22:39:37<208:05:43,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19966/203307 [22:39:42<208:05:43,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19966/203307 [22:39:42<208:05:43,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19967/203307 [22:39:46<208:05:40,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19967/203307 [22:39:46<208:05:40,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19968/203307 [22:39:50<208:05:38,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19968/203307 [22:39:50<208:05:38,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19969/203307 [22:39:55<208:05:36,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19969/203307 [22:39:55<208:05:36,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19970/203307 [22:39:58<208:05:28,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19970/203307 [22:39:58<208:05:28,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19971/203307 [22:40:02<208:05:20,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19971/203307 [22:40:02<208:05:20,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19972/203307 [22:40:06<208:05:12,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19972/203307 [22:40:06<208:05:12,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19973/203307 [22:40:09<208:05:05,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19973/203307 [22:40:09<208:05:05,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19974/203307 [22:40:14<208:05:05,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19974/203307 [22:40:14<208:05:05,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19975/203307 [22:40:18<208:05:02,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19975/203307 [22:40:18<208:05:02,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19976/203307 [22:40:23<208:05:00,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19976/203307 [22:40:23<208:05:00,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19977/203307 [22:40:26<208:04:52,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19977/203307 [22:40:26<208:04:52,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19978/203307 [22:40:31<208:04:51,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19978/203307 [22:40:31<208:04:51,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19979/203307 [22:40:34<208:04:43,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19979/203307 [22:40:34<208:04:44,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19980/203307 [22:40:38<208:04:36,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19980/203307 [22:40:38<208:04:36,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19981/203307 [22:40:42<208:04:28,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  10%|▉         | 19981/203307 [22:40:42<208:04:28,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19982/203307 [22:40:45<208:04:21,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19982/203307 [22:40:45<208:04:21,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19983/203307 [22:40:50<208:04:20,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19983/203307 [22:40:50<208:04:20,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19984/203307 [22:40:54<208:04:18,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19984/203307 [22:40:54<208:04:18,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19985/203307 [22:40:58<208:04:11,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19985/203307 [22:40:58<208:04:11,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19986/203307 [22:41:02<208:04:10,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19986/203307 [22:41:02<208:04:10,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19987/203307 [22:41:06<208:04:03,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19987/203307 [22:41:06<208:04:03,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19988/203307 [22:41:10<208:03:55,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19988/203307 [22:41:10<208:03:55,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19989/203307 [22:41:14<208:03:48,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19989/203307 [22:41:14<208:03:48,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19990/203307 [22:41:17<208:03:41,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19990/203307 [22:41:17<208:03:41,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19991/203307 [22:41:21<208:03:34,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19991/203307 [22:41:21<208:03:34,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19992/203307 [22:41:26<208:03:33,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19992/203307 [22:41:26<208:03:33,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19993/203307 [22:41:30<208:03:31,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19993/203307 [22:41:30<208:03:32,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19994/203307 [22:41:34<208:03:30,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19994/203307 [22:41:34<208:03:30,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19995/203307 [22:41:38<208:03:23,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19995/203307 [22:41:38<208:03:23,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19996/203307 [22:41:42<208:03:15,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19996/203307 [22:41:42<208:03:15,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19997/203307 [22:41:45<208:03:08,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19997/203307 [22:41:45<208:03:08,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19998/203307 [22:41:49<208:03:02,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19998/203307 [22:41:49<208:03:02,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19999/203307 [22:41:53<208:02:54,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 19999/203307 [22:41:53<208:02:54,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 20000/203307 [22:41:58<208:02:54,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 20000/203307 [22:41:58<208:02:54,  0.24it/s, v_num=t5e6, training/loss=0.0843]
Validation: |          | 0/? [00:00<?, ?it/s][A
Validation:   0%|          | 0/1 [00:00<?, ?it/s][A


Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s][A[A

Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:24,  1.17it/s][A[A

Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:23,  1.18it/s][A[A

Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:22,  1.18it/s][A[A

Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:22,  1.17it/s][A[A

Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:21,  1.16it/s][A[A

Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:21,  1.16it/s][A[A

Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:19,  1.16it/s][A[A

Sampling (mamba memory):  54%|█████▍    | 108/200 [00:06<01:18,  1.17it/s][A[A

Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:17,  1.17it/s][A[A

Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:16,  1.18it/s][A[A

Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:26,  1.15it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:24,  1.16it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:23,  1.16it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:23,  1.15it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:22,  1.15it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:21,  1.15it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:20,  1.15it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:06<01:20,  1.15it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:19,  1.15it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:18,  1.15it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:17,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:27,  1.13it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:25,  1.14it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:24,  1.14it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:24,  1.14it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:23,  1.14it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:22,  1.14it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:21,  1.14it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:21,  1.13it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:20,  1.13it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:19,  1.13it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:18,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:27,  1.13it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:26,  1.14it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:25,  1.14it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:24,  1.14it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:23,  1.14it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:22,  1.14it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:21,  1.13it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:21,  1.13it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:20,  1.13it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:19,  1.13it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:18,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:29,  1.11it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:27,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:26,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:25,  1.12it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:24,  1.12it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:23,  1.12it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:22,  1.13it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:21,  1.13it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:20,  1.13it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:19,  1.13it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:18,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:29,  1.11it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:27,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:26,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:26,  1.11it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:25,  1.11it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:24,  1.11it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:23,  1.11it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:22,  1.12it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:20,  1.13it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:19,  1.13it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:18,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:30,  1.09it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:28,  1.11it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:27,  1.11it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:26,  1.11it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:26,  1.10it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:25,  1.10it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:24,  1.10it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:23,  1.10it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:22,  1.10it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:09<01:21,  1.10it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:20,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:30,  1.09it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:29,  1.10it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:28,  1.09it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:28,  1.09it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:27,  1.09it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:26,  1.09it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:25,  1.08it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:24,  1.09it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:23,  1.09it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:09<01:22,  1.09it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:10<01:21,  1.0Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:15,  1.18it/s][A[A

Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:14,  1.18it/s][A[A

Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:14,  1.17it/s][A[A

Sampling (mamba memory):  57%|█████▋    | 114/200 [00:11<01:13,  1.17it/s][A[A

Sampling (mamba memory):  57%|█████▊    | 115/200 [00:12<01:12,  1.16it/s][A[A

Sampling (mamba memory):  58%|█████▊    | 116/200 [00:13<01:12,  1.16it/s][A[A

Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:11,  1.16it/s][A[A

Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:10,  1.16it/s][A[A

Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:09,  1.16it/s][A[A

Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:08,  1.16it/s][A[A

Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:08,  1.16it/s][A[A

Sampling (mamba memory):  61%|██████    | 122/200 [00:18<01:07,  1.15it/s][A[A

4it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:17,  1.14it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:16,  1.14it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:15,  1.13it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:14,  1.13it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:13<01:13,  1.14it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:13,  1.14it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:12,  1.13it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:11,  1.13it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:10,  1.13it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:10,  1.13it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:09,  1.12it/s]Sampling (mamba memory):  62%|██████▏   | 123/3it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:17,  1.13it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:17,  1.13it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:16,  1.12it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:15,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:15,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:14,  1.12it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:13,  1.12it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:12,  1.12it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:11,  1.12it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:10,  1.12it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:10,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 123/3it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:18,  1.13it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:17,  1.12it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:16,  1.12it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:16,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:15,  1.11it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:14,  1.11it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:13,  1.11it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:12,  1.11it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:11,  1.11it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:11,  1.11it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:10,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 123/4it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:17,  1.14it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:16,  1.13it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:16,  1.13it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:15,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:14,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:13,  1.12it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:12,  1.12it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:12,  1.12it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:11,  1.12it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:10,  1.11it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:09,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 123/4it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:17,  1.14it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:17,  1.13it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:16,  1.12it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:15,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:14,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:14,  1.12it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:13,  1.12it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:12,  1.12it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:11,  1.11it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:11,  1.11it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:10,  1.10it/s]Sampling (mamba memory):  62%|██████▏   | 123/Sampling (mamba memory):  62%|██████▏   | 123/200 [00:19<01:06,  1.15it/s][A[A

0it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:20,  1.10it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:19,  1.09it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:18,  1.09it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:18,  1.09it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:17,  1.08it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:16,  1.08it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:15,  1.08it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:14,  1.08it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:13,  1.08it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:19<01:12,  1.08it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:20<01:11,  1.08it/s]Sampling (mamba memory):  62%|██████▏   | 123/9it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:11<01:21,  1.09it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:20,  1.08it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:19,  1.08it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:19,  1.08it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:18,  1.07it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:17,  1.07it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:16,  1.07it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:15,  1.07it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:14,  1.07it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:19<01:14,  1.07it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:20<01:13,  1.07it/s]Sampling (mamba memory):  62%|██████▏   | 123/Sampling (mamba memory):  62%|██████▏   | 124/200 [00:20<01:06,  1.15it/s][A[A

Sampling (mamba memory):  62%|██████▎   | 125/200 [00:21<01:05,  1.15it/s][A[A

Sampling (mamba memory):  63%|██████▎   | 126/200 [00:22<01:04,  1.15it/s][A[A

Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:03,  1.14it/s][A[A

Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:02,  1.15it/s][A[A

Sampling (mamba memory):  64%|██████▍   | 129/200 [00:24<01:02,  1.14it/s][A[A

Sampling (mamba memory):  65%|██████▌   | 130/200 [00:25<01:01,  1.14it/s][A[A

Sampling (mamba memory):  66%|██████▌   | 131/200 [00:26<01:00,  1.14it/s][A[A

Sampling (mamba memory):  66%|██████▌   | 132/200 [00:27<00:59,  1.14it/s][A[A

Sampling (mamba memory):  66%|██████▋   | 133/200 [00:28<00:58,  1.14it/s][A[A

Sampling (mamba memory):  67%|██████▋   | 134/200 [00:29<00:58,  1.14it/s][A[A

200 [00:20<01:08,  1.12it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:07,  1.12it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:07,  1.12it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:22<01:06,  1.12it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:05,  1.12it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:04,  1.11it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:03,  1.11it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:03,  1.11it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:02,  1.10it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:01,  1.10it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:01,  1.10it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:00,  1.09it/s]Sampling (mamba Sampling (mamba memory):  68%|██████▊   | 135/200 [00:30<00:57,  1.14it/s][A[A

200 [00:20<01:09,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:08,  1.11it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:07,  1.11it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:06,  1.11it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:06,  1.10it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:05,  1.10it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:04,  1.10it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:03,  1.10it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:03,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:02,  1.09it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:01,  1.09it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:00,  1.09it/s]Sampling (mamba 200 [00:20<01:09,  1.12it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:08,  1.11it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:07,  1.11it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:06,  1.11it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:05,  1.11it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:05,  1.11it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:04,  1.10it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:03,  1.10it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:02,  1.10it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:01,  1.10it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:01,  1.09it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:00,  1.09it/s]Sampling (mamba 200 [00:20<01:09,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:08,  1.10it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:07,  1.11it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:07,  1.10it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:06,  1.10it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:05,  1.10it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:04,  1.10it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:03,  1.10it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:03,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:02,  1.09it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:01,  1.09it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:01,  1.08it/s]Sampling (mamba 200 [00:20<01:09,  1.10it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:09,  1.10it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:08,  1.09it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:07,  1.09it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:07,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:06,  1.08it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:05,  1.08it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:04,  1.08it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:04,  1.08it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:03,  1.07it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:02,  1.07it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:01,  1.07it/s]Sampling (mamba Sampling (mamba memory):  68%|██████▊   | 136/200 [00:31<00:56,  1.13it/s][A[A

200 [00:21<01:11,  1.08it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:22<01:10,  1.08it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:09,  1.08it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:08,  1.08it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:08,  1.07it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:07,  1.07it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:06,  1.07it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:05,  1.06it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:05,  1.06it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:04,  1.06it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:03,  1.05it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<01:02,  1.05it/s]Sampling (mamba 200 [00:21<01:12,  1.06it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:22<01:11,  1.06it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:23<01:10,  1.06it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:24<01:09,  1.06it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:25<01:08,  1.06it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:26<01:08,  1.06it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:27<01:07,  1.06it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:06,  1.06it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:05,  1.05it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:04,  1.05it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:03,  1.05it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<01:02,  1.05it/s]Sampling (mamba Sampling (mamba memory):  68%|██████▊   | 137/200 [00:32<00:55,  1.13it/s][A[A

Sampling (mamba memory):  69%|██████▉   | 138/200 [00:32<00:55,  1.12it/s][A[A

Sampling (mamba memory):  70%|██████▉   | 139/200 [00:33<00:54,  1.12it/s][A[A

Sampling (mamba memory):  70%|███████   | 140/200 [00:34<00:53,  1.12it/s][A[A

Sampling (mamba memory):  70%|███████   | 141/200 [00:35<00:53,  1.11it/s][A[A

Sampling (mamba memory):  71%|███████   | 142/200 [00:36<00:52,  1.11it/s][A[A

Sampling (mamba memory):  72%|███████▏  | 143/200 [00:37<00:51,  1.11it/s][A[A

Sampling (mamba memory):  72%|███████▏  | 144/200 [00:38<00:50,  1.10it/s][A[A

Sampling (mamba memory):  72%|███████▎  | 145/200 [00:39<00:49,  1.10it/s][A[A

Sampling (mamba memory):  73%|███████▎  | 146/200 [00:40<00:49,  1.10it/s][A[A

memory):  68%|██████▊   | 135/200 [00:31<00:59,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:58,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:32<00:57,  1.09it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:33<00:57,  1.08it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:34<00:56,  1.08it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:35<00:55,  1.08it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:36<00:54,  1.08it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:37<00:53,  1.08it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:38<00:52,  1.08it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:51,  1.08it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:51,  1.07it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:31<00:59,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:58,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:57,  1.09it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:56,  1.09it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:55,  1.09it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:55,  1.09it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:36<00:54,  1.09it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:37<00:53,  1.09it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:38<00:52,  1.09it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:51,  1.09it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:50,  1.08it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:31<00:59,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:58,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:57,  1.09it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:56,  1.09it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:56,  1.08it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:55,  1.08it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:54,  1.08it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:37<00:53,  1.08it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:38<00:52,  1.08it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:52,  1.07it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:51,  1.07it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:31<01:00,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:59,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:58,  1.07it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:58,  1.07it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:57,  1.06it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:56,  1.06it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:55,  1.05it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:54,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:53,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:53,  1.05it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:52,  1.05it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▎  | 147/200 [00:41<00:48,  1.10it/s][A[A

memory):  68%|██████▊   | 135/200 [00:31<01:00,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:59,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:59,  1.07it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:58,  1.07it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:57,  1.06it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:56,  1.06it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:55,  1.06it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:54,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:54,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:53,  1.05it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:52,  1.05it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:32<01:01,  1.05it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:33<01:00,  1.05it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:34<01:00,  1.05it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:35<00:59,  1.05it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:36<00:58,  1.04it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:37<00:57,  1.04it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:38<00:56,  1.05it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:39<00:55,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:40<00:54,  1.04it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:41<00:53,  1.04it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:52,  1.04it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▍  | 148/200 [00:42<00:47,  1.10it/s][A[A

memory):  68%|██████▊   | 135/200 [00:32<01:02,  1.05it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:33<01:01,  1.05it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:34<01:00,  1.04it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:35<00:59,  1.04it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:36<00:58,  1.04it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:37<00:57,  1.04it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:38<00:57,  1.03it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:39<00:56,  1.03it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:40<00:55,  1.03it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:41<00:54,  1.03it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:42<00:53,  1.03it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▍  | 149/200 [00:42<00:46,  1.10it/s][A[A

Sampling (mamba memory):  75%|███████▌  | 150/200 [00:43<00:45,  1.10it/s][A[A

Sampling (mamba memory):  76%|███████▌  | 151/200 [00:44<00:44,  1.10it/s][A[A

Sampling (mamba memory):  76%|███████▌  | 152/200 [00:45<00:43,  1.10it/s][A[A

Sampling (mamba memory):  76%|███████▋  | 153/200 [00:46<00:42,  1.10it/s][A[A

Sampling (mamba memory):  77%|███████▋  | 154/200 [00:47<00:42,  1.09it/s][A[A

Sampling (mamba memory):  78%|███████▊  | 155/200 [00:48<00:41,  1.09it/s][A[A

Sampling (mamba memory):  78%|███████▊  | 156/200 [00:49<00:40,  1.09it/s][A[A

Sampling (mamba memory):  78%|███████▊  | 157/200 [00:50<00:39,  1.09it/s][A[A

 | 146/200 [00:41<00:50,  1.07it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:49,  1.07it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:48,  1.07it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:47,  1.07it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:46,  1.07it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:46,  1.06it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:46<00:45,  1.06it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:47<00:44,  1.06it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:48<00:43,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:49<00:42,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:50<00:41,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:51<00:40 | 146/200 [00:41<00:49,  1.08it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:48,  1.08it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:48,  1.08it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:47,  1.08it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:46,  1.08it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:45,  1.07it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:44,  1.07it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:44,  1.07it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:43,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:49<00:42,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:50<00:41,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:51<00:40 | 146/200 [00:41<00:50,  1.07it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:49,  1.07it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:48,  1.07it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:47,  1.07it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:46,  1.07it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:45,  1.07it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:45,  1.07it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:44,  1.07it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:43,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:42,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:41,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:40Sampling (mamba memory):  79%|███████▉  | 158/200 [00:51<00:38,  1.09it/s][A[A

 | 146/200 [00:42<00:51,  1.05it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:50,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:49,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:48,  1.05it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:47,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:46,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:45,  1.05it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:44,  1.05it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:43,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:42,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:41,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:40 | 146/200 [00:41<00:51,  1.05it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:50,  1.04it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:49,  1.04it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:49,  1.04it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:48,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:47,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:46,  1.03it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:45,  1.03it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:44,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:43,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:42,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:41Sampling (mamba memory):  80%|███████▉  | 159/200 [00:52<00:37,  1.09it/s][A[A

 | 146/200 [00:42<00:51,  1.04it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:50,  1.04it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:49,  1.04it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:49,  1.04it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:48,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:47,  1.03it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:48<00:46,  1.03it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:49<00:45,  1.03it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:50<00:44,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:51<00:43,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:52<00:42,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:53<00:41Sampling (mamba memory):  80%|████████  | 160/200 [00:53<00:36,  1.09it/s][A[A

 | 146/200 [00:43<00:52,  1.03it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:44<00:51,  1.03it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:45<00:50,  1.02it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:46<00:50,  1.02it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:47<00:49,  1.01it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:48<00:48,  1.01it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:49<00:47,  1.02it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:50<00:46,  1.02it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:51<00:45,  1.02it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:52<00:44,  1.02it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:53<00:43,  1.02it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:54<00:42Sampling (mamba memory):  80%|████████  | 161/200 [00:53<00:35,  1.09it/s][A[A

Sampling (mamba memory):  81%|████████  | 162/200 [00:54<00:34,  1.09it/s][A[A

Sampling (mamba memory):  82%|████████▏ | 163/200 [00:55<00:34,  1.08it/s][A[A

Sampling (mamba memory):  82%|████████▏ | 164/200 [00:56<00:33,  1.08it/s][A[A

Sampling (mamba memory):  82%|████████▎ | 165/200 [00:57<00:32,  1.08it/s][A[A

Sampling (mamba memory):  83%|████████▎ | 166/200 [00:58<00:31,  1.08it/s][A[A

Sampling (mamba memory):  84%|████████▎ | 167/200 [00:59<00:30,  1.08it/s][A[A

Sampling (mamba memory):  84%|████████▍ | 168/200 [01:00<00:29,  1.07it/s][A[A

Sampling (mamba memory):  84%|████████▍ | 169/200 [01:01<00:28,  1.07it/s][A[A

,  1.05it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:52<00:40,  1.05it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:53<00:39,  1.05it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:54<00:38,  1.04it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:55<00:37,  1.04it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:56<00:36,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:57<00:35,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:58<00:34,  1.04it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [00:59<00:33,  1.04it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:00<00:32,  1.03it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:01<00:32,  1.03it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:02<00:31,  1.03it/s,  1.06it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:52<00:39,  1.06it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:53<00:39,  1.05it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:54<00:38,  1.05it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:55<00:37,  1.05it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:56<00:36,  1.05it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:57<00:35,  1.05it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:58<00:34,  1.04it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [00:59<00:33,  1.04it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:00<00:32,  1.04it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:01<00:31,  1.03it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:02<00:31,  1.03it/s,  1.06it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:52<00:39,  1.06it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:53<00:38,  1.06it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:54<00:37,  1.05it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:55<00:37,  1.05it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:56<00:36,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:57<00:35,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:58<00:34,  1.04it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [00:59<00:33,  1.04it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:00<00:32,  1.04it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:01<00:31,  1.04it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:02<00:30,  1.04it/s,  1.05it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:53<00:39,  1.05it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:54<00:38,  1.05it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:55<00:38,  1.05it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:56<00:37,  1.05it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:57<00:36,  1.05it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:35,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:34,  1.04it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:33,  1.04it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:32,  1.03it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:02<00:32,  1.03it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:03<00:31,  1.03it/sSampling (mamba memory):  85%|████████▌ | 170/200 [01:02<00:28,  1.06it/s][A[A

,  1.03it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:53<00:41,  1.02it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:54<00:40,  1.02it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:55<00:39,  1.02it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:56<00:38,  1.02it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:57<00:37,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:36,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:35,  1.02it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:34,  1.01it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:33,  1.01it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:02<00:32,  1.00it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:03<00:31,  1.00it/sSampling (mamba memory):  86%|████████▌ | 171/200 [01:03<00:27,  1.06it/s][A[A

,  1.03it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:54<00:40,  1.02it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:55<00:39,  1.03it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:56<00:39,  1.02it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:57<00:38,  1.02it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:58<00:37,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:59<00:36,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:00<00:35,  1.01it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:01<00:34,  1.00it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:02<00:34,  1.00s/it]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:03<00:33,  1.00s/it]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:04<00:32,  1.01s/itSampling (mamba memory):  86%|████████▌ | 172/200 [01:04<00:26,  1.05it/s][A[A

,  1.02it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:55<00:41,  1.01it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:56<00:40,  1.01it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:57<00:39,  1.01it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:58<00:38,  1.01it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:59<00:37,  1.00it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [01:00<00:36,  1.00it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:01<00:36,  1.00s/it]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:02<00:35,  1.01s/it]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:03<00:34,  1.01s/it]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:04<00:33,  1.01s/it]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:05<00:32,  1.02s/itSampling (mamba memory):  86%|████████▋ | 173/200 [01:05<00:25,  1.05it/s][A[A

Sampling (mamba memory):  87%|████████▋ | 174/200 [01:06<00:24,  1.04it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 175/200 [01:07<00:24,  1.04it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 176/200 [01:08<00:23,  1.04it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 177/200 [01:09<00:22,  1.04it/s][A[A

Sampling (mamba memory):  89%|████████▉ | 178/200 [01:10<00:21,  1.03it/s][A[A

Sampling (mamba memory):  90%|████████▉ | 179/200 [01:11<00:20,  1.03it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:12<00:19,  1.03it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:03<00:30,  1.03it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:04<00:29,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:05<00:28,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:06<00:27,  1.02it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:07<00:26,  1.02it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:08<00:25,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:09<00:24,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:10<00:23,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:11<00:22,  1.02it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:12<00:21,  1.02it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:13<00:20,  1.02it/s]]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:03<00:30,  1.03it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:04<00:29,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:05<00:28,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:06<00:27,  1.02it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:07<00:26,  1.02it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:08<00:25,  1.03it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:09<00:24,  1.03it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:10<00:23,  1.03it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:11<00:22,  1.03it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:12<00:21,  1.02it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:13<00:20,  1.02it/s]]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:03<00:29,  1.04it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:04<00:28,  1.04it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:05<00:28,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:06<00:27,  1.03it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:07<00:26,  1.03it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:08<00:25,  1.03it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:09<00:24,  1.03it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:10<00:23,  1.03it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:11<00:22,  1.03it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:12<00:21,  1.03it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:13<00:20,  1.03it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:13<00:18,  1.03it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:04<00:30,  1.02it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:05<00:29,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:06<00:28,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:07<00:27,  1.02it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:08<00:26,  1.02it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:09<00:25,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:10<00:24,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:11<00:23,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:12<00:22,  1.01it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:13<00:21,  1.01it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:14<00:20,  1.00it/s]]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:04<00:31,  1.00s/it]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:05<00:30,  1.00s/it]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:06<00:29,  1.00s/it]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:07<00:28,  1.00s/it]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:08<00:27,  1.00s/it]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:09<00:26,  1.00s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:10<00:25,  1.00s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:11<00:24,  1.00s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:12<00:23,  1.01s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:13<00:22,  1.01s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:14<00:21,  1.01s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:13<00:17,  1.03it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:05<00:31,  1.01s/it]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:06<00:30,  1.01s/it]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:07<00:29,  1.01s/it]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:08<00:28,  1.01s/it]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:09<00:27,  1.01s/it]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:10<00:26,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:11<00:25,  1.02s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:12<00:24,  1.02s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:13<00:23,  1.02s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:14<00:22,  1.02s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:15<00:21,  1.02s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:14<00:16,  1.03it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:06<00:31,  1.02s/it]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:07<00:30,  1.02s/it]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:08<00:29,  1.02s/it]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:09<00:28,  1.02s/it]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:10<00:27,  1.02s/it]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:11<00:26,  1.02s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:12<00:25,  1.03s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:13<00:24,  1.03s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:14<00:23,  1.03s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:15<00:22,  1.03s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:16<00:21,  1.03s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:15<00:15,  1.03it/s][A[A

Sampling (mamba memory):  92%|█████████▎| 185/200 [01:16<00:14,  1.03it/s][A[A

Sampling (mamba memory):  93%|█████████▎| 186/200 [01:17<00:13,  1.02it/s][A[A

Sampling (mamba memory):  94%|█████████▎| 187/200 [01:18<00:12,  1.02it/s][A[A

Sampling (mamba memory):  94%|█████████▍| 188/200 [01:19<00:11,  1.02it/s][A[A

Sampling (mamba memory):  94%|█████████▍| 189/200 [01:20<00:10,  1.02it/s][A[A

Sampling (mamba memory):  95%|█████████▌| 190/200 [01:21<00:09,  1.01it/s][A[A

Sampling (mamba memory):  96%|█████████▌| 191/200 [01:22<00:08,  1.01it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:14<00:19,  1.02it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:15<00:18,  1.03it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:16<00:17,  1.03it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:17<00:16,  1.03it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:18<00:15,  1.03it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:18<00:14,  1.03it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:19<00:13,  1.02it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:20<00:12,  1.02it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:21<00:11,  1.02it/s]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:22<00:10,  1.01it/s]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:23<00Sampling (mamba memory):  90%|█████████ | 180/200 [01:14<00:19,  1.02it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:15<00:18,  1.02it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:16<00:17,  1.03it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:17<00:16,  1.02it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:18<00:15,  1.02it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:19<00:14,  1.02it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:20<00:13,  1.01it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:21<00:12,  1.01it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:22<00:11,  1.01it/s]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:23<00:10,  1.01it/s]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:24<00Sampling (mamba memory):  90%|█████████ | 180/200 [01:14<00:19,  1.02it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:15<00:18,  1.02it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:16<00:17,  1.02it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:17<00:16,  1.02it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:18<00:15,  1.02it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:19<00:14,  1.02it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:20<00:13,  1.02it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:21<00:12,  1.02it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:22<00:11,  1.01it/s]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:23<00:10,  1.01it/s]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:24<00Sampling (mamba memory):  96%|█████████▌| 192/200 [01:23<00:07,  1.01it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:15<00:19,  1.00it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:16<00:18,  1.00it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:17<00:17,  1.00it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:18<00:17,  1.00s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:19<00:16,  1.00s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:20<00:15,  1.00s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:21<00:14,  1.00s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:22<00:13,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:23<00:12,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:24<00:11,  1.01s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:25<00Sampling (mamba memory):  96%|█████████▋| 193/200 [01:24<00:06,  1.01it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:15<00:20,  1.01s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:16<00:19,  1.01s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:17<00:18,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:18<00:17,  1.02s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:19<00:16,  1.02s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:20<00:15,  1.02s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:21<00:14,  1.02s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:22<00:13,  1.02s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:23<00:12,  1.02s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:24<00:11,  1.03s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:25<00Sampling (mamba memory):  97%|█████████▋| 194/200 [01:25<00:05,  1.01it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:16<00:20,  1.02s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:17<00:19,  1.02s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:18<00:18,  1.03s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:19<00:17,  1.03s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:20<00:16,  1.03s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:21<00:15,  1.04s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:23<00:14,  1.04s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:24<00:13,  1.04s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:25<00:12,  1.04s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:26<00:11,  1.03s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:27<00Sampling (mamba memory):  98%|█████████▊| 195/200 [01:26<00:04,  1.01it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:17<00:20,  1.04s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:18<00:19,  1.04s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:19<00:18,  1.04s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:20<00:17,  1.04s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:21<00:16,  1.04s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:22<00:15,  1.04s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:23<00:14,  1.04s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:24<00:13,  1.04s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:26<00:12,  1.04s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:27<00:11,  1.03s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:28<00Sampling (mamba memory):  98%|█████████▊| 196/200 [01:27<00:03,  1.01it/s][A[A

Sampling (mamba memory):  98%|█████████▊| 197/200 [01:28<00:02,  1.01it/s][A[A

Sampling (mamba memory):  99%|█████████▉| 198/200 [01:29<00:01,  1.01it/s][A[A

Sampling (mamba memory): 100%|█████████▉| 199/200 [01:30<00:00,  1.01it/s][A[A

Sampling (mamba memory): 100%|██████████| 200/200 [01:31<00:00,  1.00it/s][A[ASampling (mamba memory): 100%|██████████| 200/200 [01:36<00:00,  1.03it/s]
Validation DataLoader 0:   0%|          | 0/1 [00:00<?, ?it/s][A
:09,  1.01it/s]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:24<00:08,  1.00it/s]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:25<00:07,  1.00it/s]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:26<00:07,  1.00s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:27<00:06,  1.00s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:28<00:05,  1.00s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:29<00:04,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:31<00:03,  1.01s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:32<00:02,  1.01s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:33<00:01,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:34<00:00,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:38<00:00,  1.01it/s]
:09,  1.01it/s]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:25<00:08,  1.01it/s]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:26<00:07,  1.01it/s]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:27<00:06,  1.01it/s]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:28<00:05,  1.00it/s]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:29<00:04,  1.00it/s]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:30<00:03,  1.00it/s]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:31<00:02,  1.00it/s]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:32<00:02,  1.00s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:33<00:01,  1.00s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:34<00:00,  1.00s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:39<00:00,  1.01it/s]
:09,  1.01it/s]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:25<00:08,  1.01it/s]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:26<00:07,  1.00it/s]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:27<00:06,  1.00it/s]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:28<00:05,  1.00it/s]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:29<00:04,  1.00it/s]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:30<00:03,  1.00it/s]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:31<00:02,  1.00it/s]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:32<00:02,  1.00s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:33<00:01,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:34<00:00,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:39<00:00,  1.01it/s]
:10,  1.01s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:26<00:09,  1.01s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:27<00:08,  1.02s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:28<00:07,  1.02s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:29<00:06,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:30<00:05,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:31<00:04,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:32<00:03,  1.02s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:33<00:02,  1.02s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:34<00:01,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:35<00:00,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:40<00:00,  1.00s/it]
:10,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:26<00:09,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:27<00:08,  1.03s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:29<00:07,  1.03s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:30<00:06,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:31<00:05,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:32<00:04,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:33<00:03,  1.04s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:34<00:02,  1.04s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:35<00:01,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:36<00:00,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:40<00:00,  1.01s/it]
:10,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:28<00:09,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:29<00:08,  1.03s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:30<00:07,  1.03s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:31<00:06,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:32<00:05,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:33<00:04,  1.05s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:34<00:03,  1.05s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:35<00:02,  1.04s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:36<00:01,  1.04s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:37<00:00,  1.04s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:42<00:00,  1.02s/it]
:10,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:29<00:09,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:30<00:08,  1.03s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:31<00:07,  1.04s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:32<00:06,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:33<00:05,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:34<00:04,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:35<00:03,  1.03s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:36<00:02,  1.03s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:37<00:01,  1.04s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:38<00:00,  1.04s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:42<00:00,  1.03s/it]
Validation DataLoader 0: 100%|██████████| 1/1 [01:36<00:00,  0.01it/s][A
                                                                      [AEpoch 0:  10%|▉         | 20000/203307 [22:43:52<208:20:24,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 20001/203307 [22:43:57<208:20:25,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  10%|▉         | 20001/203307 [22:43:57<208:20:25,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20002/203307 [22:44:00<208:20:17,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20002/203307 [22:44:00<208:20:17,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20003/203307 [22:44:05<208:20:15,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20003/203307 [22:44:05<208:20:16,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20004/203307 [22:44:09<208:20:08,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20004/203307 [22:44:09<208:20:09,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20005/203307 [22:44:12<208:20:01,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20005/203307 [22:44:12<208:20:01,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20006/203307 [22:44:16<208:19:55,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20006/203307 [22:44:16<208:19:55,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20007/203307 [22:44:20<208:19:46,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20007/203307 [22:44:20<208:19:47,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20008/203307 [22:44:24<208:19:42,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20008/203307 [22:44:24<208:19:42,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20009/203307 [22:44:28<208:19:41,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20009/203307 [22:44:28<208:19:41,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20010/203307 [22:44:33<208:19:40,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20010/203307 [22:44:33<208:19:40,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20011/203307 [22:44:37<208:19:37,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20011/203307 [22:44:37<208:19:37,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20012/203307 [22:44:41<208:19:30,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20012/203307 [22:44:41<208:19:30,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20013/203307 [22:44:44<208:19:23,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20013/203307 [22:44:44<208:19:23,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20014/203307 [22:44:48<208:19:14,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20014/203307 [22:44:48<208:19:14,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20015/203307 [22:44:52<208:19:08,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20015/203307 [22:44:52<208:19:08,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20016/203307 [22:44:56<208:19:06,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20016/203307 [22:44:56<208:19:06,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20017/203307 [22:45:00<208:18:59,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20017/203307 [22:45:00<208:18:59,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20018/203307 [22:45:04<208:18:58,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20018/203307 [22:45:04<208:18:58,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20019/203307 [22:45:09<208:18:57,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20019/203307 [22:45:09<208:18:57,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20020/203307 [22:45:13<208:18:54,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20020/203307 [22:45:13<208:18:54,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20021/203307 [22:45:17<208:18:46,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  10%|▉         | 20021/203307 [22:45:17<208:18:46,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20022/203307 [22:45:21<208:18:39,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20022/203307 [22:45:21<208:18:39,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20023/203307 [22:45:24<208:18:32,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20023/203307 [22:45:24<208:18:32,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20024/203307 [22:45:29<208:18:30,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20024/203307 [22:45:29<208:18:30,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20025/203307 [22:45:32<208:18:23,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20025/203307 [22:45:32<208:18:23,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20026/203307 [22:45:37<208:18:22,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20026/203307 [22:45:37<208:18:22,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20027/203307 [22:45:40<208:18:14,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20027/203307 [22:45:40<208:18:14,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20028/203307 [22:45:45<208:18:13,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20028/203307 [22:45:45<208:18:13,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20029/203307 [22:45:49<208:18:05,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20029/203307 [22:45:49<208:18:05,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20030/203307 [22:45:52<208:17:58,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20030/203307 [22:45:52<208:17:58,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20031/203307 [22:45:56<208:17:50,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20031/203307 [22:45:56<208:17:50,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20032/203307 [22:46:00<208:17:43,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20032/203307 [22:46:00<208:17:43,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20033/203307 [22:46:04<208:17:40,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20033/203307 [22:46:04<208:17:40,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20034/203307 [22:46:08<208:17:33,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20034/203307 [22:46:08<208:17:33,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20035/203307 [22:46:12<208:17:32,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20035/203307 [22:46:12<208:17:32,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20036/203307 [22:46:17<208:17:31,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20036/203307 [22:46:17<208:17:31,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20037/203307 [22:46:20<208:17:24,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20037/203307 [22:46:20<208:17:24,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20038/203307 [22:46:25<208:17:21,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20038/203307 [22:46:25<208:17:21,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20039/203307 [22:46:28<208:17:14,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20039/203307 [22:46:28<208:17:14,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20040/203307 [22:46:32<208:17:07,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20040/203307 [22:46:32<208:17:07,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20041/203307 [22:46:36<208:17:05,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|▉         | 20041/203307 [22:46:36<208:17:05,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20042/203307 [22:46:40<208:16:58,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20042/203307 [22:46:40<208:16:58,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20043/203307 [22:46:45<208:16:57,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20043/203307 [22:46:45<208:16:57,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20044/203307 [22:46:48<208:16:50,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20044/203307 [22:46:48<208:16:50,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20045/203307 [22:46:53<208:16:49,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20045/203307 [22:46:53<208:16:49,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20046/203307 [22:46:57<208:16:42,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20046/203307 [22:46:57<208:16:42,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20047/203307 [22:47:01<208:16:39,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20047/203307 [22:47:01<208:16:39,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20048/203307 [22:47:05<208:16:31,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20048/203307 [22:47:05<208:16:31,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20049/203307 [22:47:09<208:16:29,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20049/203307 [22:47:09<208:16:29,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20050/203307 [22:47:13<208:16:22,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20050/203307 [22:47:13<208:16:22,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20051/203307 [22:47:17<208:16:21,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20051/203307 [22:47:17<208:16:21,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20052/203307 [22:47:21<208:16:20,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20052/203307 [22:47:21<208:16:20,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20053/203307 [22:47:25<208:16:12,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20053/203307 [22:47:25<208:16:12,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20054/203307 [22:47:30<208:16:11,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20054/203307 [22:47:30<208:16:11,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20055/203307 [22:47:34<208:16:08,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20055/203307 [22:47:34<208:16:08,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20056/203307 [22:47:38<208:16:01,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20056/203307 [22:47:38<208:16:01,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20057/203307 [22:47:41<208:15:53,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20057/203307 [22:47:41<208:15:53,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20058/203307 [22:47:46<208:15:51,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20058/203307 [22:47:46<208:15:51,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20059/203307 [22:47:49<208:15:43,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20059/203307 [22:47:49<208:15:43,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20060/203307 [22:47:54<208:15:43,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20060/203307 [22:47:54<208:15:43,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20061/203307 [22:47:58<208:15:42,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|▉         | 20061/203307 [22:47:58<208:15:42,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20062/203307 [22:48:02<208:15:40,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20062/203307 [22:48:02<208:15:40,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20063/203307 [22:48:06<208:15:33,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20063/203307 [22:48:06<208:15:33,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20064/203307 [22:48:10<208:15:25,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20064/203307 [22:48:10<208:15:25,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20065/203307 [22:48:14<208:15:22,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20065/203307 [22:48:14<208:15:22,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20066/203307 [22:48:19<208:15:22,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20066/203307 [22:48:19<208:15:22,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20067/203307 [22:48:22<208:15:15,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20067/203307 [22:48:22<208:15:15,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20068/203307 [22:48:27<208:15:13,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20068/203307 [22:48:27<208:15:13,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20069/203307 [22:48:31<208:15:12,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20069/203307 [22:48:31<208:15:12,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20070/203307 [22:48:35<208:15:05,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20070/203307 [22:48:35<208:15:05,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20071/203307 [22:48:39<208:15:03,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20071/203307 [22:48:39<208:15:03,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20072/203307 [22:48:43<208:14:56,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20072/203307 [22:48:43<208:14:56,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20073/203307 [22:48:47<208:14:48,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20073/203307 [22:48:47<208:14:48,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20074/203307 [22:48:51<208:14:46,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20074/203307 [22:48:51<208:14:46,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20075/203307 [22:48:55<208:14:39,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20075/203307 [22:48:55<208:14:39,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20076/203307 [22:48:59<208:14:36,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20076/203307 [22:48:59<208:14:37,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20077/203307 [22:49:03<208:14:30,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20077/203307 [22:49:03<208:14:30,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20078/203307 [22:49:07<208:14:30,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20078/203307 [22:49:07<208:14:30,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20079/203307 [22:49:11<208:14:21,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20079/203307 [22:49:11<208:14:21,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20080/203307 [22:49:15<208:14:20,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20080/203307 [22:49:15<208:14:20,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20081/203307 [22:49:19<208:14:13,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  10%|▉         | 20081/203307 [22:49:19<208:14:13,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20082/203307 [22:49:23<208:14:09,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20082/203307 [22:49:23<208:14:09,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20083/203307 [22:49:28<208:14:06,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20083/203307 [22:49:28<208:14:06,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20084/203307 [22:49:31<208:13:59,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20084/203307 [22:49:31<208:13:59,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20085/203307 [22:49:36<208:13:58,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20085/203307 [22:49:36<208:13:58,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20086/203307 [22:49:39<208:13:51,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20086/203307 [22:49:39<208:13:51,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20087/203307 [22:49:44<208:13:50,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20087/203307 [22:49:44<208:13:50,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20088/203307 [22:49:48<208:13:49,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20088/203307 [22:49:48<208:13:49,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20089/203307 [22:49:52<208:13:42,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20089/203307 [22:49:52<208:13:42,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20090/203307 [22:49:56<208:13:34,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20090/203307 [22:49:56<208:13:34,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20091/203307 [22:50:00<208:13:33,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20091/203307 [22:50:00<208:13:33,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20092/203307 [22:50:04<208:13:30,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20092/203307 [22:50:04<208:13:30,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20093/203307 [22:50:09<208:13:28,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20093/203307 [22:50:09<208:13:28,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20094/203307 [22:50:12<208:13:21,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20094/203307 [22:50:12<208:13:21,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20095/203307 [22:50:17<208:13:19,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20095/203307 [22:50:17<208:13:19,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20096/203307 [22:50:21<208:13:12,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20096/203307 [22:50:21<208:13:12,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20097/203307 [22:50:25<208:13:12,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20097/203307 [22:50:25<208:13:12,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20098/203307 [22:50:29<208:13:05,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20098/203307 [22:50:29<208:13:05,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20099/203307 [22:50:33<208:13:03,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20099/203307 [22:50:33<208:13:03,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20100/203307 [22:50:37<208:12:56,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20100/203307 [22:50:37<208:12:57,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20101/203307 [22:50:41<208:12:55,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  10%|▉         | 20101/203307 [22:50:41<208:12:55,  0.24it/s, v_num=t5e6, training/loss=0.093] Epoch 0:  10%|▉         | 20102/203307 [22:50:45<208:12:48,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20102/203307 [22:50:45<208:12:48,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20103/203307 [22:50:49<208:12:41,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20103/203307 [22:50:49<208:12:41,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20104/203307 [22:50:53<208:12:40,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20104/203307 [22:50:53<208:12:40,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20105/203307 [22:50:57<208:12:34,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20105/203307 [22:50:57<208:12:34,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20106/203307 [22:51:02<208:12:33,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20106/203307 [22:51:02<208:12:33,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20107/203307 [22:51:05<208:12:25,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20107/203307 [22:51:05<208:12:25,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20108/203307 [22:51:10<208:12:23,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20108/203307 [22:51:10<208:12:23,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20109/203307 [22:51:14<208:12:20,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20109/203307 [22:51:14<208:12:20,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20110/203307 [22:51:18<208:12:19,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20110/203307 [22:51:18<208:12:19,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20111/203307 [22:51:22<208:12:12,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20111/203307 [22:51:22<208:12:12,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20112/203307 [22:51:26<208:12:05,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20112/203307 [22:51:26<208:12:05,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20113/203307 [22:51:30<208:12:05,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20113/203307 [22:51:30<208:12:05,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20114/203307 [22:51:35<208:12:04,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20114/203307 [22:51:35<208:12:04,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20115/203307 [22:51:39<208:11:56,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20115/203307 [22:51:39<208:11:56,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20116/203307 [22:51:43<208:11:53,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20116/203307 [22:51:43<208:11:53,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20117/203307 [22:51:47<208:11:46,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20117/203307 [22:51:47<208:11:46,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20118/203307 [22:51:51<208:11:45,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20118/203307 [22:51:51<208:11:45,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20119/203307 [22:51:55<208:11:42,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20119/203307 [22:51:55<208:11:42,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20120/203307 [22:51:59<208:11:34,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20120/203307 [22:51:59<208:11:34,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20121/203307 [22:52:03<208:11:34,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  10%|▉         | 20121/203307 [22:52:03<208:11:34,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20122/203307 [22:52:07<208:11:27,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20122/203307 [22:52:07<208:11:27,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20123/203307 [22:52:12<208:11:26,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20123/203307 [22:52:12<208:11:26,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20124/203307 [22:52:16<208:11:23,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20124/203307 [22:52:16<208:11:23,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20125/203307 [22:52:19<208:11:15,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20125/203307 [22:52:19<208:11:16,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20126/203307 [22:52:24<208:11:15,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20126/203307 [22:52:24<208:11:15,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20127/203307 [22:52:28<208:11:08,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20127/203307 [22:52:28<208:11:08,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20128/203307 [22:52:32<208:11:05,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20128/203307 [22:52:32<208:11:05,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20129/203307 [22:52:36<208:10:57,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20129/203307 [22:52:36<208:10:58,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20130/203307 [22:52:40<208:10:58,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20130/203307 [22:52:40<208:10:58,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20131/203307 [22:52:44<208:10:51,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20131/203307 [22:52:44<208:10:51,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20132/203307 [22:52:48<208:10:50,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20132/203307 [22:52:48<208:10:50,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20133/203307 [22:52:53<208:10:48,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20133/203307 [22:52:53<208:10:48,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20134/203307 [22:52:57<208:10:41,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20134/203307 [22:52:57<208:10:41,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20135/203307 [22:53:01<208:10:39,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20135/203307 [22:53:01<208:10:39,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20136/203307 [22:53:05<208:10:36,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20136/203307 [22:53:05<208:10:36,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20137/203307 [22:53:09<208:10:28,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20137/203307 [22:53:09<208:10:28,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20138/203307 [22:53:13<208:10:22,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20138/203307 [22:53:13<208:10:22,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20139/203307 [22:53:17<208:10:22,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20139/203307 [22:53:17<208:10:22,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20140/203307 [22:53:21<208:10:20,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20140/203307 [22:53:21<208:10:20,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20141/203307 [22:53:26<208:10:17,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|▉         | 20141/203307 [22:53:26<208:10:17,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20142/203307 [22:53:29<208:10:10,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20142/203307 [22:53:29<208:10:10,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20143/203307 [22:53:34<208:10:07,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20143/203307 [22:53:34<208:10:08,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20144/203307 [22:53:38<208:10:00,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20144/203307 [22:53:38<208:10:01,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20145/203307 [22:53:41<208:09:54,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20145/203307 [22:53:41<208:09:54,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20146/203307 [22:53:46<208:09:51,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20146/203307 [22:53:46<208:09:51,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20147/203307 [22:53:50<208:09:49,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20147/203307 [22:53:50<208:09:49,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20148/203307 [22:53:54<208:09:41,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20148/203307 [22:53:54<208:09:41,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20149/203307 [22:53:58<208:09:41,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20149/203307 [22:53:58<208:09:41,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20150/203307 [22:54:02<208:09:34,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20150/203307 [22:54:02<208:09:34,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20151/203307 [22:54:06<208:09:31,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20151/203307 [22:54:06<208:09:31,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20152/203307 [22:54:10<208:09:24,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20152/203307 [22:54:10<208:09:24,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20153/203307 [22:54:14<208:09:16,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20153/203307 [22:54:14<208:09:16,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20154/203307 [22:54:17<208:09:09,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20154/203307 [22:54:17<208:09:09,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20155/203307 [22:54:22<208:09:07,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20155/203307 [22:54:22<208:09:07,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20156/203307 [22:54:26<208:09:06,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20156/203307 [22:54:26<208:09:06,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20157/203307 [22:54:30<208:08:59,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20157/203307 [22:54:30<208:08:59,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20158/203307 [22:54:34<208:08:58,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20158/203307 [22:54:34<208:08:58,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20159/203307 [22:54:38<208:08:50,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20159/203307 [22:54:38<208:08:50,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20160/203307 [22:54:42<208:08:48,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20160/203307 [22:54:42<208:08:48,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20161/203307 [22:54:46<208:08:41,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  10%|▉         | 20161/203307 [22:54:46<208:08:41,  0.24it/s, v_num=t5e6, training/loss=0.080] Epoch 0:  10%|▉         | 20162/203307 [22:54:50<208:08:34,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20162/203307 [22:54:50<208:08:35,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20163/203307 [22:54:54<208:08:31,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20163/203307 [22:54:54<208:08:31,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20164/203307 [22:54:58<208:08:25,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20164/203307 [22:54:58<208:08:25,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20165/203307 [22:55:02<208:08:24,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20165/203307 [22:55:02<208:08:24,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20166/203307 [22:55:07<208:08:23,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20166/203307 [22:55:07<208:08:23,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20167/203307 [22:55:10<208:08:15,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20167/203307 [22:55:10<208:08:15,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20168/203307 [22:55:15<208:08:13,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20168/203307 [22:55:15<208:08:13,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20169/203307 [22:55:18<208:08:06,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20169/203307 [22:55:18<208:08:06,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20170/203307 [22:55:22<208:07:59,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20170/203307 [22:55:22<208:07:59,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20171/203307 [22:55:26<208:07:53,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20171/203307 [22:55:26<208:07:53,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20172/203307 [22:55:30<208:07:46,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20172/203307 [22:55:30<208:07:46,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20173/203307 [22:55:34<208:07:45,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20173/203307 [22:55:34<208:07:45,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20174/203307 [22:55:39<208:07:43,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20174/203307 [22:55:39<208:07:43,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20175/203307 [22:55:43<208:07:42,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20175/203307 [22:55:43<208:07:42,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20176/203307 [22:55:47<208:07:39,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20176/203307 [22:55:47<208:07:39,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20177/203307 [22:55:51<208:07:32,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20177/203307 [22:55:51<208:07:32,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20178/203307 [22:55:55<208:07:25,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20178/203307 [22:55:55<208:07:25,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20179/203307 [22:55:59<208:07:17,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20179/203307 [22:55:59<208:07:18,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20180/203307 [22:56:02<208:07:10,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20180/203307 [22:56:02<208:07:10,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20181/203307 [22:56:06<208:07:04,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20181/203307 [22:56:06<208:07:04,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20182/203307 [22:56:11<208:07:03,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20182/203307 [22:56:11<208:07:03,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20183/203307 [22:56:15<208:07:01,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20183/203307 [22:56:15<208:07:01,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20184/203307 [22:56:19<208:07:00,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20184/203307 [22:56:19<208:07:00,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20185/203307 [22:56:24<208:06:58,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20185/203307 [22:56:24<208:06:58,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20186/203307 [22:56:27<208:06:50,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20186/203307 [22:56:27<208:06:50,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20187/203307 [22:56:31<208:06:43,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20187/203307 [22:56:31<208:06:43,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20188/203307 [22:56:35<208:06:36,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20188/203307 [22:56:35<208:06:36,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20189/203307 [22:56:39<208:06:29,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20189/203307 [22:56:39<208:06:29,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20190/203307 [22:56:43<208:06:26,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20190/203307 [22:56:43<208:06:26,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20191/203307 [22:56:47<208:06:25,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20191/203307 [22:56:47<208:06:25,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20192/203307 [22:56:52<208:06:23,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20192/203307 [22:56:52<208:06:23,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20193/203307 [22:56:56<208:06:21,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20193/203307 [22:56:56<208:06:21,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20194/203307 [22:57:00<208:06:14,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20194/203307 [22:57:00<208:06:14,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20195/203307 [22:57:03<208:06:07,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20195/203307 [22:57:03<208:06:07,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20196/203307 [22:57:07<208:06:00,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20196/203307 [22:57:07<208:06:00,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20197/203307 [22:57:11<208:05:54,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20197/203307 [22:57:11<208:05:54,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20198/203307 [22:57:15<208:05:46,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20198/203307 [22:57:15<208:05:46,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20199/203307 [22:57:19<208:05:45,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20199/203307 [22:57:19<208:05:45,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20200/203307 [22:57:23<208:05:42,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20200/203307 [22:57:23<208:05:42,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20201/203307 [22:57:28<208:05:40,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  10%|▉         | 20201/203307 [22:57:28<208:05:40,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20202/203307 [22:57:31<208:05:33,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20202/203307 [22:57:31<208:05:33,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20203/203307 [22:57:35<208:05:25,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20203/203307 [22:57:35<208:05:25,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20204/203307 [22:57:39<208:05:17,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20204/203307 [22:57:39<208:05:17,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20205/203307 [22:57:43<208:05:10,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20205/203307 [22:57:43<208:05:10,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20206/203307 [22:57:46<208:05:02,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20206/203307 [22:57:46<208:05:02,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20207/203307 [22:57:50<208:04:55,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20207/203307 [22:57:50<208:04:55,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20208/203307 [22:57:54<208:04:54,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20208/203307 [22:57:54<208:04:54,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20209/203307 [22:57:59<208:04:51,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20209/203307 [22:57:59<208:04:51,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20210/203307 [22:58:03<208:04:49,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20210/203307 [22:58:03<208:04:49,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20211/203307 [22:58:07<208:04:41,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20211/203307 [22:58:07<208:04:41,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20212/203307 [22:58:10<208:04:33,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20212/203307 [22:58:10<208:04:33,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20213/203307 [22:58:14<208:04:26,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20213/203307 [22:58:14<208:04:26,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20214/203307 [22:58:18<208:04:19,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20214/203307 [22:58:18<208:04:19,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20215/203307 [22:58:22<208:04:11,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20215/203307 [22:58:22<208:04:11,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20216/203307 [22:58:26<208:04:09,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20216/203307 [22:58:26<208:04:09,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20217/203307 [22:58:30<208:04:08,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20217/203307 [22:58:30<208:04:08,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20218/203307 [22:58:35<208:04:06,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20218/203307 [22:58:35<208:04:06,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20219/203307 [22:58:38<208:03:59,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20219/203307 [22:58:38<208:03:59,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20220/203307 [22:58:42<208:03:52,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20220/203307 [22:58:42<208:03:52,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20221/203307 [22:58:46<208:03:45,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  10%|▉         | 20221/203307 [22:58:46<208:03:45,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20222/203307 [22:58:50<208:03:37,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20222/203307 [22:58:50<208:03:37,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20223/203307 [22:58:53<208:03:30,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20223/203307 [22:58:53<208:03:30,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20224/203307 [22:58:58<208:03:28,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20224/203307 [22:58:58<208:03:28,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20225/203307 [22:59:02<208:03:28,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20225/203307 [22:59:02<208:03:28,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20226/203307 [22:59:06<208:03:26,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20226/203307 [22:59:06<208:03:26,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20227/203307 [22:59:11<208:03:24,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20227/203307 [22:59:11<208:03:24,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20228/203307 [22:59:15<208:03:16,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20228/203307 [22:59:15<208:03:16,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20229/203307 [22:59:18<208:03:09,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20229/203307 [22:59:18<208:03:09,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20230/203307 [22:59:22<208:03:02,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20230/203307 [22:59:22<208:03:02,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20231/203307 [22:59:26<208:02:55,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20231/203307 [22:59:26<208:02:55,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20232/203307 [22:59:29<208:02:47,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20232/203307 [22:59:29<208:02:47,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20233/203307 [22:59:34<208:02:46,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20233/203307 [22:59:34<208:02:46,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20234/203307 [22:59:38<208:02:45,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20234/203307 [22:59:38<208:02:45,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20235/203307 [22:59:43<208:02:44,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20235/203307 [22:59:43<208:02:44,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20236/203307 [22:59:47<208:02:42,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20236/203307 [22:59:47<208:02:42,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20237/203307 [22:59:51<208:02:34,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20237/203307 [22:59:51<208:02:34,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20238/203307 [22:59:55<208:02:27,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20238/203307 [22:59:55<208:02:27,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20239/203307 [22:59:58<208:02:20,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20239/203307 [22:59:58<208:02:20,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20240/203307 [23:00:02<208:02:13,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20240/203307 [23:00:02<208:02:13,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20241/203307 [23:00:06<208:02:11,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  10%|▉         | 20241/203307 [23:00:06<208:02:11,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20242/203307 [23:00:10<208:02:05,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20242/203307 [23:00:10<208:02:05,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20243/203307 [23:00:15<208:02:04,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20243/203307 [23:00:15<208:02:04,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20244/203307 [23:00:19<208:02:04,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20244/203307 [23:00:19<208:02:04,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20245/203307 [23:00:23<208:01:56,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20245/203307 [23:00:23<208:01:56,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20246/203307 [23:00:27<208:01:49,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20246/203307 [23:00:27<208:01:49,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20247/203307 [23:00:30<208:01:41,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20247/203307 [23:00:30<208:01:41,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20248/203307 [23:00:34<208:01:34,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20248/203307 [23:00:34<208:01:34,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20249/203307 [23:00:38<208:01:32,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20249/203307 [23:00:38<208:01:32,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20250/203307 [23:00:42<208:01:24,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20250/203307 [23:00:42<208:01:24,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20251/203307 [23:00:46<208:01:22,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20251/203307 [23:00:46<208:01:22,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20252/203307 [23:00:50<208:01:15,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20252/203307 [23:00:50<208:01:15,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20253/203307 [23:00:54<208:01:13,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20253/203307 [23:00:54<208:01:13,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20254/203307 [23:00:59<208:01:10,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20254/203307 [23:00:59<208:01:10,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20255/203307 [23:01:02<208:01:02,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20255/203307 [23:01:02<208:01:02,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20256/203307 [23:01:06<208:00:54,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20256/203307 [23:01:06<208:00:54,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20257/203307 [23:01:10<208:00:46,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20257/203307 [23:01:10<208:00:47,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20258/203307 [23:01:14<208:00:44,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20258/203307 [23:01:14<208:00:44,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20259/203307 [23:01:18<208:00:37,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20259/203307 [23:01:18<208:00:37,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20260/203307 [23:01:22<208:00:36,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20260/203307 [23:01:22<208:00:36,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20261/203307 [23:01:26<208:00:28,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|▉         | 20261/203307 [23:01:26<208:00:28,  0.24it/s, v_num=t5e6, training/loss=0.089] Epoch 0:  10%|▉         | 20262/203307 [23:01:30<208:00:28,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20262/203307 [23:01:30<208:00:28,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20263/203307 [23:01:35<208:00:25,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20263/203307 [23:01:35<208:00:25,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20264/203307 [23:01:38<208:00:18,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20264/203307 [23:01:38<208:00:18,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20265/203307 [23:01:42<208:00:10,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20265/203307 [23:01:42<208:00:11,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20266/203307 [23:01:46<208:00:08,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20266/203307 [23:01:46<208:00:08,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20267/203307 [23:01:50<208:00:01,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20267/203307 [23:01:50<208:00:01,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20268/203307 [23:01:54<207:59:59,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20268/203307 [23:01:54<207:59:59,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20269/203307 [23:01:59<207:59:59,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20269/203307 [23:01:59<207:59:59,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20270/203307 [23:02:03<207:59:57,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20270/203307 [23:02:03<207:59:57,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20271/203307 [23:02:08<207:59:55,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20271/203307 [23:02:08<207:59:55,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20272/203307 [23:02:11<207:59:48,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20272/203307 [23:02:11<207:59:48,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20273/203307 [23:02:15<207:59:40,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20273/203307 [23:02:15<207:59:40,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20274/203307 [23:02:19<207:59:39,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20274/203307 [23:02:19<207:59:39,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20275/203307 [23:02:23<207:59:31,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20275/203307 [23:02:23<207:59:31,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20276/203307 [23:02:27<207:59:29,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20276/203307 [23:02:27<207:59:29,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20277/203307 [23:02:32<207:59:27,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20277/203307 [23:02:32<207:59:28,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20278/203307 [23:02:36<207:59:22,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20278/203307 [23:02:36<207:59:22,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20279/203307 [23:02:40<207:59:21,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20279/203307 [23:02:40<207:59:21,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20280/203307 [23:02:44<207:59:14,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20280/203307 [23:02:44<207:59:14,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20281/203307 [23:02:48<207:59:12,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  10%|▉         | 20281/203307 [23:02:48<207:59:12,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20282/203307 [23:02:52<207:59:04,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20282/203307 [23:02:52<207:59:04,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20283/203307 [23:02:56<207:59:01,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20283/203307 [23:02:56<207:59:01,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20284/203307 [23:03:00<207:58:54,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20284/203307 [23:03:00<207:58:54,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20285/203307 [23:03:04<207:58:53,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20285/203307 [23:03:04<207:58:53,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20286/203307 [23:03:09<207:58:52,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20286/203307 [23:03:09<207:58:52,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20287/203307 [23:03:13<207:58:46,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20287/203307 [23:03:13<207:58:46,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20288/203307 [23:03:17<207:58:44,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20288/203307 [23:03:17<207:58:44,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20289/203307 [23:03:21<207:58:37,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20289/203307 [23:03:21<207:58:37,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20290/203307 [23:03:25<207:58:35,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20290/203307 [23:03:25<207:58:35,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20291/203307 [23:03:29<207:58:31,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20291/203307 [23:03:29<207:58:32,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20292/203307 [23:03:33<207:58:25,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20292/203307 [23:03:33<207:58:25,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20293/203307 [23:03:37<207:58:24,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20293/203307 [23:03:37<207:58:24,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20294/203307 [23:03:41<207:58:16,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20294/203307 [23:03:41<207:58:16,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20295/203307 [23:03:46<207:58:15,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20295/203307 [23:03:46<207:58:15,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20296/203307 [23:03:50<207:58:13,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20296/203307 [23:03:50<207:58:13,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20297/203307 [23:03:54<207:58:06,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20297/203307 [23:03:54<207:58:06,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20298/203307 [23:03:58<207:58:03,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20298/203307 [23:03:58<207:58:03,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20299/203307 [23:04:02<207:58:01,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20299/203307 [23:04:02<207:58:01,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20300/203307 [23:04:06<207:57:53,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20300/203307 [23:04:06<207:57:53,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20301/203307 [23:04:10<207:57:52,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  10%|▉         | 20301/203307 [23:04:10<207:57:52,  0.24it/s, v_num=t5e6, training/loss=0.080] Epoch 0:  10%|▉         | 20302/203307 [23:04:14<207:57:44,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20302/203307 [23:04:14<207:57:45,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20303/203307 [23:04:19<207:57:45,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20303/203307 [23:04:19<207:57:45,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20304/203307 [23:04:22<207:57:38,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20304/203307 [23:04:22<207:57:38,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20305/203307 [23:04:27<207:57:37,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20305/203307 [23:04:27<207:57:37,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20306/203307 [23:04:31<207:57:30,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20306/203307 [23:04:31<207:57:30,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20307/203307 [23:04:34<207:57:23,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20307/203307 [23:04:34<207:57:23,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20308/203307 [23:04:39<207:57:20,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20308/203307 [23:04:39<207:57:20,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20309/203307 [23:04:42<207:57:14,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20309/203307 [23:04:42<207:57:14,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20310/203307 [23:04:47<207:57:12,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20310/203307 [23:04:47<207:57:12,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20311/203307 [23:04:51<207:57:06,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20311/203307 [23:04:51<207:57:06,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20312/203307 [23:04:55<207:57:05,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20312/203307 [23:04:55<207:57:05,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20313/203307 [23:04:59<207:56:57,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20313/203307 [23:04:59<207:56:57,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20314/203307 [23:05:03<207:56:57,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20314/203307 [23:05:03<207:56:57,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20315/203307 [23:05:07<207:56:50,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20315/203307 [23:05:07<207:56:50,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20316/203307 [23:05:11<207:56:47,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20316/203307 [23:05:11<207:56:47,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20317/203307 [23:05:16<207:56:44,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20317/203307 [23:05:16<207:56:44,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20318/203307 [23:05:20<207:56:43,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20318/203307 [23:05:20<207:56:43,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20319/203307 [23:05:24<207:56:35,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20319/203307 [23:05:24<207:56:35,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20320/203307 [23:05:27<207:56:28,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20320/203307 [23:05:27<207:56:28,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20321/203307 [23:05:32<207:56:27,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  10%|▉         | 20321/203307 [23:05:32<207:56:27,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|▉         | 20322/203307 [23:05:36<207:56:25,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|▉         | 20322/203307 [23:05:36<207:56:25,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|▉         | 20323/203307 [23:05:40<207:56:18,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|▉         | 20323/203307 [23:05:40<207:56:18,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|▉         | 20324/203307 [23:05:44<207:56:15,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|▉         | 20324/203307 [23:05:44<207:56:15,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|▉         | 20325/203307 [23:05:48<207:56:11,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|▉         | 20325/203307 [23:05:48<207:56:11,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|▉         | 20326/203307 [23:05:53<207:56:09,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|▉         | 20326/203307 [23:05:53<207:56:09,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|▉         | 20327/203307 [23:05:56<207:56:02,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|▉         | 20327/203307 [23:05:56<207:56:02,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|▉         | 20328/203307 [23:06:00<207:55:54,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|▉         | 20328/203307 [23:06:00<207:55:54,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|▉         | 20329/203307 [23:06:04<207:55:53,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|▉         | 20329/203307 [23:06:04<207:55:53,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|▉         | 20330/203307 [23:06:08<207:55:45,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|▉         | 20330/203307 [23:06:08<207:55:45,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|█         | 20331/203307 [23:06:12<207:55:44,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|█         | 20331/203307 [23:06:12<207:55:44,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|█         | 20332/203307 [23:06:16<207:55:36,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|█         | 20332/203307 [23:06:16<207:55:36,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|█         | 20333/203307 [23:06:20<207:55:34,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|█         | 20333/203307 [23:06:20<207:55:34,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|█         | 20334/203307 [23:06:24<207:55:27,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|█         | 20334/203307 [23:06:24<207:55:27,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|█         | 20335/203307 [23:06:29<207:55:25,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|█         | 20335/203307 [23:06:29<207:55:25,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|█         | 20336/203307 [23:06:32<207:55:17,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|█         | 20336/203307 [23:06:32<207:55:17,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|█         | 20337/203307 [23:06:36<207:55:10,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|█         | 20337/203307 [23:06:36<207:55:10,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|█         | 20338/203307 [23:06:40<207:55:09,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|█         | 20338/203307 [23:06:40<207:55:09,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|█         | 20339/203307 [23:06:44<207:55:02,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|█         | 20339/203307 [23:06:44<207:55:02,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|█         | 20340/203307 [23:06:49<207:55:00,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|█         | 20340/203307 [23:06:49<207:55:00,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|█         | 20341/203307 [23:06:53<207:54:58,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|█         | 20341/203307 [23:06:53<207:54:58,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20342/203307 [23:06:57<207:54:51,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20342/203307 [23:06:57<207:54:51,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20343/203307 [23:07:01<207:54:49,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20343/203307 [23:07:01<207:54:49,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20344/203307 [23:07:05<207:54:46,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20344/203307 [23:07:05<207:54:46,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20345/203307 [23:07:09<207:54:38,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20345/203307 [23:07:09<207:54:39,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20346/203307 [23:07:13<207:54:32,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20346/203307 [23:07:13<207:54:32,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20347/203307 [23:07:17<207:54:31,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20347/203307 [23:07:17<207:54:31,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20348/203307 [23:07:21<207:54:29,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20348/203307 [23:07:21<207:54:29,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20349/203307 [23:07:26<207:54:27,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20349/203307 [23:07:26<207:54:27,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20350/203307 [23:07:30<207:54:20,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20350/203307 [23:07:30<207:54:20,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20351/203307 [23:07:34<207:54:18,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20351/203307 [23:07:34<207:54:18,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20352/203307 [23:07:38<207:54:15,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20352/203307 [23:07:38<207:54:15,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20353/203307 [23:07:42<207:54:08,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20353/203307 [23:07:42<207:54:08,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20354/203307 [23:07:46<207:54:01,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20354/203307 [23:07:46<207:54:01,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20355/203307 [23:07:50<207:54:00,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20355/203307 [23:07:50<207:54:00,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20356/203307 [23:07:54<207:53:52,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20356/203307 [23:07:54<207:53:52,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20357/203307 [23:07:58<207:53:52,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20357/203307 [23:07:58<207:53:52,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20358/203307 [23:08:02<207:53:49,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20358/203307 [23:08:02<207:53:49,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20359/203307 [23:08:06<207:53:41,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20359/203307 [23:08:06<207:53:41,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20360/203307 [23:08:11<207:53:40,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20360/203307 [23:08:11<207:53:40,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20361/203307 [23:08:14<207:53:33,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 20361/203307 [23:08:14<207:53:33,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20362/203307 [23:08:18<207:53:29,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20362/203307 [23:08:18<207:53:29,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20363/203307 [23:08:22<207:53:22,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20363/203307 [23:08:22<207:53:22,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20364/203307 [23:08:27<207:53:21,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20364/203307 [23:08:27<207:53:21,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20365/203307 [23:08:30<207:53:13,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20365/203307 [23:08:30<207:53:13,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20366/203307 [23:08:35<207:53:12,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20366/203307 [23:08:35<207:53:12,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20367/203307 [23:08:38<207:53:05,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20367/203307 [23:08:38<207:53:05,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20368/203307 [23:08:43<207:53:02,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20368/203307 [23:08:43<207:53:02,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20369/203307 [23:08:46<207:52:55,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20369/203307 [23:08:46<207:52:55,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20370/203307 [23:08:50<207:52:47,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20370/203307 [23:08:50<207:52:47,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20371/203307 [23:08:54<207:52:44,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20371/203307 [23:08:54<207:52:44,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20372/203307 [23:08:58<207:52:37,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20372/203307 [23:08:58<207:52:37,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20373/203307 [23:09:02<207:52:35,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20373/203307 [23:09:02<207:52:35,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20374/203307 [23:09:07<207:52:34,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20374/203307 [23:09:07<207:52:34,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20375/203307 [23:09:10<207:52:26,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20375/203307 [23:09:10<207:52:26,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20376/203307 [23:09:15<207:52:23,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20376/203307 [23:09:15<207:52:23,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20377/203307 [23:09:18<207:52:16,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20377/203307 [23:09:18<207:52:16,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20378/203307 [23:09:22<207:52:09,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20378/203307 [23:09:22<207:52:09,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20379/203307 [23:09:26<207:52:06,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20379/203307 [23:09:26<207:52:06,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20380/203307 [23:09:30<207:51:58,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20380/203307 [23:09:30<207:51:58,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20381/203307 [23:09:34<207:51:56,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  10%|█         | 20381/203307 [23:09:34<207:51:56,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20382/203307 [23:09:38<207:51:48,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20382/203307 [23:09:38<207:51:48,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20383/203307 [23:09:43<207:51:47,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20383/203307 [23:09:43<207:51:47,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20384/203307 [23:09:46<207:51:40,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20384/203307 [23:09:46<207:51:40,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20385/203307 [23:09:51<207:51:38,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20385/203307 [23:09:51<207:51:38,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20386/203307 [23:09:54<207:51:30,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20386/203307 [23:09:54<207:51:30,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20387/203307 [23:09:58<207:51:22,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20387/203307 [23:09:58<207:51:22,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20388/203307 [23:10:02<207:51:15,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20388/203307 [23:10:02<207:51:15,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20389/203307 [23:10:06<207:51:12,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20389/203307 [23:10:06<207:51:12,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20390/203307 [23:10:10<207:51:10,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20390/203307 [23:10:10<207:51:11,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20391/203307 [23:10:14<207:51:07,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20391/203307 [23:10:14<207:51:07,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20392/203307 [23:10:19<207:51:06,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20392/203307 [23:10:19<207:51:06,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20393/203307 [23:10:23<207:51:03,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20393/203307 [23:10:23<207:51:03,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20394/203307 [23:10:27<207:50:55,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20394/203307 [23:10:27<207:50:55,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20395/203307 [23:10:30<207:50:48,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20395/203307 [23:10:30<207:50:48,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20396/203307 [23:10:34<207:50:41,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20396/203307 [23:10:34<207:50:41,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20397/203307 [23:10:38<207:50:33,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20397/203307 [23:10:38<207:50:33,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20398/203307 [23:10:42<207:50:29,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20398/203307 [23:10:42<207:50:29,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20399/203307 [23:10:47<207:50:29,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20399/203307 [23:10:47<207:50:29,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20400/203307 [23:10:51<207:50:26,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20400/203307 [23:10:51<207:50:26,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20401/203307 [23:10:55<207:50:24,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  10%|█         | 20401/203307 [23:10:55<207:50:24,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20402/203307 [23:10:59<207:50:16,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20402/203307 [23:10:59<207:50:16,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20403/203307 [23:11:02<207:50:08,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20403/203307 [23:11:02<207:50:08,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20404/203307 [23:11:06<207:50:02,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20404/203307 [23:11:06<207:50:02,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20405/203307 [23:11:10<207:49:55,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20405/203307 [23:11:10<207:49:55,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20406/203307 [23:11:14<207:49:53,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20406/203307 [23:11:14<207:49:53,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20407/203307 [23:11:19<207:49:51,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20407/203307 [23:11:19<207:49:51,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20408/203307 [23:11:23<207:49:49,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20408/203307 [23:11:23<207:49:49,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20409/203307 [23:11:27<207:49:48,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20409/203307 [23:11:27<207:49:48,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20410/203307 [23:11:32<207:49:46,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20410/203307 [23:11:32<207:49:46,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20411/203307 [23:11:35<207:49:38,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20411/203307 [23:11:35<207:49:38,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20412/203307 [23:11:39<207:49:31,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20412/203307 [23:11:39<207:49:31,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20413/203307 [23:11:43<207:49:23,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20413/203307 [23:11:43<207:49:23,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20414/203307 [23:11:47<207:49:16,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20414/203307 [23:11:47<207:49:16,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20415/203307 [23:11:50<207:49:09,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20415/203307 [23:11:50<207:49:09,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20416/203307 [23:11:55<207:49:08,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20416/203307 [23:11:55<207:49:08,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20417/203307 [23:11:59<207:49:01,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20417/203307 [23:11:59<207:49:01,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20418/203307 [23:12:03<207:49:00,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20418/203307 [23:12:03<207:49:00,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20419/203307 [23:12:07<207:48:52,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20419/203307 [23:12:07<207:48:52,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20420/203307 [23:12:10<207:48:45,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20420/203307 [23:12:10<207:48:45,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20421/203307 [23:12:14<207:48:37,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20421/203307 [23:12:14<207:48:37,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20422/203307 [23:12:18<207:48:30,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20422/203307 [23:12:18<207:48:30,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20423/203307 [23:12:22<207:48:22,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20423/203307 [23:12:22<207:48:22,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20424/203307 [23:12:26<207:48:20,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20424/203307 [23:12:26<207:48:20,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20425/203307 [23:12:30<207:48:19,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20425/203307 [23:12:30<207:48:19,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20426/203307 [23:12:35<207:48:17,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20426/203307 [23:12:35<207:48:17,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20427/203307 [23:12:38<207:48:09,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20427/203307 [23:12:38<207:48:09,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20428/203307 [23:12:42<207:48:01,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20428/203307 [23:12:42<207:48:01,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20429/203307 [23:12:46<207:47:53,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20429/203307 [23:12:46<207:47:53,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20430/203307 [23:12:49<207:47:46,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20430/203307 [23:12:49<207:47:46,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20431/203307 [23:12:53<207:47:38,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20431/203307 [23:12:53<207:47:39,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20432/203307 [23:12:57<207:47:31,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20432/203307 [23:12:57<207:47:31,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20433/203307 [23:13:01<207:47:30,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20433/203307 [23:13:01<207:47:30,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20434/203307 [23:13:05<207:47:22,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20434/203307 [23:13:05<207:47:22,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20435/203307 [23:13:09<207:47:21,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20435/203307 [23:13:09<207:47:21,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20436/203307 [23:13:13<207:47:12,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20436/203307 [23:13:13<207:47:13,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20437/203307 [23:13:17<207:47:05,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20437/203307 [23:13:17<207:47:05,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20438/203307 [23:13:20<207:46:59,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20438/203307 [23:13:20<207:46:59,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20439/203307 [23:13:24<207:46:52,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20439/203307 [23:13:24<207:46:52,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20440/203307 [23:13:28<207:46:45,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20440/203307 [23:13:28<207:46:45,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20441/203307 [23:13:32<207:46:43,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 20441/203307 [23:13:32<207:46:43,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20442/203307 [23:13:37<207:46:42,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20442/203307 [23:13:37<207:46:42,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20443/203307 [23:13:41<207:46:39,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20443/203307 [23:13:41<207:46:39,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20444/203307 [23:13:45<207:46:37,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20444/203307 [23:13:45<207:46:37,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20445/203307 [23:13:49<207:46:30,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20445/203307 [23:13:49<207:46:30,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20446/203307 [23:13:53<207:46:22,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20446/203307 [23:13:53<207:46:22,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20447/203307 [23:13:56<207:46:15,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20447/203307 [23:13:56<207:46:15,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20448/203307 [23:14:00<207:46:08,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20448/203307 [23:14:00<207:46:08,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20449/203307 [23:14:04<207:46:06,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20449/203307 [23:14:04<207:46:06,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20450/203307 [23:14:08<207:45:58,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20450/203307 [23:14:08<207:45:58,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20451/203307 [23:14:13<207:45:57,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20451/203307 [23:14:13<207:45:57,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20452/203307 [23:14:17<207:45:56,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20452/203307 [23:14:17<207:45:56,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20453/203307 [23:14:21<207:45:48,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20453/203307 [23:14:21<207:45:48,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20454/203307 [23:14:24<207:45:40,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20454/203307 [23:14:24<207:45:40,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20455/203307 [23:14:28<207:45:33,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20455/203307 [23:14:28<207:45:33,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20456/203307 [23:14:32<207:45:25,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20456/203307 [23:14:32<207:45:25,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20457/203307 [23:14:36<207:45:18,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20457/203307 [23:14:36<207:45:18,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20458/203307 [23:14:40<207:45:16,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20458/203307 [23:14:40<207:45:16,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20459/203307 [23:14:44<207:45:14,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20459/203307 [23:14:44<207:45:14,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20460/203307 [23:14:48<207:45:11,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20460/203307 [23:14:48<207:45:11,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20461/203307 [23:14:53<207:45:09,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  10%|█         | 20461/203307 [23:14:53<207:45:09,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20462/203307 [23:14:56<207:45:00,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20462/203307 [23:14:56<207:45:00,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20463/203307 [23:15:00<207:44:53,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20463/203307 [23:15:00<207:44:53,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20464/203307 [23:15:04<207:44:45,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20464/203307 [23:15:04<207:44:45,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20465/203307 [23:15:07<207:44:38,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20465/203307 [23:15:07<207:44:38,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20466/203307 [23:15:12<207:44:34,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20466/203307 [23:15:12<207:44:34,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20467/203307 [23:15:15<207:44:27,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20467/203307 [23:15:15<207:44:27,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20468/203307 [23:15:20<207:44:26,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20468/203307 [23:15:20<207:44:26,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20469/203307 [23:15:24<207:44:19,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20469/203307 [23:15:24<207:44:19,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20470/203307 [23:15:28<207:44:18,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20470/203307 [23:15:28<207:44:18,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20471/203307 [23:15:32<207:44:11,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20471/203307 [23:15:32<207:44:11,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20472/203307 [23:15:35<207:44:03,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20472/203307 [23:15:35<207:44:03,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20473/203307 [23:15:39<207:43:56,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20473/203307 [23:15:39<207:43:56,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20474/203307 [23:15:43<207:43:54,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20474/203307 [23:15:43<207:43:54,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20475/203307 [23:15:47<207:43:47,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20475/203307 [23:15:47<207:43:47,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20476/203307 [23:15:52<207:43:45,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20476/203307 [23:15:52<207:43:45,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20477/203307 [23:15:56<207:43:44,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20477/203307 [23:15:56<207:43:44,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20478/203307 [23:16:00<207:43:42,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20478/203307 [23:16:00<207:43:42,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20479/203307 [23:16:05<207:43:39,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20479/203307 [23:16:05<207:43:39,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20480/203307 [23:16:08<207:43:31,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20480/203307 [23:16:08<207:43:31,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20481/203307 [23:16:12<207:43:24,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  10%|█         | 20481/203307 [23:16:12<207:43:24,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20482/203307 [23:16:16<207:43:16,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20482/203307 [23:16:16<207:43:16,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20483/203307 [23:16:20<207:43:15,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20483/203307 [23:16:20<207:43:15,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20484/203307 [23:16:24<207:43:08,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20484/203307 [23:16:24<207:43:08,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20485/203307 [23:16:28<207:43:06,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20485/203307 [23:16:28<207:43:07,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20486/203307 [23:16:32<207:42:59,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20486/203307 [23:16:32<207:42:59,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20487/203307 [23:16:36<207:42:59,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20487/203307 [23:16:36<207:42:59,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20488/203307 [23:16:40<207:42:52,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20488/203307 [23:16:40<207:42:52,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20489/203307 [23:16:44<207:42:44,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20489/203307 [23:16:44<207:42:44,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20490/203307 [23:16:48<207:42:37,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20490/203307 [23:16:48<207:42:37,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20491/203307 [23:16:52<207:42:35,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20491/203307 [23:16:52<207:42:35,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20492/203307 [23:16:56<207:42:27,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20492/203307 [23:16:56<207:42:27,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20493/203307 [23:17:00<207:42:26,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20493/203307 [23:17:00<207:42:26,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20494/203307 [23:17:04<207:42:25,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20494/203307 [23:17:04<207:42:25,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20495/203307 [23:17:08<207:42:18,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20495/203307 [23:17:08<207:42:18,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20496/203307 [23:17:13<207:42:18,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20496/203307 [23:17:13<207:42:18,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20497/203307 [23:17:17<207:42:15,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20497/203307 [23:17:17<207:42:15,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20498/203307 [23:17:21<207:42:08,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20498/203307 [23:17:21<207:42:08,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20499/203307 [23:17:25<207:42:06,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20499/203307 [23:17:25<207:42:06,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20500/203307 [23:17:29<207:42:00,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20500/203307 [23:17:29<207:42:00,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20501/203307 [23:17:33<207:41:57,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  10%|█         | 20501/203307 [23:17:33<207:41:57,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20502/203307 [23:17:37<207:41:51,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20502/203307 [23:17:37<207:41:51,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20503/203307 [23:17:42<207:41:51,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20503/203307 [23:17:42<207:41:51,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20504/203307 [23:17:46<207:41:49,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20504/203307 [23:17:46<207:41:49,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20505/203307 [23:17:50<207:41:43,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20505/203307 [23:17:50<207:41:43,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20506/203307 [23:17:54<207:41:39,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20506/203307 [23:17:54<207:41:39,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20507/203307 [23:17:58<207:41:32,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20507/203307 [23:17:58<207:41:32,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20508/203307 [23:18:02<207:41:30,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20508/203307 [23:18:02<207:41:30,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20509/203307 [23:18:06<207:41:23,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20509/203307 [23:18:06<207:41:23,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20510/203307 [23:18:10<207:41:20,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20510/203307 [23:18:10<207:41:20,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20511/203307 [23:18:14<207:41:19,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20511/203307 [23:18:14<207:41:19,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20512/203307 [23:18:18<207:41:12,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20512/203307 [23:18:18<207:41:12,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20513/203307 [23:18:23<207:41:11,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20513/203307 [23:18:23<207:41:11,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20514/203307 [23:18:27<207:41:07,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20514/203307 [23:18:27<207:41:08,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20515/203307 [23:18:31<207:41:01,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20515/203307 [23:18:31<207:41:01,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20516/203307 [23:18:35<207:40:59,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20516/203307 [23:18:35<207:40:59,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20517/203307 [23:18:39<207:40:50,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20517/203307 [23:18:39<207:40:51,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20518/203307 [23:18:43<207:40:48,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20518/203307 [23:18:43<207:40:48,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20519/203307 [23:18:46<207:40:40,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20519/203307 [23:18:46<207:40:40,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20520/203307 [23:18:51<207:40:39,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20520/203307 [23:18:51<207:40:39,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20521/203307 [23:18:54<207:40:30,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  10%|█         | 20521/203307 [23:18:54<207:40:30,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20522/203307 [23:18:59<207:40:28,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20522/203307 [23:18:59<207:40:28,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20523/203307 [23:19:02<207:40:20,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20523/203307 [23:19:02<207:40:20,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20524/203307 [23:19:07<207:40:17,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20524/203307 [23:19:07<207:40:17,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20525/203307 [23:19:10<207:40:08,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20525/203307 [23:19:10<207:40:08,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20526/203307 [23:19:14<207:40:05,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20526/203307 [23:19:14<207:40:06,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20527/203307 [23:19:18<207:39:58,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20527/203307 [23:19:18<207:39:58,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20528/203307 [23:19:22<207:39:51,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20528/203307 [23:19:22<207:39:51,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20529/203307 [23:19:26<207:39:51,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20529/203307 [23:19:26<207:39:51,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20530/203307 [23:19:31<207:39:49,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20530/203307 [23:19:31<207:39:49,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20531/203307 [23:19:35<207:39:42,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20531/203307 [23:19:35<207:39:42,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20532/203307 [23:19:38<207:39:35,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20532/203307 [23:19:38<207:39:35,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20533/203307 [23:19:43<207:39:33,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20533/203307 [23:19:43<207:39:33,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20534/203307 [23:19:46<207:39:26,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20534/203307 [23:19:46<207:39:26,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20535/203307 [23:19:51<207:39:24,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20535/203307 [23:19:51<207:39:24,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20536/203307 [23:19:54<207:39:17,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20536/203307 [23:19:54<207:39:17,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20537/203307 [23:19:59<207:39:15,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20537/203307 [23:19:59<207:39:15,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20538/203307 [23:20:03<207:39:09,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20538/203307 [23:20:03<207:39:09,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20539/203307 [23:20:07<207:39:08,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20539/203307 [23:20:07<207:39:08,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20540/203307 [23:20:11<207:39:00,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20540/203307 [23:20:11<207:39:00,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20541/203307 [23:20:15<207:38:57,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  10%|█         | 20541/203307 [23:20:15<207:38:58,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20542/203307 [23:20:19<207:38:50,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20542/203307 [23:20:19<207:38:50,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20543/203307 [23:20:23<207:38:48,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20543/203307 [23:20:23<207:38:48,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20544/203307 [23:20:27<207:38:41,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20544/203307 [23:20:27<207:38:41,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20545/203307 [23:20:31<207:38:34,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20545/203307 [23:20:31<207:38:34,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20546/203307 [23:20:35<207:38:34,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20546/203307 [23:20:35<207:38:34,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20547/203307 [23:20:39<207:38:26,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20547/203307 [23:20:39<207:38:26,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20548/203307 [23:20:43<207:38:25,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20548/203307 [23:20:43<207:38:25,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20549/203307 [23:20:47<207:38:22,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20549/203307 [23:20:47<207:38:22,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20550/203307 [23:20:51<207:38:14,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20550/203307 [23:20:51<207:38:14,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20551/203307 [23:20:55<207:38:12,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20551/203307 [23:20:55<207:38:12,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20552/203307 [23:20:59<207:38:05,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20552/203307 [23:20:59<207:38:05,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20553/203307 [23:21:03<207:37:57,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20553/203307 [23:21:03<207:37:57,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20554/203307 [23:21:07<207:37:50,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20554/203307 [23:21:07<207:37:50,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20555/203307 [23:21:11<207:37:49,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20555/203307 [23:21:11<207:37:49,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20556/203307 [23:21:15<207:37:47,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20556/203307 [23:21:15<207:37:47,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20557/203307 [23:21:19<207:37:40,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20557/203307 [23:21:19<207:37:40,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20558/203307 [23:21:23<207:37:38,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20558/203307 [23:21:23<207:37:38,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20559/203307 [23:21:27<207:37:31,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20559/203307 [23:21:27<207:37:31,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20560/203307 [23:21:31<207:37:29,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20560/203307 [23:21:32<207:37:29,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20561/203307 [23:21:35<207:37:22,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20561/203307 [23:21:35<207:37:22,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20562/203307 [23:21:39<207:37:14,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20562/203307 [23:21:39<207:37:14,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20563/203307 [23:21:43<207:37:14,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20563/203307 [23:21:43<207:37:14,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20564/203307 [23:21:47<207:37:07,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20564/203307 [23:21:47<207:37:07,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20565/203307 [23:21:52<207:37:06,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20565/203307 [23:21:52<207:37:06,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20566/203307 [23:21:56<207:37:03,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20566/203307 [23:21:56<207:37:03,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20567/203307 [23:22:00<207:36:55,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20567/203307 [23:22:00<207:36:55,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20568/203307 [23:22:04<207:36:53,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20568/203307 [23:22:04<207:36:53,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20569/203307 [23:22:08<207:36:50,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20569/203307 [23:22:08<207:36:50,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20570/203307 [23:22:12<207:36:42,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20570/203307 [23:22:12<207:36:42,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20571/203307 [23:22:15<207:36:35,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20571/203307 [23:22:16<207:36:35,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20572/203307 [23:22:20<207:36:34,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20572/203307 [23:22:20<207:36:34,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20573/203307 [23:22:24<207:36:27,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20573/203307 [23:22:24<207:36:27,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20574/203307 [23:22:28<207:36:26,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20574/203307 [23:22:28<207:36:26,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20575/203307 [23:22:32<207:36:19,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20575/203307 [23:22:32<207:36:19,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20576/203307 [23:22:36<207:36:16,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20576/203307 [23:22:36<207:36:16,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20577/203307 [23:22:40<207:36:12,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20577/203307 [23:22:40<207:36:12,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20578/203307 [23:22:44<207:36:09,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20578/203307 [23:22:44<207:36:09,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20579/203307 [23:22:48<207:36:02,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20579/203307 [23:22:48<207:36:02,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20580/203307 [23:22:52<207:35:55,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20580/203307 [23:22:52<207:35:55,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20581/203307 [23:22:56<207:35:53,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20581/203307 [23:22:56<207:35:53,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20582/203307 [23:23:01<207:35:52,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20582/203307 [23:23:01<207:35:52,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20583/203307 [23:23:05<207:35:48,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20583/203307 [23:23:05<207:35:49,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20584/203307 [23:23:09<207:35:41,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20584/203307 [23:23:09<207:35:41,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20585/203307 [23:23:13<207:35:39,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20585/203307 [23:23:13<207:35:39,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20586/203307 [23:23:17<207:35:36,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20586/203307 [23:23:17<207:35:36,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20587/203307 [23:23:21<207:35:32,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20587/203307 [23:23:21<207:35:32,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20588/203307 [23:23:25<207:35:24,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20588/203307 [23:23:25<207:35:24,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20589/203307 [23:23:29<207:35:23,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20589/203307 [23:23:29<207:35:23,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20590/203307 [23:23:33<207:35:16,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20590/203307 [23:23:33<207:35:16,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20591/203307 [23:23:37<207:35:14,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20591/203307 [23:23:37<207:35:14,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20592/203307 [23:23:41<207:35:06,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20592/203307 [23:23:41<207:35:06,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20593/203307 [23:23:45<207:35:03,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20593/203307 [23:23:45<207:35:03,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20594/203307 [23:23:49<207:34:56,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20594/203307 [23:23:49<207:34:56,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20595/203307 [23:23:53<207:34:53,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20595/203307 [23:23:53<207:34:53,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20596/203307 [23:23:57<207:34:46,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20596/203307 [23:23:57<207:34:46,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20597/203307 [23:24:01<207:34:38,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20597/203307 [23:24:01<207:34:38,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20598/203307 [23:24:05<207:34:37,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20598/203307 [23:24:05<207:34:37,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20599/203307 [23:24:09<207:34:34,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20599/203307 [23:24:09<207:34:34,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20600/203307 [23:24:14<207:34:32,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20600/203307 [23:24:14<207:34:32,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20601/203307 [23:24:18<207:34:30,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  10%|█         | 20601/203307 [23:24:18<207:34:30,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20602/203307 [23:24:22<207:34:23,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20602/203307 [23:24:22<207:34:23,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20603/203307 [23:24:26<207:34:21,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20603/203307 [23:24:26<207:34:21,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20604/203307 [23:24:30<207:34:14,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20604/203307 [23:24:30<207:34:14,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20605/203307 [23:24:34<207:34:11,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20605/203307 [23:24:34<207:34:11,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20606/203307 [23:24:38<207:34:04,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20606/203307 [23:24:38<207:34:04,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20607/203307 [23:24:42<207:34:03,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20607/203307 [23:24:42<207:34:03,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20608/203307 [23:24:47<207:34:01,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20608/203307 [23:24:47<207:34:01,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20609/203307 [23:24:50<207:33:55,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20609/203307 [23:24:50<207:33:55,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20610/203307 [23:24:55<207:33:53,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20610/203307 [23:24:55<207:33:53,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20611/203307 [23:24:58<207:33:46,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20611/203307 [23:24:58<207:33:46,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20612/203307 [23:25:03<207:33:44,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20612/203307 [23:25:03<207:33:44,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20613/203307 [23:25:07<207:33:37,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20613/203307 [23:25:07<207:33:37,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20614/203307 [23:25:11<207:33:34,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20614/203307 [23:25:11<207:33:34,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20615/203307 [23:25:15<207:33:33,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20615/203307 [23:25:15<207:33:33,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20616/203307 [23:25:19<207:33:30,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20616/203307 [23:25:19<207:33:30,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20617/203307 [23:25:24<207:33:28,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20617/203307 [23:25:24<207:33:29,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20618/203307 [23:25:28<207:33:26,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20618/203307 [23:25:28<207:33:26,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20619/203307 [23:25:32<207:33:18,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20619/203307 [23:25:32<207:33:18,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20620/203307 [23:25:35<207:33:10,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20620/203307 [23:25:35<207:33:10,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20621/203307 [23:25:40<207:33:08,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 20621/203307 [23:25:40<207:33:08,  0.24it/s, v_num=t5e6, training/loss=0.081] Epoch 0:  10%|█         | 20622/203307 [23:25:44<207:33:05,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20622/203307 [23:25:44<207:33:05,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20623/203307 [23:25:48<207:32:58,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20623/203307 [23:25:48<207:32:58,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20624/203307 [23:25:52<207:32:57,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20624/203307 [23:25:52<207:32:57,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20625/203307 [23:25:56<207:32:49,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20625/203307 [23:25:56<207:32:49,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20626/203307 [23:26:00<207:32:48,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20626/203307 [23:26:00<207:32:48,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20627/203307 [23:26:04<207:32:41,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20627/203307 [23:26:04<207:32:41,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20628/203307 [23:26:08<207:32:33,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20628/203307 [23:26:08<207:32:33,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20629/203307 [23:26:12<207:32:30,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20629/203307 [23:26:12<207:32:30,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20630/203307 [23:26:16<207:32:23,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20630/203307 [23:26:16<207:32:23,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20631/203307 [23:26:19<207:32:16,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20631/203307 [23:26:19<207:32:16,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20632/203307 [23:26:24<207:32:13,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20632/203307 [23:26:24<207:32:13,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20633/203307 [23:26:28<207:32:12,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20633/203307 [23:26:28<207:32:12,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20634/203307 [23:26:32<207:32:10,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20634/203307 [23:26:32<207:32:10,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20635/203307 [23:26:37<207:32:07,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20635/203307 [23:26:37<207:32:07,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20636/203307 [23:26:40<207:31:59,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20636/203307 [23:26:40<207:31:59,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20637/203307 [23:26:44<207:31:52,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20637/203307 [23:26:44<207:31:52,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20638/203307 [23:26:48<207:31:50,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20638/203307 [23:26:48<207:31:50,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20639/203307 [23:26:52<207:31:42,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20639/203307 [23:26:52<207:31:42,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20640/203307 [23:26:56<207:31:34,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20640/203307 [23:26:56<207:31:34,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20641/203307 [23:27:00<207:31:33,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  10%|█         | 20641/203307 [23:27:00<207:31:33,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20642/203307 [23:27:04<207:31:25,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20642/203307 [23:27:04<207:31:25,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20643/203307 [23:27:08<207:31:24,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20643/203307 [23:27:08<207:31:24,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20644/203307 [23:27:12<207:31:17,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20644/203307 [23:27:12<207:31:17,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20645/203307 [23:27:16<207:31:09,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20645/203307 [23:27:16<207:31:09,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20646/203307 [23:27:19<207:31:02,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20646/203307 [23:27:19<207:31:02,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20647/203307 [23:27:24<207:31:00,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20647/203307 [23:27:24<207:31:00,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20648/203307 [23:27:27<207:30:52,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20648/203307 [23:27:27<207:30:52,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20649/203307 [23:27:31<207:30:49,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20649/203307 [23:27:31<207:30:49,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20650/203307 [23:27:36<207:30:48,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20650/203307 [23:27:36<207:30:48,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20651/203307 [23:27:40<207:30:45,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20651/203307 [23:27:40<207:30:45,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20652/203307 [23:27:44<207:30:43,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20652/203307 [23:27:44<207:30:43,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20653/203307 [23:27:48<207:30:35,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20653/203307 [23:27:48<207:30:35,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20654/203307 [23:27:52<207:30:26,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20654/203307 [23:27:52<207:30:26,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20655/203307 [23:27:56<207:30:23,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20655/203307 [23:27:56<207:30:23,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20656/203307 [23:27:59<207:30:15,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20656/203307 [23:27:59<207:30:15,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20657/203307 [23:28:03<207:30:06,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20657/203307 [23:28:03<207:30:06,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20658/203307 [23:28:07<207:30:04,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20658/203307 [23:28:07<207:30:04,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20659/203307 [23:28:12<207:30:02,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20659/203307 [23:28:12<207:30:02,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20660/203307 [23:28:16<207:30:01,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20660/203307 [23:28:16<207:30:01,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20661/203307 [23:28:20<207:29:54,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20661/203307 [23:28:20<207:29:54,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20662/203307 [23:28:24<207:29:46,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20662/203307 [23:28:24<207:29:46,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20663/203307 [23:28:27<207:29:39,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20663/203307 [23:28:27<207:29:39,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20664/203307 [23:28:32<207:29:36,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20664/203307 [23:28:32<207:29:36,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20665/203307 [23:28:35<207:29:29,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20665/203307 [23:28:35<207:29:29,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20666/203307 [23:28:39<207:29:26,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20666/203307 [23:28:39<207:29:26,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20667/203307 [23:28:44<207:29:24,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20667/203307 [23:28:44<207:29:24,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20668/203307 [23:28:48<207:29:22,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20668/203307 [23:28:48<207:29:22,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20669/203307 [23:28:52<207:29:20,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20669/203307 [23:28:52<207:29:20,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20670/203307 [23:28:56<207:29:12,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20670/203307 [23:28:56<207:29:12,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20671/203307 [23:29:00<207:29:04,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20671/203307 [23:29:00<207:29:04,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20672/203307 [23:29:03<207:28:56,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20672/203307 [23:29:03<207:28:56,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20673/203307 [23:29:08<207:28:53,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20673/203307 [23:29:08<207:28:54,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20674/203307 [23:29:12<207:28:50,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20674/203307 [23:29:12<207:28:50,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20675/203307 [23:29:16<207:28:43,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20675/203307 [23:29:16<207:28:43,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20676/203307 [23:29:20<207:28:42,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20676/203307 [23:29:20<207:28:42,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20677/203307 [23:29:24<207:28:35,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20677/203307 [23:29:24<207:28:35,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20678/203307 [23:29:28<207:28:34,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20678/203307 [23:29:28<207:28:34,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20679/203307 [23:29:32<207:28:26,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20679/203307 [23:29:32<207:28:26,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20680/203307 [23:29:35<207:28:18,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20680/203307 [23:29:35<207:28:18,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20681/203307 [23:29:40<207:28:16,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20681/203307 [23:29:40<207:28:16,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20682/203307 [23:29:44<207:28:08,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20682/203307 [23:29:44<207:28:09,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20683/203307 [23:29:48<207:28:06,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20683/203307 [23:29:48<207:28:06,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20684/203307 [23:29:52<207:28:02,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20684/203307 [23:29:52<207:28:02,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20685/203307 [23:29:56<207:28:01,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20685/203307 [23:29:56<207:28:01,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20686/203307 [23:30:01<207:28:00,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20686/203307 [23:30:01<207:28:00,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20687/203307 [23:30:04<207:27:53,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20687/203307 [23:30:04<207:27:53,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20688/203307 [23:30:08<207:27:45,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20688/203307 [23:30:08<207:27:45,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20689/203307 [23:30:12<207:27:38,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20689/203307 [23:30:12<207:27:38,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20690/203307 [23:30:16<207:27:35,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20690/203307 [23:30:16<207:27:35,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20691/203307 [23:30:20<207:27:33,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20691/203307 [23:30:20<207:27:33,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20692/203307 [23:30:24<207:27:26,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20692/203307 [23:30:24<207:27:26,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20693/203307 [23:30:29<207:27:24,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20693/203307 [23:30:29<207:27:24,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20694/203307 [23:30:32<207:27:17,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20694/203307 [23:30:32<207:27:17,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20695/203307 [23:30:37<207:27:16,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20695/203307 [23:30:37<207:27:16,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20696/203307 [23:30:41<207:27:09,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20696/203307 [23:30:41<207:27:09,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20697/203307 [23:30:44<207:27:02,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20697/203307 [23:30:44<207:27:02,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20698/203307 [23:30:48<207:26:54,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20698/203307 [23:30:48<207:26:55,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20699/203307 [23:30:52<207:26:53,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20699/203307 [23:30:52<207:26:53,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20700/203307 [23:30:56<207:26:46,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20700/203307 [23:30:56<207:26:46,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20701/203307 [23:31:01<207:26:45,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  10%|█         | 20701/203307 [23:31:01<207:26:45,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20702/203307 [23:31:05<207:26:44,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20702/203307 [23:31:05<207:26:44,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20703/203307 [23:31:09<207:26:41,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20703/203307 [23:31:09<207:26:41,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20704/203307 [23:31:14<207:26:39,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20704/203307 [23:31:14<207:26:39,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20705/203307 [23:31:17<207:26:32,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20705/203307 [23:31:17<207:26:32,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20706/203307 [23:31:21<207:26:25,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20706/203307 [23:31:21<207:26:25,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20707/203307 [23:31:25<207:26:23,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20707/203307 [23:31:25<207:26:23,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20708/203307 [23:31:30<207:26:21,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20708/203307 [23:31:30<207:26:21,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20709/203307 [23:31:33<207:26:13,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20709/203307 [23:31:33<207:26:13,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20710/203307 [23:31:38<207:26:11,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20710/203307 [23:31:38<207:26:11,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20711/203307 [23:31:42<207:26:10,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20711/203307 [23:31:42<207:26:10,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20712/203307 [23:31:47<207:26:09,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20712/203307 [23:31:47<207:26:09,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20713/203307 [23:31:51<207:26:06,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20713/203307 [23:31:51<207:26:06,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20714/203307 [23:31:55<207:25:59,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20714/203307 [23:31:55<207:25:59,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20715/203307 [23:31:58<207:25:52,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20715/203307 [23:31:58<207:25:52,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20716/203307 [23:32:03<207:25:51,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20716/203307 [23:32:03<207:25:51,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20717/203307 [23:32:06<207:25:44,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20717/203307 [23:32:06<207:25:44,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20718/203307 [23:32:11<207:25:41,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20718/203307 [23:32:11<207:25:41,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20719/203307 [23:32:15<207:25:40,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20719/203307 [23:32:15<207:25:40,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20720/203307 [23:32:19<207:25:32,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20720/203307 [23:32:19<207:25:32,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20721/203307 [23:32:23<207:25:31,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  10%|█         | 20721/203307 [23:32:23<207:25:31,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20722/203307 [23:32:28<207:25:29,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20722/203307 [23:32:28<207:25:29,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20723/203307 [23:32:31<207:25:21,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20723/203307 [23:32:31<207:25:21,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20724/203307 [23:32:35<207:25:18,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20724/203307 [23:32:35<207:25:18,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20725/203307 [23:32:40<207:25:16,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20725/203307 [23:32:40<207:25:16,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20726/203307 [23:32:44<207:25:13,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20726/203307 [23:32:44<207:25:13,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20727/203307 [23:32:48<207:25:06,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20727/203307 [23:32:48<207:25:06,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20728/203307 [23:32:52<207:25:05,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20728/203307 [23:32:52<207:25:05,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20729/203307 [23:32:56<207:24:57,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20729/203307 [23:32:56<207:24:57,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20730/203307 [23:33:00<207:24:56,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20730/203307 [23:33:00<207:24:56,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20731/203307 [23:33:04<207:24:49,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20731/203307 [23:33:04<207:24:49,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20732/203307 [23:33:08<207:24:41,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20732/203307 [23:33:08<207:24:41,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20733/203307 [23:33:12<207:24:39,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20733/203307 [23:33:12<207:24:39,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20734/203307 [23:33:16<207:24:33,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20734/203307 [23:33:16<207:24:33,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20735/203307 [23:33:20<207:24:31,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20735/203307 [23:33:20<207:24:31,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20736/203307 [23:33:24<207:24:24,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20736/203307 [23:33:24<207:24:24,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20737/203307 [23:33:28<207:24:23,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20737/203307 [23:33:28<207:24:23,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20738/203307 [23:33:33<207:24:22,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20738/203307 [23:33:33<207:24:22,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20739/203307 [23:33:37<207:24:14,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20739/203307 [23:33:37<207:24:15,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20740/203307 [23:33:41<207:24:12,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20740/203307 [23:33:41<207:24:12,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20741/203307 [23:33:45<207:24:10,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  10%|█         | 20741/203307 [23:33:45<207:24:10,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20742/203307 [23:33:49<207:24:08,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20742/203307 [23:33:49<207:24:08,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20743/203307 [23:33:54<207:24:05,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20743/203307 [23:33:54<207:24:05,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20744/203307 [23:33:57<207:23:58,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20744/203307 [23:33:57<207:23:58,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20745/203307 [23:34:02<207:23:56,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20745/203307 [23:34:02<207:23:56,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20746/203307 [23:34:06<207:23:50,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20746/203307 [23:34:06<207:23:50,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20747/203307 [23:34:10<207:23:50,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20747/203307 [23:34:10<207:23:50,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20748/203307 [23:34:14<207:23:42,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20748/203307 [23:34:14<207:23:42,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20749/203307 [23:34:18<207:23:40,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20749/203307 [23:34:18<207:23:40,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20750/203307 [23:34:22<207:23:33,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20750/203307 [23:34:22<207:23:33,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20751/203307 [23:34:26<207:23:31,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20751/203307 [23:34:26<207:23:31,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20752/203307 [23:34:30<207:23:24,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20752/203307 [23:34:30<207:23:24,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20753/203307 [23:34:34<207:23:17,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20753/203307 [23:34:34<207:23:17,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20754/203307 [23:34:38<207:23:15,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20754/203307 [23:34:38<207:23:15,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20755/203307 [23:34:42<207:23:08,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20755/203307 [23:34:42<207:23:08,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20756/203307 [23:34:46<207:23:06,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20756/203307 [23:34:46<207:23:06,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20757/203307 [23:34:50<207:23:02,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20757/203307 [23:34:50<207:23:02,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20758/203307 [23:34:55<207:23:00,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20758/203307 [23:34:55<207:23:00,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20759/203307 [23:34:59<207:22:57,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20759/203307 [23:34:59<207:22:57,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20760/203307 [23:35:03<207:22:54,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20760/203307 [23:35:03<207:22:54,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20761/203307 [23:35:07<207:22:46,  0.24it/s, v_num=t5e6, training/loss=0.0947]Epoch 0:  10%|█         | 20761/203307 [23:35:07<207:22:46,  0.24it/s, v_num=t5e6, training/loss=0.079] Epoch 0:  10%|█         | 20762/203307 [23:35:10<207:22:39,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20762/203307 [23:35:10<207:22:39,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20763/203307 [23:35:15<207:22:37,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20763/203307 [23:35:15<207:22:37,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20764/203307 [23:35:19<207:22:35,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20764/203307 [23:35:19<207:22:35,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20765/203307 [23:35:23<207:22:28,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20765/203307 [23:35:23<207:22:28,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20766/203307 [23:35:27<207:22:25,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20766/203307 [23:35:27<207:22:25,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20767/203307 [23:35:31<207:22:21,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20767/203307 [23:35:31<207:22:21,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20768/203307 [23:35:35<207:22:19,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20768/203307 [23:35:35<207:22:19,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20769/203307 [23:35:39<207:22:11,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20769/203307 [23:35:39<207:22:12,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20770/203307 [23:35:43<207:22:04,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20770/203307 [23:35:43<207:22:04,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20771/203307 [23:35:47<207:22:02,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20771/203307 [23:35:47<207:22:02,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20772/203307 [23:35:51<207:21:55,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20772/203307 [23:35:51<207:21:55,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20773/203307 [23:35:55<207:21:53,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20773/203307 [23:35:55<207:21:53,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20774/203307 [23:36:00<207:21:50,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20774/203307 [23:36:00<207:21:50,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20775/203307 [23:36:03<207:21:43,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20775/203307 [23:36:03<207:21:43,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20776/203307 [23:36:08<207:21:41,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20776/203307 [23:36:08<207:21:41,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20777/203307 [23:36:12<207:21:38,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20777/203307 [23:36:12<207:21:38,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20778/203307 [23:36:15<207:21:30,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20778/203307 [23:36:15<207:21:30,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20779/203307 [23:36:19<207:21:25,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20779/203307 [23:36:19<207:21:25,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20780/203307 [23:36:24<207:21:23,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20780/203307 [23:36:24<207:21:23,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20781/203307 [23:36:28<207:21:16,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  10%|█         | 20781/203307 [23:36:28<207:21:16,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20782/203307 [23:36:32<207:21:14,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20782/203307 [23:36:32<207:21:14,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20783/203307 [23:36:36<207:21:11,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20783/203307 [23:36:36<207:21:11,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20784/203307 [23:36:40<207:21:07,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20784/203307 [23:36:40<207:21:07,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20785/203307 [23:36:45<207:21:05,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20785/203307 [23:36:45<207:21:05,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20786/203307 [23:36:48<207:20:58,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20786/203307 [23:36:48<207:20:58,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20787/203307 [23:36:52<207:20:50,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20787/203307 [23:36:52<207:20:50,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20788/203307 [23:36:56<207:20:42,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20788/203307 [23:36:56<207:20:42,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20789/203307 [23:37:00<207:20:41,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20789/203307 [23:37:00<207:20:41,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20790/203307 [23:37:04<207:20:39,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20790/203307 [23:37:04<207:20:39,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20791/203307 [23:37:08<207:20:36,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20791/203307 [23:37:08<207:20:36,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20792/203307 [23:37:12<207:20:28,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20792/203307 [23:37:12<207:20:28,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20793/203307 [23:37:17<207:20:27,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20793/203307 [23:37:17<207:20:27,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20794/203307 [23:37:21<207:20:24,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20794/203307 [23:37:21<207:20:24,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20795/203307 [23:37:25<207:20:17,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20795/203307 [23:37:25<207:20:17,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20796/203307 [23:37:28<207:20:09,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20796/203307 [23:37:28<207:20:09,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20797/203307 [23:37:33<207:20:09,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20797/203307 [23:37:33<207:20:09,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20798/203307 [23:37:37<207:20:02,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20798/203307 [23:37:37<207:20:02,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20799/203307 [23:37:41<207:20:01,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20799/203307 [23:37:41<207:20:01,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20800/203307 [23:37:45<207:19:53,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20800/203307 [23:37:45<207:19:53,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20801/203307 [23:37:49<207:19:51,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  10%|█         | 20801/203307 [23:37:49<207:19:51,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20802/203307 [23:37:53<207:19:43,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20802/203307 [23:37:53<207:19:43,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20803/203307 [23:37:57<207:19:40,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20803/203307 [23:37:57<207:19:40,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20804/203307 [23:38:00<207:19:32,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20804/203307 [23:38:00<207:19:32,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20805/203307 [23:38:04<207:19:24,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20805/203307 [23:38:04<207:19:24,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20806/203307 [23:38:09<207:19:23,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20806/203307 [23:38:09<207:19:23,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20807/203307 [23:38:12<207:19:15,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20807/203307 [23:38:12<207:19:15,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20808/203307 [23:38:17<207:19:14,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20808/203307 [23:38:17<207:19:14,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20809/203307 [23:38:20<207:19:07,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20809/203307 [23:38:20<207:19:07,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20810/203307 [23:38:25<207:19:04,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20810/203307 [23:38:25<207:19:04,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20811/203307 [23:38:29<207:19:02,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20811/203307 [23:38:29<207:19:02,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20812/203307 [23:38:33<207:18:55,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20812/203307 [23:38:33<207:18:55,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20813/203307 [23:38:36<207:18:48,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20813/203307 [23:38:36<207:18:48,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20814/203307 [23:38:40<207:18:40,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20814/203307 [23:38:40<207:18:41,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20815/203307 [23:38:45<207:18:40,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20815/203307 [23:38:45<207:18:40,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20816/203307 [23:38:49<207:18:39,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20816/203307 [23:38:49<207:18:39,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20817/203307 [23:38:53<207:18:32,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20817/203307 [23:38:53<207:18:33,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20818/203307 [23:38:57<207:18:30,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20818/203307 [23:38:57<207:18:30,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20819/203307 [23:39:01<207:18:23,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20819/203307 [23:39:01<207:18:23,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20820/203307 [23:39:05<207:18:20,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20820/203307 [23:39:05<207:18:21,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20821/203307 [23:39:09<207:18:18,  0.24it/s, v_num=t5e6, training/loss=0.0873]Epoch 0:  10%|█         | 20821/203307 [23:39:09<207:18:18,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20822/203307 [23:39:13<207:18:10,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20822/203307 [23:39:13<207:18:10,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20823/203307 [23:39:18<207:18:09,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20823/203307 [23:39:18<207:18:09,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20824/203307 [23:39:22<207:18:06,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20824/203307 [23:39:22<207:18:07,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20825/203307 [23:39:26<207:18:04,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20825/203307 [23:39:26<207:18:04,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20826/203307 [23:39:30<207:18:01,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20826/203307 [23:39:30<207:18:01,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20827/203307 [23:39:34<207:17:54,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20827/203307 [23:39:34<207:17:54,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20828/203307 [23:39:38<207:17:47,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20828/203307 [23:39:38<207:17:47,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20829/203307 [23:39:42<207:17:45,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20829/203307 [23:39:42<207:17:45,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20830/203307 [23:39:46<207:17:42,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20830/203307 [23:39:46<207:17:42,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20831/203307 [23:39:50<207:17:35,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20831/203307 [23:39:50<207:17:35,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20832/203307 [23:39:55<207:17:34,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20832/203307 [23:39:55<207:17:34,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20833/203307 [23:39:59<207:17:31,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20833/203307 [23:39:59<207:17:31,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20834/203307 [23:40:03<207:17:29,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20834/203307 [23:40:03<207:17:29,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20835/203307 [23:40:07<207:17:27,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20835/203307 [23:40:07<207:17:27,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20836/203307 [23:40:11<207:17:19,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20836/203307 [23:40:11<207:17:19,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20837/203307 [23:40:15<207:17:16,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20837/203307 [23:40:15<207:17:16,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20838/203307 [23:40:20<207:17:14,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20838/203307 [23:40:20<207:17:14,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20839/203307 [23:40:23<207:17:06,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20839/203307 [23:40:23<207:17:06,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20840/203307 [23:40:27<207:16:58,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20840/203307 [23:40:27<207:16:58,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20841/203307 [23:40:31<207:16:58,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  10%|█         | 20841/203307 [23:40:32<207:16:58,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20842/203307 [23:40:36<207:16:57,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20842/203307 [23:40:36<207:16:57,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20843/203307 [23:40:40<207:16:55,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20843/203307 [23:40:40<207:16:55,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20844/203307 [23:40:44<207:16:48,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20844/203307 [23:40:44<207:16:48,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20845/203307 [23:40:48<207:16:40,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20845/203307 [23:40:48<207:16:41,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20846/203307 [23:40:52<207:16:38,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20846/203307 [23:40:52<207:16:38,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20847/203307 [23:40:56<207:16:31,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20847/203307 [23:40:56<207:16:31,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20848/203307 [23:41:00<207:16:27,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20848/203307 [23:41:00<207:16:28,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20849/203307 [23:41:04<207:16:25,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20849/203307 [23:41:04<207:16:26,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20850/203307 [23:41:08<207:16:19,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20850/203307 [23:41:08<207:16:19,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20851/203307 [23:41:13<207:16:18,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20851/203307 [23:41:13<207:16:18,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20852/203307 [23:41:16<207:16:11,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20852/203307 [23:41:16<207:16:11,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20853/203307 [23:41:20<207:16:04,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20853/203307 [23:41:20<207:16:04,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20854/203307 [23:41:24<207:15:57,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20854/203307 [23:41:24<207:15:57,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20855/203307 [23:41:28<207:15:55,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20855/203307 [23:41:28<207:15:55,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20856/203307 [23:41:32<207:15:47,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20856/203307 [23:41:32<207:15:47,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20857/203307 [23:41:36<207:15:45,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20857/203307 [23:41:36<207:15:45,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20858/203307 [23:41:41<207:15:44,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20858/203307 [23:41:41<207:15:45,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20859/203307 [23:41:44<207:15:37,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20859/203307 [23:41:44<207:15:37,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20860/203307 [23:41:49<207:15:37,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20860/203307 [23:41:49<207:15:37,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20861/203307 [23:41:53<207:15:29,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  10%|█         | 20861/203307 [23:41:53<207:15:29,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20862/203307 [23:41:56<207:15:22,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20862/203307 [23:41:56<207:15:22,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20863/203307 [23:42:00<207:15:20,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20863/203307 [23:42:00<207:15:20,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20864/203307 [23:42:04<207:15:13,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20864/203307 [23:42:04<207:15:13,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20865/203307 [23:42:09<207:15:10,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20865/203307 [23:42:09<207:15:10,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20866/203307 [23:42:13<207:15:08,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20866/203307 [23:42:13<207:15:08,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20867/203307 [23:42:17<207:15:07,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20867/203307 [23:42:17<207:15:07,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20868/203307 [23:42:22<207:15:06,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20868/203307 [23:42:22<207:15:06,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20869/203307 [23:42:26<207:14:59,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20869/203307 [23:42:26<207:14:59,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20870/203307 [23:42:29<207:14:53,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20870/203307 [23:42:29<207:14:53,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20871/203307 [23:42:33<207:14:46,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20871/203307 [23:42:33<207:14:46,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20872/203307 [23:42:37<207:14:44,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20872/203307 [23:42:37<207:14:44,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20873/203307 [23:42:41<207:14:37,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20873/203307 [23:42:41<207:14:37,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20874/203307 [23:42:45<207:14:34,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20874/203307 [23:42:45<207:14:34,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20875/203307 [23:42:50<207:14:32,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20875/203307 [23:42:50<207:14:32,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20876/203307 [23:42:54<207:14:30,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20876/203307 [23:42:54<207:14:31,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20877/203307 [23:42:58<207:14:29,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20877/203307 [23:42:58<207:14:29,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20878/203307 [23:43:02<207:14:21,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20878/203307 [23:43:02<207:14:21,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20879/203307 [23:43:06<207:14:14,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20879/203307 [23:43:06<207:14:14,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20880/203307 [23:43:10<207:14:07,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20880/203307 [23:43:10<207:14:07,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20881/203307 [23:43:14<207:14:05,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  10%|█         | 20881/203307 [23:43:14<207:14:05,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20882/203307 [23:43:18<207:13:58,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20882/203307 [23:43:18<207:13:58,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20883/203307 [23:43:22<207:13:57,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20883/203307 [23:43:22<207:13:57,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20884/203307 [23:43:27<207:13:56,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20884/203307 [23:43:27<207:13:56,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20885/203307 [23:43:31<207:13:54,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20885/203307 [23:43:31<207:13:54,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20886/203307 [23:43:35<207:13:52,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20886/203307 [23:43:35<207:13:53,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20887/203307 [23:43:39<207:13:45,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20887/203307 [23:43:39<207:13:45,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20888/203307 [23:43:43<207:13:38,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20888/203307 [23:43:43<207:13:38,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20889/203307 [23:43:47<207:13:36,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20889/203307 [23:43:47<207:13:36,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20890/203307 [23:43:51<207:13:29,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20890/203307 [23:43:51<207:13:29,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20891/203307 [23:43:55<207:13:27,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20891/203307 [23:43:55<207:13:27,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20892/203307 [23:43:59<207:13:24,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20892/203307 [23:43:59<207:13:24,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20893/203307 [23:44:04<207:13:23,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20893/203307 [23:44:04<207:13:23,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20894/203307 [23:44:08<207:13:22,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20894/203307 [23:44:08<207:13:22,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20895/203307 [23:44:12<207:13:15,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20895/203307 [23:44:12<207:13:15,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20896/203307 [23:44:16<207:13:08,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20896/203307 [23:44:16<207:13:08,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20897/203307 [23:44:20<207:13:01,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20897/203307 [23:44:20<207:13:01,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20898/203307 [23:44:24<207:12:58,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20898/203307 [23:44:24<207:12:58,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20899/203307 [23:44:28<207:12:57,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20899/203307 [23:44:28<207:12:57,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20900/203307 [23:44:32<207:12:51,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20900/203307 [23:44:32<207:12:51,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20901/203307 [23:44:36<207:12:49,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 20901/203307 [23:44:36<207:12:49,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20902/203307 [23:44:41<207:12:46,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20902/203307 [23:44:41<207:12:46,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20903/203307 [23:44:45<207:12:45,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20903/203307 [23:44:45<207:12:45,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20904/203307 [23:44:49<207:12:37,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20904/203307 [23:44:49<207:12:37,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20905/203307 [23:44:52<207:12:30,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20905/203307 [23:44:52<207:12:30,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20906/203307 [23:44:56<207:12:22,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20906/203307 [23:44:56<207:12:22,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20907/203307 [23:45:01<207:12:21,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20907/203307 [23:45:01<207:12:21,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20908/203307 [23:45:05<207:12:19,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20908/203307 [23:45:05<207:12:19,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20909/203307 [23:45:09<207:12:11,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20909/203307 [23:45:09<207:12:11,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20910/203307 [23:45:13<207:12:10,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20910/203307 [23:45:13<207:12:10,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20911/203307 [23:45:17<207:12:06,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20911/203307 [23:45:17<207:12:06,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20912/203307 [23:45:21<207:12:04,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20912/203307 [23:45:21<207:12:04,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20913/203307 [23:45:25<207:11:57,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20913/203307 [23:45:25<207:11:57,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20914/203307 [23:45:29<207:11:50,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20914/203307 [23:45:29<207:11:51,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20915/203307 [23:45:33<207:11:48,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20915/203307 [23:45:33<207:11:48,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20916/203307 [23:45:38<207:11:46,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20916/203307 [23:45:38<207:11:46,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20917/203307 [23:45:41<207:11:38,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20917/203307 [23:45:41<207:11:38,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20918/203307 [23:45:45<207:11:35,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20918/203307 [23:45:45<207:11:35,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20919/203307 [23:45:50<207:11:34,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20919/203307 [23:45:50<207:11:34,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20920/203307 [23:45:54<207:11:33,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20920/203307 [23:45:54<207:11:33,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20921/203307 [23:45:58<207:11:26,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 20921/203307 [23:45:58<207:11:26,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20922/203307 [23:46:02<207:11:18,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20922/203307 [23:46:02<207:11:18,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20923/203307 [23:46:06<207:11:11,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20923/203307 [23:46:06<207:11:11,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20924/203307 [23:46:10<207:11:09,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20924/203307 [23:46:10<207:11:09,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20925/203307 [23:46:14<207:11:02,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20925/203307 [23:46:14<207:11:02,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20926/203307 [23:46:18<207:11:00,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20926/203307 [23:46:18<207:11:00,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20927/203307 [23:46:22<207:11:00,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20927/203307 [23:46:22<207:11:00,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20928/203307 [23:46:26<207:10:53,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20928/203307 [23:46:26<207:10:53,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20929/203307 [23:46:31<207:10:52,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20929/203307 [23:46:31<207:10:52,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20930/203307 [23:46:34<207:10:45,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20930/203307 [23:46:34<207:10:45,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20931/203307 [23:46:38<207:10:38,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20931/203307 [23:46:38<207:10:38,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20932/203307 [23:46:42<207:10:31,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20932/203307 [23:46:42<207:10:31,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20933/203307 [23:46:46<207:10:29,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20933/203307 [23:46:46<207:10:29,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20934/203307 [23:46:50<207:10:21,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20934/203307 [23:46:50<207:10:21,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20935/203307 [23:46:54<207:10:20,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20935/203307 [23:46:54<207:10:20,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20936/203307 [23:46:59<207:10:19,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20936/203307 [23:46:59<207:10:19,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20937/203307 [23:47:03<207:10:12,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20937/203307 [23:47:03<207:10:12,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20938/203307 [23:47:07<207:10:11,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20938/203307 [23:47:07<207:10:11,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20939/203307 [23:47:11<207:10:04,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20939/203307 [23:47:11<207:10:04,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20940/203307 [23:47:14<207:09:56,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20940/203307 [23:47:14<207:09:56,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20941/203307 [23:47:19<207:09:55,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  10%|█         | 20941/203307 [23:47:19<207:09:55,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20942/203307 [23:47:23<207:09:48,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20942/203307 [23:47:23<207:09:48,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20943/203307 [23:47:27<207:09:46,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20943/203307 [23:47:27<207:09:46,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20944/203307 [23:47:31<207:09:39,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20944/203307 [23:47:31<207:09:39,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20945/203307 [23:47:35<207:09:39,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20945/203307 [23:47:35<207:09:39,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20946/203307 [23:47:40<207:09:37,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20946/203307 [23:47:40<207:09:37,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20947/203307 [23:47:43<207:09:30,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20947/203307 [23:47:43<207:09:30,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20948/203307 [23:47:47<207:09:23,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20948/203307 [23:47:47<207:09:23,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20949/203307 [23:47:51<207:09:20,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20949/203307 [23:47:51<207:09:20,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20950/203307 [23:47:56<207:09:17,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20950/203307 [23:47:56<207:09:17,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20951/203307 [23:48:00<207:09:16,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20951/203307 [23:48:00<207:09:16,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20952/203307 [23:48:04<207:09:09,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20952/203307 [23:48:04<207:09:09,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20953/203307 [23:48:08<207:09:07,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20953/203307 [23:48:08<207:09:07,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20954/203307 [23:48:12<207:09:01,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20954/203307 [23:48:12<207:09:01,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20955/203307 [23:48:16<207:09:00,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20955/203307 [23:48:16<207:09:00,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20956/203307 [23:48:21<207:08:58,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20956/203307 [23:48:21<207:08:58,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20957/203307 [23:48:24<207:08:51,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20957/203307 [23:48:24<207:08:51,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20958/203307 [23:48:29<207:08:50,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20958/203307 [23:48:29<207:08:50,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20959/203307 [23:48:33<207:08:47,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20959/203307 [23:48:33<207:08:47,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20960/203307 [23:48:37<207:08:45,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20960/203307 [23:48:37<207:08:45,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20961/203307 [23:48:41<207:08:38,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  10%|█         | 20961/203307 [23:48:41<207:08:38,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20962/203307 [23:48:46<207:08:37,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20962/203307 [23:48:46<207:08:37,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20963/203307 [23:48:49<207:08:30,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20963/203307 [23:48:49<207:08:30,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20964/203307 [23:48:54<207:08:29,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20964/203307 [23:48:54<207:08:29,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20965/203307 [23:48:58<207:08:26,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20965/203307 [23:48:58<207:08:26,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20966/203307 [23:49:02<207:08:23,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20966/203307 [23:49:02<207:08:24,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20967/203307 [23:49:07<207:08:21,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20967/203307 [23:49:07<207:08:21,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20968/203307 [23:49:11<207:08:19,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20968/203307 [23:49:11<207:08:19,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20969/203307 [23:49:15<207:08:12,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20969/203307 [23:49:15<207:08:12,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20970/203307 [23:49:18<207:08:05,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20970/203307 [23:49:18<207:08:05,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20971/203307 [23:49:23<207:08:04,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20971/203307 [23:49:23<207:08:04,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20972/203307 [23:49:27<207:08:02,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20972/203307 [23:49:27<207:08:02,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20973/203307 [23:49:31<207:07:59,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20973/203307 [23:49:31<207:07:59,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20974/203307 [23:49:36<207:07:56,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20974/203307 [23:49:36<207:07:56,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20975/203307 [23:49:39<207:07:49,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20975/203307 [23:49:39<207:07:49,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20976/203307 [23:49:44<207:07:47,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20976/203307 [23:49:44<207:07:47,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20977/203307 [23:49:47<207:07:40,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20977/203307 [23:49:47<207:07:40,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20978/203307 [23:49:51<207:07:32,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20978/203307 [23:49:51<207:07:32,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20979/203307 [23:49:56<207:07:31,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20979/203307 [23:49:56<207:07:31,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20980/203307 [23:49:59<207:07:24,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20980/203307 [23:49:59<207:07:24,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20981/203307 [23:50:04<207:07:22,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  10%|█         | 20981/203307 [23:50:04<207:07:22,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20982/203307 [23:50:07<207:07:15,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20982/203307 [23:50:07<207:07:15,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20983/203307 [23:50:12<207:07:12,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20983/203307 [23:50:12<207:07:12,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20984/203307 [23:50:15<207:07:05,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20984/203307 [23:50:15<207:07:05,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20985/203307 [23:50:20<207:07:03,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20985/203307 [23:50:20<207:07:03,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20986/203307 [23:50:23<207:06:55,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20986/203307 [23:50:23<207:06:56,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20987/203307 [23:50:27<207:06:48,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20987/203307 [23:50:27<207:06:48,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20988/203307 [23:50:32<207:06:47,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20988/203307 [23:50:32<207:06:47,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20989/203307 [23:50:35<207:06:40,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20989/203307 [23:50:35<207:06:40,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20990/203307 [23:50:40<207:06:38,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20990/203307 [23:50:40<207:06:38,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20991/203307 [23:50:44<207:06:35,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20991/203307 [23:50:44<207:06:35,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20992/203307 [23:50:48<207:06:30,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20992/203307 [23:50:48<207:06:31,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20993/203307 [23:50:52<207:06:28,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20993/203307 [23:50:52<207:06:28,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20994/203307 [23:50:56<207:06:20,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20994/203307 [23:50:56<207:06:20,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20995/203307 [23:51:00<207:06:13,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20995/203307 [23:51:00<207:06:13,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20996/203307 [23:51:03<207:06:06,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20996/203307 [23:51:03<207:06:06,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20997/203307 [23:51:08<207:06:05,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20997/203307 [23:51:08<207:06:05,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20998/203307 [23:51:12<207:06:03,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20998/203307 [23:51:12<207:06:03,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20999/203307 [23:51:16<207:06:01,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 20999/203307 [23:51:16<207:06:01,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 21000/203307 [23:51:21<207:05:57,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 21000/203307 [23:51:21<207:05:57,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 21001/203307 [23:51:25<207:05:55,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  10%|█         | 21001/203307 [23:51:25<207:05:55,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21002/203307 [23:51:29<207:05:53,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21002/203307 [23:51:29<207:05:53,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21003/203307 [23:51:33<207:05:45,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21003/203307 [23:51:33<207:05:45,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21004/203307 [23:51:36<207:05:37,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21004/203307 [23:51:36<207:05:37,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21005/203307 [23:51:41<207:05:37,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21005/203307 [23:51:41<207:05:37,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21006/203307 [23:51:45<207:05:30,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21006/203307 [23:51:45<207:05:30,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21007/203307 [23:51:49<207:05:28,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21007/203307 [23:51:49<207:05:28,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21008/203307 [23:51:53<207:05:25,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21008/203307 [23:51:53<207:05:25,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21009/203307 [23:51:57<207:05:17,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21009/203307 [23:51:57<207:05:17,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21010/203307 [23:52:01<207:05:15,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21010/203307 [23:52:01<207:05:15,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21011/203307 [23:52:05<207:05:12,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21011/203307 [23:52:05<207:05:12,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21012/203307 [23:52:09<207:05:04,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21012/203307 [23:52:09<207:05:04,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21013/203307 [23:52:13<207:04:57,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21013/203307 [23:52:13<207:04:57,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21014/203307 [23:52:17<207:04:56,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21014/203307 [23:52:17<207:04:56,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21015/203307 [23:52:21<207:04:49,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21015/203307 [23:52:21<207:04:49,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21016/203307 [23:52:26<207:04:48,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21016/203307 [23:52:26<207:04:48,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21017/203307 [23:52:29<207:04:40,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21017/203307 [23:52:29<207:04:40,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21018/203307 [23:52:33<207:04:38,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21018/203307 [23:52:33<207:04:38,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21019/203307 [23:52:38<207:04:36,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21019/203307 [23:52:38<207:04:36,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21020/203307 [23:52:41<207:04:28,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21020/203307 [23:52:41<207:04:28,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21021/203307 [23:52:45<207:04:21,  0.24it/s, v_num=t5e6, training/loss=0.0955]Epoch 0:  10%|█         | 21021/203307 [23:52:45<207:04:21,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21022/203307 [23:52:49<207:04:13,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21022/203307 [23:52:49<207:04:13,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21023/203307 [23:52:53<207:04:13,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21023/203307 [23:52:53<207:04:13,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21024/203307 [23:52:58<207:04:11,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21024/203307 [23:52:58<207:04:12,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21025/203307 [23:53:01<207:04:04,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21025/203307 [23:53:01<207:04:04,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21026/203307 [23:53:06<207:04:01,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21026/203307 [23:53:06<207:04:01,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21027/203307 [23:53:10<207:04:00,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21027/203307 [23:53:10<207:04:00,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21028/203307 [23:53:14<207:03:57,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21028/203307 [23:53:14<207:03:57,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21029/203307 [23:53:18<207:03:50,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21029/203307 [23:53:18<207:03:50,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21030/203307 [23:53:22<207:03:43,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21030/203307 [23:53:22<207:03:43,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21031/203307 [23:53:26<207:03:42,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21031/203307 [23:53:26<207:03:42,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21032/203307 [23:53:30<207:03:36,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21032/203307 [23:53:30<207:03:36,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21033/203307 [23:53:35<207:03:34,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21033/203307 [23:53:35<207:03:35,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21034/203307 [23:53:38<207:03:27,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21034/203307 [23:53:38<207:03:27,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21035/203307 [23:53:43<207:03:24,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21035/203307 [23:53:43<207:03:24,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21036/203307 [23:53:47<207:03:22,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21036/203307 [23:53:47<207:03:22,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21037/203307 [23:53:51<207:03:19,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21037/203307 [23:53:51<207:03:19,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21038/203307 [23:53:55<207:03:11,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21038/203307 [23:53:55<207:03:11,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21039/203307 [23:53:58<207:03:04,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21039/203307 [23:53:58<207:03:04,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21040/203307 [23:54:03<207:03:04,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21040/203307 [23:54:03<207:03:04,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21041/203307 [23:54:07<207:03:02,  0.24it/s, v_num=t5e6, training/loss=0.0977]Epoch 0:  10%|█         | 21041/203307 [23:54:07<207:03:02,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21042/203307 [23:54:12<207:03:00,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21042/203307 [23:54:12<207:03:00,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21043/203307 [23:54:16<207:02:57,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21043/203307 [23:54:16<207:02:57,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21044/203307 [23:54:20<207:02:50,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21044/203307 [23:54:20<207:02:50,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21045/203307 [23:54:24<207:02:48,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21045/203307 [23:54:24<207:02:48,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21046/203307 [23:54:28<207:02:45,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21046/203307 [23:54:28<207:02:45,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21047/203307 [23:54:32<207:02:37,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21047/203307 [23:54:32<207:02:37,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21048/203307 [23:54:36<207:02:30,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21048/203307 [23:54:36<207:02:30,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21049/203307 [23:54:40<207:02:30,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21049/203307 [23:54:40<207:02:30,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21050/203307 [23:54:44<207:02:27,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21050/203307 [23:54:44<207:02:27,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21051/203307 [23:54:49<207:02:25,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21051/203307 [23:54:49<207:02:25,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21052/203307 [23:54:52<207:02:17,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21052/203307 [23:54:52<207:02:17,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21053/203307 [23:54:57<207:02:14,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21053/203307 [23:54:57<207:02:15,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21054/203307 [23:55:01<207:02:11,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21054/203307 [23:55:01<207:02:11,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21055/203307 [23:55:04<207:02:04,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21055/203307 [23:55:04<207:02:04,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21056/203307 [23:55:08<207:01:56,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21056/203307 [23:55:08<207:01:56,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21057/203307 [23:55:13<207:01:55,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21057/203307 [23:55:13<207:01:55,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21058/203307 [23:55:17<207:01:53,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21058/203307 [23:55:17<207:01:53,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21059/203307 [23:55:21<207:01:52,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21059/203307 [23:55:21<207:01:52,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21060/203307 [23:55:26<207:01:50,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21060/203307 [23:55:26<207:01:50,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21061/203307 [23:55:29<207:01:42,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  10%|█         | 21061/203307 [23:55:29<207:01:42,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21062/203307 [23:55:34<207:01:40,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21062/203307 [23:55:34<207:01:40,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21063/203307 [23:55:38<207:01:37,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21063/203307 [23:55:38<207:01:37,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21064/203307 [23:55:42<207:01:34,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21064/203307 [23:55:42<207:01:34,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21065/203307 [23:55:46<207:01:27,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21065/203307 [23:55:46<207:01:27,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21066/203307 [23:55:50<207:01:26,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21066/203307 [23:55:50<207:01:26,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21067/203307 [23:55:54<207:01:19,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21067/203307 [23:55:54<207:01:19,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21068/203307 [23:55:59<207:01:19,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21068/203307 [23:55:59<207:01:19,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21069/203307 [23:56:02<207:01:12,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21069/203307 [23:56:02<207:01:12,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21070/203307 [23:56:06<207:01:05,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21070/203307 [23:56:06<207:01:05,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21071/203307 [23:56:10<207:01:03,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21071/203307 [23:56:10<207:01:03,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21072/203307 [23:56:14<207:00:56,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21072/203307 [23:56:14<207:00:56,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21073/203307 [23:56:18<207:00:53,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21073/203307 [23:56:18<207:00:53,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21074/203307 [23:56:23<207:00:52,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21074/203307 [23:56:23<207:00:52,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21075/203307 [23:56:27<207:00:51,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21075/203307 [23:56:27<207:00:51,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21076/203307 [23:56:32<207:00:52,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21076/203307 [23:56:32<207:00:52,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21077/203307 [23:56:36<207:00:45,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21077/203307 [23:56:36<207:00:45,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21078/203307 [23:56:39<207:00:38,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21078/203307 [23:56:39<207:00:38,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21079/203307 [23:56:44<207:00:35,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21079/203307 [23:56:44<207:00:35,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21080/203307 [23:56:48<207:00:33,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21080/203307 [23:56:48<207:00:33,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21081/203307 [23:56:52<207:00:30,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  10%|█         | 21081/203307 [23:56:52<207:00:30,  0.24it/s, v_num=t5e6, training/loss=0.088] Epoch 0:  10%|█         | 21082/203307 [23:56:56<207:00:22,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21082/203307 [23:56:56<207:00:22,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21083/203307 [23:57:00<207:00:21,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21083/203307 [23:57:00<207:00:21,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21084/203307 [23:57:04<207:00:14,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21084/203307 [23:57:04<207:00:14,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21085/203307 [23:57:09<207:00:14,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21085/203307 [23:57:09<207:00:14,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21086/203307 [23:57:12<207:00:06,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21086/203307 [23:57:12<207:00:06,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21087/203307 [23:57:16<206:59:58,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21087/203307 [23:57:16<206:59:58,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21088/203307 [23:57:20<206:59:56,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21088/203307 [23:57:20<206:59:56,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21089/203307 [23:57:25<206:59:54,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21089/203307 [23:57:25<206:59:54,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21090/203307 [23:57:28<206:59:47,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21090/203307 [23:57:28<206:59:47,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21091/203307 [23:57:33<206:59:45,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21091/203307 [23:57:33<206:59:45,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21092/203307 [23:57:37<206:59:44,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21092/203307 [23:57:37<206:59:44,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21093/203307 [23:57:41<206:59:42,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21093/203307 [23:57:41<206:59:42,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21094/203307 [23:57:46<206:59:40,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21094/203307 [23:57:46<206:59:40,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21095/203307 [23:57:49<206:59:32,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21095/203307 [23:57:49<206:59:32,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21096/203307 [23:57:53<206:59:24,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21096/203307 [23:57:53<206:59:25,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21097/203307 [23:57:58<206:59:24,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21097/203307 [23:57:58<206:59:24,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21098/203307 [23:58:01<206:59:16,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21098/203307 [23:58:01<206:59:16,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21099/203307 [23:58:06<206:59:14,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21099/203307 [23:58:06<206:59:14,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21100/203307 [23:58:10<206:59:10,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21100/203307 [23:58:10<206:59:10,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21101/203307 [23:58:14<206:59:09,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  10%|█         | 21101/203307 [23:58:14<206:59:09,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21102/203307 [23:58:19<206:59:08,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21102/203307 [23:58:19<206:59:08,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21103/203307 [23:58:22<206:59:00,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21103/203307 [23:58:22<206:59:00,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21104/203307 [23:58:26<206:58:52,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21104/203307 [23:58:26<206:58:52,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21105/203307 [23:58:30<206:58:51,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21105/203307 [23:58:30<206:58:51,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21106/203307 [23:58:35<206:58:48,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21106/203307 [23:58:35<206:58:48,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21107/203307 [23:58:38<206:58:40,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21107/203307 [23:58:38<206:58:40,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21108/203307 [23:58:42<206:58:38,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21108/203307 [23:58:42<206:58:38,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21109/203307 [23:58:47<206:58:36,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21109/203307 [23:58:47<206:58:36,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21110/203307 [23:58:51<206:58:33,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21110/203307 [23:58:51<206:58:33,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21111/203307 [23:58:55<206:58:31,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21111/203307 [23:58:55<206:58:32,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21112/203307 [23:58:59<206:58:24,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21112/203307 [23:58:59<206:58:24,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21113/203307 [23:59:03<206:58:16,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21113/203307 [23:59:03<206:58:16,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21114/203307 [23:59:07<206:58:14,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21114/203307 [23:59:07<206:58:14,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21115/203307 [23:59:11<206:58:11,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21115/203307 [23:59:11<206:58:11,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21116/203307 [23:59:15<206:58:07,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21116/203307 [23:59:15<206:58:07,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21117/203307 [23:59:19<206:58:00,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21117/203307 [23:59:19<206:58:01,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21118/203307 [23:59:24<206:58:00,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21118/203307 [23:59:24<206:58:00,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21119/203307 [23:59:27<206:57:53,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21119/203307 [23:59:27<206:57:53,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21120/203307 [23:59:32<206:57:52,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21120/203307 [23:59:32<206:57:52,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21121/203307 [23:59:36<206:57:45,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  10%|█         | 21121/203307 [23:59:36<206:57:45,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21122/203307 [23:59:39<206:57:38,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21122/203307 [23:59:39<206:57:38,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21123/203307 [23:59:44<206:57:35,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21123/203307 [23:59:44<206:57:35,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21124/203307 [23:59:48<206:57:33,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21124/203307 [23:59:48<206:57:33,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21125/203307 [23:59:52<206:57:25,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21125/203307 [23:59:52<206:57:25,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21126/203307 [23:59:56<206:57:23,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21126/203307 [23:59:56<206:57:23,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21127/203307 [24:00:00<206:57:22,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21127/203307 [24:00:00<206:57:22,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21128/203307 [24:00:05<206:57:21,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21128/203307 [24:00:05<206:57:21,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21129/203307 [24:00:09<206:57:14,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21129/203307 [24:00:09<206:57:14,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21130/203307 [24:00:12<206:57:06,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21130/203307 [24:00:12<206:57:06,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21131/203307 [24:00:17<206:57:04,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21131/203307 [24:00:17<206:57:04,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21132/203307 [24:00:21<206:57:01,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21132/203307 [24:00:21<206:57:01,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21133/203307 [24:00:25<206:56:58,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21133/203307 [24:00:25<206:56:58,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21134/203307 [24:00:29<206:56:51,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21134/203307 [24:00:29<206:56:51,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21135/203307 [24:00:33<206:56:49,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21135/203307 [24:00:33<206:56:49,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21136/203307 [24:00:37<206:56:42,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21136/203307 [24:00:37<206:56:42,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21137/203307 [24:00:41<206:56:40,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21137/203307 [24:00:41<206:56:40,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21138/203307 [24:00:45<206:56:33,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21138/203307 [24:00:45<206:56:33,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21139/203307 [24:00:49<206:56:25,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21139/203307 [24:00:49<206:56:25,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21140/203307 [24:00:53<206:56:23,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21140/203307 [24:00:53<206:56:23,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21141/203307 [24:00:57<206:56:21,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  10%|█         | 21141/203307 [24:00:57<206:56:21,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21142/203307 [24:01:01<206:56:13,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21142/203307 [24:01:01<206:56:13,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21143/203307 [24:01:05<206:56:10,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21143/203307 [24:01:05<206:56:10,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21144/203307 [24:01:09<206:56:08,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21144/203307 [24:01:09<206:56:09,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21145/203307 [24:01:14<206:56:06,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21145/203307 [24:01:14<206:56:06,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21146/203307 [24:01:18<206:56:04,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21146/203307 [24:01:18<206:56:04,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21147/203307 [24:01:22<206:55:56,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21147/203307 [24:01:22<206:55:56,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21148/203307 [24:01:25<206:55:49,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21148/203307 [24:01:25<206:55:49,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21149/203307 [24:01:30<206:55:47,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21149/203307 [24:01:30<206:55:47,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21150/203307 [24:01:33<206:55:40,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21150/203307 [24:01:33<206:55:40,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21151/203307 [24:01:38<206:55:36,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21151/203307 [24:01:38<206:55:36,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21152/203307 [24:01:41<206:55:29,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21152/203307 [24:01:41<206:55:29,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21153/203307 [24:01:46<206:55:27,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21153/203307 [24:01:46<206:55:27,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21154/203307 [24:01:50<206:55:25,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21154/203307 [24:01:50<206:55:26,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21155/203307 [24:01:54<206:55:18,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21155/203307 [24:01:54<206:55:18,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21156/203307 [24:01:57<206:55:10,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21156/203307 [24:01:57<206:55:10,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21157/203307 [24:02:02<206:55:09,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21157/203307 [24:02:02<206:55:09,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21158/203307 [24:02:06<206:55:06,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21158/203307 [24:02:06<206:55:06,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21159/203307 [24:02:10<206:54:58,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21159/203307 [24:02:10<206:54:58,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21160/203307 [24:02:14<206:54:55,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21160/203307 [24:02:14<206:54:55,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21161/203307 [24:02:18<206:54:54,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  10%|█         | 21161/203307 [24:02:18<206:54:54,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21162/203307 [24:02:22<206:54:50,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21162/203307 [24:02:22<206:54:50,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21163/203307 [24:02:27<206:54:48,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21163/203307 [24:02:27<206:54:48,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21164/203307 [24:02:31<206:54:41,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21164/203307 [24:02:31<206:54:41,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21165/203307 [24:02:34<206:54:33,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21165/203307 [24:02:34<206:54:33,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21166/203307 [24:02:38<206:54:30,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21166/203307 [24:02:38<206:54:30,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21167/203307 [24:02:43<206:54:27,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21167/203307 [24:02:43<206:54:27,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21168/203307 [24:02:47<206:54:23,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21168/203307 [24:02:47<206:54:23,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21169/203307 [24:02:50<206:54:16,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21169/203307 [24:02:50<206:54:16,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21170/203307 [24:02:55<206:54:15,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21170/203307 [24:02:55<206:54:15,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21171/203307 [24:02:59<206:54:07,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21171/203307 [24:02:59<206:54:07,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21172/203307 [24:03:03<206:54:05,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21172/203307 [24:03:03<206:54:05,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21173/203307 [24:03:07<206:53:57,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21173/203307 [24:03:07<206:53:57,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21174/203307 [24:03:11<206:53:54,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21174/203307 [24:03:11<206:53:54,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21175/203307 [24:03:15<206:53:51,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21175/203307 [24:03:15<206:53:51,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21176/203307 [24:03:19<206:53:48,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21176/203307 [24:03:19<206:53:48,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21177/203307 [24:03:23<206:53:41,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21177/203307 [24:03:23<206:53:41,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21178/203307 [24:03:27<206:53:33,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21178/203307 [24:03:27<206:53:33,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21179/203307 [24:03:31<206:53:33,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21179/203307 [24:03:31<206:53:33,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21180/203307 [24:03:36<206:53:31,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21180/203307 [24:03:36<206:53:32,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21181/203307 [24:03:40<206:53:28,  0.24it/s, v_num=t5e6, training/loss=0.0918]Epoch 0:  10%|█         | 21181/203307 [24:03:40<206:53:28,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21182/203307 [24:03:43<206:53:20,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21182/203307 [24:03:43<206:53:20,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21183/203307 [24:03:48<206:53:18,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21183/203307 [24:03:48<206:53:18,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21184/203307 [24:03:52<206:53:15,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21184/203307 [24:03:52<206:53:15,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21185/203307 [24:03:56<206:53:12,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21185/203307 [24:03:56<206:53:12,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21186/203307 [24:04:00<206:53:04,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21186/203307 [24:04:00<206:53:04,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21187/203307 [24:04:04<206:53:03,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21187/203307 [24:04:04<206:53:03,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21188/203307 [24:04:08<206:52:56,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21188/203307 [24:04:08<206:52:56,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21189/203307 [24:04:12<206:52:54,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21189/203307 [24:04:12<206:52:54,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21190/203307 [24:04:16<206:52:47,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21190/203307 [24:04:16<206:52:47,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21191/203307 [24:04:20<206:52:44,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21191/203307 [24:04:20<206:52:44,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21192/203307 [24:04:25<206:52:42,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21192/203307 [24:04:25<206:52:42,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21193/203307 [24:04:29<206:52:41,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21193/203307 [24:04:29<206:52:41,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21194/203307 [24:04:33<206:52:33,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21194/203307 [24:04:33<206:52:33,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21195/203307 [24:04:37<206:52:27,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21195/203307 [24:04:37<206:52:27,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21196/203307 [24:04:41<206:52:26,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21196/203307 [24:04:41<206:52:26,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21197/203307 [24:04:45<206:52:19,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21197/203307 [24:04:45<206:52:19,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21198/203307 [24:04:49<206:52:18,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21198/203307 [24:04:49<206:52:18,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21199/203307 [24:04:53<206:52:16,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21199/203307 [24:04:53<206:52:16,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21200/203307 [24:04:57<206:52:09,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21200/203307 [24:04:57<206:52:09,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21201/203307 [24:05:02<206:52:07,  0.24it/s, v_num=t5e6, training/loss=0.0813]Epoch 0:  10%|█         | 21201/203307 [24:05:02<206:52:07,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21202/203307 [24:05:05<206:52:01,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21202/203307 [24:05:05<206:52:01,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21203/203307 [24:05:09<206:51:54,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21203/203307 [24:05:09<206:51:54,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21204/203307 [24:05:13<206:51:47,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21204/203307 [24:05:13<206:51:47,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21205/203307 [24:05:17<206:51:47,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21205/203307 [24:05:17<206:51:47,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21206/203307 [24:05:22<206:51:45,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21206/203307 [24:05:22<206:51:45,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21207/203307 [24:05:26<206:51:38,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21207/203307 [24:05:26<206:51:38,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21208/203307 [24:05:30<206:51:35,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21208/203307 [24:05:30<206:51:36,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21209/203307 [24:05:34<206:51:33,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21209/203307 [24:05:34<206:51:33,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21210/203307 [24:05:38<206:51:30,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21210/203307 [24:05:38<206:51:30,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21211/203307 [24:05:42<206:51:23,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21211/203307 [24:05:42<206:51:23,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21212/203307 [24:05:46<206:51:15,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21212/203307 [24:05:46<206:51:15,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21213/203307 [24:05:50<206:51:14,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21213/203307 [24:05:50<206:51:14,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21214/203307 [24:05:54<206:51:08,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21214/203307 [24:05:54<206:51:08,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21215/203307 [24:05:58<206:51:06,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21215/203307 [24:05:58<206:51:06,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21216/203307 [24:06:03<206:51:03,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21216/203307 [24:06:03<206:51:03,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21217/203307 [24:06:06<206:50:56,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21217/203307 [24:06:06<206:50:56,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21218/203307 [24:06:11<206:50:53,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21218/203307 [24:06:11<206:50:53,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21219/203307 [24:06:15<206:50:50,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21219/203307 [24:06:15<206:50:50,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21220/203307 [24:06:19<206:50:43,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21220/203307 [24:06:19<206:50:43,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21221/203307 [24:06:22<206:50:37,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  10%|█         | 21221/203307 [24:06:22<206:50:37,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21222/203307 [24:06:27<206:50:36,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21222/203307 [24:06:27<206:50:36,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21223/203307 [24:06:31<206:50:29,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21223/203307 [24:06:31<206:50:30,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21224/203307 [24:06:35<206:50:28,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21224/203307 [24:06:35<206:50:28,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21225/203307 [24:06:39<206:50:22,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21225/203307 [24:06:39<206:50:22,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21226/203307 [24:06:43<206:50:18,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21226/203307 [24:06:43<206:50:18,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21227/203307 [24:06:47<206:50:17,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21227/203307 [24:06:47<206:50:17,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21228/203307 [24:06:51<206:50:10,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21228/203307 [24:06:51<206:50:10,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21229/203307 [24:06:55<206:50:03,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21229/203307 [24:06:55<206:50:03,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21230/203307 [24:06:59<206:49:57,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21230/203307 [24:06:59<206:49:57,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21231/203307 [24:07:03<206:49:56,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21231/203307 [24:07:03<206:49:57,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21232/203307 [24:07:08<206:49:55,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21232/203307 [24:07:08<206:49:55,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21233/203307 [24:07:12<206:49:53,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21233/203307 [24:07:12<206:49:53,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21234/203307 [24:07:16<206:49:46,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21234/203307 [24:07:16<206:49:46,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21235/203307 [24:07:20<206:49:45,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21235/203307 [24:07:20<206:49:45,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21236/203307 [24:07:25<206:49:43,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21236/203307 [24:07:25<206:49:43,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21237/203307 [24:07:28<206:49:36,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21237/203307 [24:07:28<206:49:36,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21238/203307 [24:07:32<206:49:29,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21238/203307 [24:07:32<206:49:29,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21239/203307 [24:07:37<206:49:29,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21239/203307 [24:07:37<206:49:29,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21240/203307 [24:07:41<206:49:23,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21240/203307 [24:07:41<206:49:23,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21241/203307 [24:07:45<206:49:23,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  10%|█         | 21241/203307 [24:07:45<206:49:23,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21242/203307 [24:07:49<206:49:16,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21242/203307 [24:07:49<206:49:16,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21243/203307 [24:07:53<206:49:13,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21243/203307 [24:07:53<206:49:13,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21244/203307 [24:07:57<206:49:11,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21244/203307 [24:07:57<206:49:11,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21245/203307 [24:08:02<206:49:08,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21245/203307 [24:08:02<206:49:08,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21246/203307 [24:08:05<206:49:02,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21246/203307 [24:08:05<206:49:02,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21247/203307 [24:08:09<206:48:55,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21247/203307 [24:08:09<206:48:55,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21248/203307 [24:08:14<206:48:54,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21248/203307 [24:08:14<206:48:54,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21249/203307 [24:08:18<206:48:52,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21249/203307 [24:08:18<206:48:52,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21250/203307 [24:08:22<206:48:51,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21250/203307 [24:08:22<206:48:51,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21251/203307 [24:08:27<206:48:48,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21251/203307 [24:08:27<206:48:48,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21252/203307 [24:08:30<206:48:40,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21252/203307 [24:08:30<206:48:40,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21253/203307 [24:08:35<206:48:39,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21253/203307 [24:08:35<206:48:39,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21254/203307 [24:08:38<206:48:32,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21254/203307 [24:08:38<206:48:32,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21255/203307 [24:08:42<206:48:24,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21255/203307 [24:08:42<206:48:24,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21256/203307 [24:08:46<206:48:16,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21256/203307 [24:08:46<206:48:16,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21257/203307 [24:08:50<206:48:15,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21257/203307 [24:08:50<206:48:15,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21258/203307 [24:08:55<206:48:14,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21258/203307 [24:08:55<206:48:14,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21259/203307 [24:08:58<206:48:06,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21259/203307 [24:08:58<206:48:06,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21260/203307 [24:09:03<206:48:03,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21260/203307 [24:09:03<206:48:04,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21261/203307 [24:09:07<206:48:01,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  10%|█         | 21261/203307 [24:09:07<206:48:01,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21262/203307 [24:09:11<206:47:58,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21262/203307 [24:09:11<206:47:58,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21263/203307 [24:09:15<206:47:52,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21263/203307 [24:09:15<206:47:52,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21264/203307 [24:09:19<206:47:44,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21264/203307 [24:09:19<206:47:44,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21265/203307 [24:09:23<206:47:43,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21265/203307 [24:09:23<206:47:43,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21266/203307 [24:09:27<206:47:41,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21266/203307 [24:09:27<206:47:41,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21267/203307 [24:09:32<206:47:39,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21267/203307 [24:09:32<206:47:39,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21268/203307 [24:09:36<206:47:37,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21268/203307 [24:09:36<206:47:37,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21269/203307 [24:09:40<206:47:29,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21269/203307 [24:09:40<206:47:29,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21270/203307 [24:09:44<206:47:26,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21270/203307 [24:09:44<206:47:26,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21271/203307 [24:09:48<206:47:23,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21271/203307 [24:09:48<206:47:23,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21272/203307 [24:09:52<206:47:15,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21272/203307 [24:09:52<206:47:15,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21273/203307 [24:09:55<206:47:08,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21273/203307 [24:09:55<206:47:08,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21274/203307 [24:10:00<206:47:07,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21274/203307 [24:10:00<206:47:07,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21275/203307 [24:10:04<206:46:59,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21275/203307 [24:10:04<206:46:59,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21276/203307 [24:10:08<206:46:57,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21276/203307 [24:10:08<206:46:57,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21277/203307 [24:10:12<206:46:49,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21277/203307 [24:10:12<206:46:49,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21278/203307 [24:10:15<206:46:42,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21278/203307 [24:10:15<206:46:42,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21279/203307 [24:10:20<206:46:40,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21279/203307 [24:10:20<206:46:40,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21280/203307 [24:10:24<206:46:38,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21280/203307 [24:10:24<206:46:38,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21281/203307 [24:10:28<206:46:30,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  10%|█         | 21281/203307 [24:10:28<206:46:31,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21282/203307 [24:10:31<206:46:24,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21282/203307 [24:10:31<206:46:24,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21283/203307 [24:10:36<206:46:23,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21283/203307 [24:10:36<206:46:23,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21284/203307 [24:10:40<206:46:22,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21284/203307 [24:10:40<206:46:22,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21285/203307 [24:10:45<206:46:19,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21285/203307 [24:10:45<206:46:19,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21286/203307 [24:10:48<206:46:12,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21286/203307 [24:10:48<206:46:12,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21287/203307 [24:10:53<206:46:09,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21287/203307 [24:10:53<206:46:09,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21288/203307 [24:10:57<206:46:06,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21288/203307 [24:10:57<206:46:06,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21289/203307 [24:11:01<206:46:03,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21289/203307 [24:11:01<206:46:03,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21290/203307 [24:11:05<206:45:55,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21290/203307 [24:11:05<206:45:55,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21291/203307 [24:11:09<206:45:54,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21291/203307 [24:11:09<206:45:54,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21292/203307 [24:11:13<206:45:47,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21292/203307 [24:11:13<206:45:47,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21293/203307 [24:11:17<206:45:46,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21293/203307 [24:11:17<206:45:46,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21294/203307 [24:11:21<206:45:38,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21294/203307 [24:11:21<206:45:38,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21295/203307 [24:11:25<206:45:30,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21295/203307 [24:11:25<206:45:30,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21296/203307 [24:11:29<206:45:29,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21296/203307 [24:11:29<206:45:29,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21297/203307 [24:11:33<206:45:26,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21297/203307 [24:11:33<206:45:26,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21298/203307 [24:11:37<206:45:19,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21298/203307 [24:11:37<206:45:19,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21299/203307 [24:11:41<206:45:17,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21299/203307 [24:11:41<206:45:17,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21300/203307 [24:11:46<206:45:16,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21300/203307 [24:11:46<206:45:16,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21301/203307 [24:11:50<206:45:13,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  10%|█         | 21301/203307 [24:11:50<206:45:13,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21302/203307 [24:11:54<206:45:12,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21302/203307 [24:11:54<206:45:12,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21303/203307 [24:11:58<206:45:04,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21303/203307 [24:11:58<206:45:04,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21304/203307 [24:12:02<206:44:56,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21304/203307 [24:12:02<206:44:56,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21305/203307 [24:12:06<206:44:54,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21305/203307 [24:12:06<206:44:54,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21306/203307 [24:12:10<206:44:47,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21306/203307 [24:12:10<206:44:47,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21307/203307 [24:12:14<206:44:43,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21307/203307 [24:12:14<206:44:43,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21308/203307 [24:12:18<206:44:41,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21308/203307 [24:12:18<206:44:41,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21309/203307 [24:12:23<206:44:40,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21309/203307 [24:12:23<206:44:40,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21310/203307 [24:12:27<206:44:38,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21310/203307 [24:12:27<206:44:38,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21311/203307 [24:12:31<206:44:30,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21311/203307 [24:12:31<206:44:30,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21312/203307 [24:12:34<206:44:23,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21312/203307 [24:12:34<206:44:23,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21313/203307 [24:12:39<206:44:20,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21313/203307 [24:12:39<206:44:20,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21314/203307 [24:12:43<206:44:17,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21314/203307 [24:12:43<206:44:17,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21315/203307 [24:12:47<206:44:10,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21315/203307 [24:12:47<206:44:10,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21316/203307 [24:12:51<206:44:07,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21316/203307 [24:12:51<206:44:07,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21317/203307 [24:12:55<206:44:06,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21317/203307 [24:12:55<206:44:06,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21318/203307 [24:12:59<206:44:04,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21318/203307 [24:12:59<206:44:04,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21319/203307 [24:13:04<206:44:02,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21319/203307 [24:13:04<206:44:02,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21320/203307 [24:13:08<206:43:54,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21320/203307 [24:13:08<206:43:54,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21321/203307 [24:13:11<206:43:47,  0.24it/s, v_num=t5e6, training/loss=0.0772]Epoch 0:  10%|█         | 21321/203307 [24:13:11<206:43:47,  0.24it/s, v_num=t5e6, training/loss=0.090] Epoch 0:  10%|█         | 21322/203307 [24:13:15<206:43:44,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21322/203307 [24:13:15<206:43:44,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21323/203307 [24:13:20<206:43:41,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21323/203307 [24:13:20<206:43:41,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21324/203307 [24:13:24<206:43:39,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21324/203307 [24:13:24<206:43:39,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21325/203307 [24:13:28<206:43:32,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21325/203307 [24:13:28<206:43:32,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21326/203307 [24:13:32<206:43:31,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21326/203307 [24:13:32<206:43:31,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21327/203307 [24:13:36<206:43:24,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21327/203307 [24:13:36<206:43:24,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21328/203307 [24:13:40<206:43:23,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21328/203307 [24:13:40<206:43:23,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21329/203307 [24:13:44<206:43:15,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21329/203307 [24:13:44<206:43:15,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21330/203307 [24:13:48<206:43:08,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21330/203307 [24:13:48<206:43:08,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21331/203307 [24:13:52<206:43:05,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21331/203307 [24:13:52<206:43:05,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21332/203307 [24:13:56<206:42:59,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21332/203307 [24:13:56<206:42:59,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21333/203307 [24:14:00<206:42:57,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21333/203307 [24:14:00<206:42:57,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21334/203307 [24:14:04<206:42:54,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21334/203307 [24:14:04<206:42:54,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21335/203307 [24:14:09<206:42:52,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21335/203307 [24:14:09<206:42:52,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21336/203307 [24:14:13<206:42:51,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21336/203307 [24:14:13<206:42:51,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21337/203307 [24:14:17<206:42:44,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21337/203307 [24:14:17<206:42:44,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21338/203307 [24:14:21<206:42:37,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21338/203307 [24:14:21<206:42:37,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21339/203307 [24:14:25<206:42:35,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21339/203307 [24:14:25<206:42:35,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21340/203307 [24:14:29<206:42:32,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21340/203307 [24:14:29<206:42:32,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21341/203307 [24:14:34<206:42:29,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  10%|█         | 21341/203307 [24:14:34<206:42:29,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|█         | 21342/203307 [24:14:37<206:42:22,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|█         | 21342/203307 [24:14:37<206:42:22,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|█         | 21343/203307 [24:14:42<206:42:21,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|█         | 21343/203307 [24:14:42<206:42:21,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|█         | 21344/203307 [24:14:45<206:42:14,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|█         | 21344/203307 [24:14:45<206:42:14,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|█         | 21345/203307 [24:14:50<206:42:13,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|█         | 21345/203307 [24:14:50<206:42:13,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|█         | 21346/203307 [24:14:54<206:42:06,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|█         | 21346/203307 [24:14:54<206:42:06,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|█         | 21347/203307 [24:14:57<206:41:59,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  10%|█         | 21347/203307 [24:14:57<206:41:59,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 21348/203307 [24:15:02<206:41:56,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 21348/203307 [24:15:02<206:41:57,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 21349/203307 [24:15:06<206:41:55,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 21349/203307 [24:15:06<206:41:55,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 21350/203307 [24:15:10<206:41:47,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 21350/203307 [24:15:10<206:41:47,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 21351/203307 [24:15:14<206:41:45,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 21351/203307 [24:15:14<206:41:45,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 21352/203307 [24:15:18<206:41:44,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 21352/203307 [24:15:18<206:41:44,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 21353/203307 [24:15:22<206:41:37,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 21353/203307 [24:15:22<206:41:37,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 21354/203307 [24:15:27<206:41:35,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 21354/203307 [24:15:27<206:41:35,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 21355/203307 [24:15:30<206:41:28,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 21355/203307 [24:15:30<206:41:28,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 21356/203307 [24:15:34<206:41:20,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 21356/203307 [24:15:34<206:41:20,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 21357/203307 [24:15:38<206:41:19,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 21357/203307 [24:15:38<206:41:19,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 21358/203307 [24:15:43<206:41:16,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 21358/203307 [24:15:43<206:41:16,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 21359/203307 [24:15:46<206:41:09,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 21359/203307 [24:15:46<206:41:09,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 21360/203307 [24:15:51<206:41:06,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 21360/203307 [24:15:51<206:41:07,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 21361/203307 [24:15:55<206:41:05,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 21361/203307 [24:15:55<206:41:05,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21362/203307 [24:15:59<206:41:03,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21362/203307 [24:15:59<206:41:03,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21363/203307 [24:16:03<206:40:55,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21363/203307 [24:16:03<206:40:55,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21364/203307 [24:16:07<206:40:48,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21364/203307 [24:16:07<206:40:48,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21365/203307 [24:16:11<206:40:46,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21365/203307 [24:16:11<206:40:46,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21366/203307 [24:16:15<206:40:43,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21366/203307 [24:16:15<206:40:43,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21367/203307 [24:16:19<206:40:36,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21367/203307 [24:16:19<206:40:36,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21368/203307 [24:16:23<206:40:33,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21368/203307 [24:16:23<206:40:33,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21369/203307 [24:16:28<206:40:32,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21369/203307 [24:16:28<206:40:32,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21370/203307 [24:16:32<206:40:29,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21370/203307 [24:16:32<206:40:29,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21371/203307 [24:16:36<206:40:28,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21371/203307 [24:16:36<206:40:28,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21372/203307 [24:16:40<206:40:20,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21372/203307 [24:16:40<206:40:20,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21373/203307 [24:16:44<206:40:12,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21373/203307 [24:16:44<206:40:12,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21374/203307 [24:16:48<206:40:11,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21374/203307 [24:16:48<206:40:11,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21375/203307 [24:16:52<206:40:08,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21375/203307 [24:16:52<206:40:08,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21376/203307 [24:16:56<206:40:05,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21376/203307 [24:16:56<206:40:05,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21377/203307 [24:17:00<206:39:58,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21377/203307 [24:17:00<206:39:58,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21378/203307 [24:17:05<206:39:57,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21378/203307 [24:17:05<206:39:57,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21379/203307 [24:17:08<206:39:49,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21379/203307 [24:17:08<206:39:49,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21380/203307 [24:17:13<206:39:48,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21380/203307 [24:17:13<206:39:48,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21381/203307 [24:17:17<206:39:41,  0.24it/s, v_num=t5e6, training/loss=0.0868]Epoch 0:  11%|█         | 21381/203307 [24:17:17<206:39:41,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21382/203307 [24:17:20<206:39:34,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21382/203307 [24:17:20<206:39:34,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21383/203307 [24:17:25<206:39:33,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21383/203307 [24:17:25<206:39:33,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21384/203307 [24:17:28<206:39:26,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21384/203307 [24:17:28<206:39:26,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21385/203307 [24:17:33<206:39:23,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21385/203307 [24:17:33<206:39:23,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21386/203307 [24:17:37<206:39:17,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21386/203307 [24:17:37<206:39:17,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21387/203307 [24:17:41<206:39:15,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21387/203307 [24:17:41<206:39:15,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21388/203307 [24:17:45<206:39:13,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21388/203307 [24:17:45<206:39:13,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21389/203307 [24:17:49<206:39:06,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21389/203307 [24:17:49<206:39:06,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21390/203307 [24:17:53<206:38:59,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21390/203307 [24:17:53<206:38:59,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21391/203307 [24:17:57<206:38:57,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21391/203307 [24:17:57<206:38:57,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21392/203307 [24:18:01<206:38:54,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21392/203307 [24:18:01<206:38:54,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21393/203307 [24:18:06<206:38:51,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21393/203307 [24:18:06<206:38:51,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21394/203307 [24:18:09<206:38:44,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21394/203307 [24:18:09<206:38:44,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21395/203307 [24:18:14<206:38:42,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21395/203307 [24:18:14<206:38:42,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21396/203307 [24:18:17<206:38:36,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21396/203307 [24:18:17<206:38:36,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21397/203307 [24:18:22<206:38:35,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21397/203307 [24:18:22<206:38:35,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21398/203307 [24:18:26<206:38:28,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21398/203307 [24:18:26<206:38:28,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21399/203307 [24:18:30<206:38:26,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21399/203307 [24:18:30<206:38:26,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21400/203307 [24:18:34<206:38:24,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21400/203307 [24:18:34<206:38:24,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21401/203307 [24:18:39<206:38:22,  0.24it/s, v_num=t5e6, training/loss=0.0957]Epoch 0:  11%|█         | 21401/203307 [24:18:39<206:38:22,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21402/203307 [24:18:42<206:38:15,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21402/203307 [24:18:42<206:38:15,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21403/203307 [24:18:46<206:38:08,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21403/203307 [24:18:46<206:38:08,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21404/203307 [24:18:51<206:38:08,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21404/203307 [24:18:51<206:38:08,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21405/203307 [24:18:55<206:38:04,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21405/203307 [24:18:55<206:38:04,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21406/203307 [24:18:59<206:38:02,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21406/203307 [24:18:59<206:38:02,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21407/203307 [24:19:03<206:37:55,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21407/203307 [24:19:03<206:37:55,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21408/203307 [24:19:07<206:37:52,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21408/203307 [24:19:07<206:37:52,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21409/203307 [24:19:11<206:37:49,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21409/203307 [24:19:11<206:37:49,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21410/203307 [24:19:16<206:37:47,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21410/203307 [24:19:16<206:37:47,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21411/203307 [24:19:19<206:37:39,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21411/203307 [24:19:19<206:37:39,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21412/203307 [24:19:23<206:37:33,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21412/203307 [24:19:23<206:37:33,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21413/203307 [24:19:28<206:37:32,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21413/203307 [24:19:28<206:37:32,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21414/203307 [24:19:32<206:37:31,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21414/203307 [24:19:32<206:37:31,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21415/203307 [24:19:36<206:37:28,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21415/203307 [24:19:36<206:37:28,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21416/203307 [24:19:41<206:37:26,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21416/203307 [24:19:41<206:37:26,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21417/203307 [24:19:45<206:37:23,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21417/203307 [24:19:45<206:37:23,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21418/203307 [24:19:49<206:37:21,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21418/203307 [24:19:49<206:37:21,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21419/203307 [24:19:53<206:37:14,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21419/203307 [24:19:53<206:37:14,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21420/203307 [24:19:57<206:37:07,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21420/203307 [24:19:57<206:37:07,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21421/203307 [24:20:01<206:37:05,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  11%|█         | 21421/203307 [24:20:01<206:37:06,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21422/203307 [24:20:05<206:36:59,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21422/203307 [24:20:05<206:36:59,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21423/203307 [24:20:09<206:36:58,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21423/203307 [24:20:09<206:36:58,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21424/203307 [24:20:14<206:36:55,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21424/203307 [24:20:14<206:36:55,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21425/203307 [24:20:17<206:36:48,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21425/203307 [24:20:17<206:36:48,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21426/203307 [24:20:22<206:36:46,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21426/203307 [24:20:22<206:36:46,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21427/203307 [24:20:26<206:36:43,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21427/203307 [24:20:26<206:36:43,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21428/203307 [24:20:29<206:36:35,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21428/203307 [24:20:29<206:36:35,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21429/203307 [24:20:33<206:36:27,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21429/203307 [24:20:33<206:36:27,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21430/203307 [24:20:38<206:36:26,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21430/203307 [24:20:38<206:36:26,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21431/203307 [24:20:41<206:36:19,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21431/203307 [24:20:41<206:36:19,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21432/203307 [24:20:46<206:36:17,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21432/203307 [24:20:46<206:36:17,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21433/203307 [24:20:50<206:36:14,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21433/203307 [24:20:50<206:36:14,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21434/203307 [24:20:53<206:36:06,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21434/203307 [24:20:53<206:36:06,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21435/203307 [24:20:58<206:36:04,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21435/203307 [24:20:58<206:36:04,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21436/203307 [24:21:02<206:35:57,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21436/203307 [24:21:02<206:35:57,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21437/203307 [24:21:05<206:35:49,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21437/203307 [24:21:05<206:35:49,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21438/203307 [24:21:09<206:35:42,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21438/203307 [24:21:09<206:35:42,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21439/203307 [24:21:13<206:35:42,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21439/203307 [24:21:13<206:35:42,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21440/203307 [24:21:18<206:35:40,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21440/203307 [24:21:18<206:35:40,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21441/203307 [24:21:22<206:35:38,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  11%|█         | 21441/203307 [24:21:22<206:35:38,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21442/203307 [24:21:26<206:35:34,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21442/203307 [24:21:26<206:35:35,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21443/203307 [24:21:31<206:35:33,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21443/203307 [24:21:31<206:35:33,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21444/203307 [24:21:35<206:35:30,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21444/203307 [24:21:35<206:35:30,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21445/203307 [24:21:39<206:35:22,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21445/203307 [24:21:39<206:35:22,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21446/203307 [24:21:42<206:35:15,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21446/203307 [24:21:42<206:35:15,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21447/203307 [24:21:47<206:35:13,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21447/203307 [24:21:47<206:35:13,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21448/203307 [24:21:50<206:35:06,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21448/203307 [24:21:50<206:35:06,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21449/203307 [24:21:55<206:35:06,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21449/203307 [24:21:55<206:35:06,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21450/203307 [24:21:59<206:34:59,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21450/203307 [24:21:59<206:34:59,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21451/203307 [24:22:03<206:34:56,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21451/203307 [24:22:03<206:34:56,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21452/203307 [24:22:07<206:34:53,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21452/203307 [24:22:07<206:34:53,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21453/203307 [24:22:11<206:34:49,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21453/203307 [24:22:11<206:34:49,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21454/203307 [24:22:15<206:34:41,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21454/203307 [24:22:15<206:34:41,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21455/203307 [24:22:19<206:34:35,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21455/203307 [24:22:19<206:34:35,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21456/203307 [24:22:23<206:34:34,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21456/203307 [24:22:23<206:34:34,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21457/203307 [24:22:27<206:34:27,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21457/203307 [24:22:27<206:34:27,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21458/203307 [24:22:31<206:34:25,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21458/203307 [24:22:31<206:34:25,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21459/203307 [24:22:35<206:34:22,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21459/203307 [24:22:35<206:34:22,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21460/203307 [24:22:40<206:34:18,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21460/203307 [24:22:40<206:34:18,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21461/203307 [24:22:44<206:34:16,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  11%|█         | 21461/203307 [24:22:44<206:34:16,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21462/203307 [24:22:48<206:34:08,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21462/203307 [24:22:48<206:34:08,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21463/203307 [24:22:51<206:34:00,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21463/203307 [24:22:51<206:34:00,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21464/203307 [24:22:55<206:33:52,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21464/203307 [24:22:55<206:33:52,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21465/203307 [24:22:59<206:33:51,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21465/203307 [24:22:59<206:33:51,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21466/203307 [24:23:04<206:33:49,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21466/203307 [24:23:04<206:33:49,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21467/203307 [24:23:07<206:33:42,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21467/203307 [24:23:07<206:33:42,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21468/203307 [24:23:12<206:33:39,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21468/203307 [24:23:12<206:33:39,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21469/203307 [24:23:16<206:33:37,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21469/203307 [24:23:16<206:33:37,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21470/203307 [24:23:20<206:33:34,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21470/203307 [24:23:20<206:33:34,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21471/203307 [24:23:24<206:33:27,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21471/203307 [24:23:24<206:33:27,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21472/203307 [24:23:28<206:33:20,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21472/203307 [24:23:28<206:33:20,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21473/203307 [24:23:32<206:33:18,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21473/203307 [24:23:32<206:33:18,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21474/203307 [24:23:36<206:33:17,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21474/203307 [24:23:36<206:33:17,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21475/203307 [24:23:41<206:33:16,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21475/203307 [24:23:41<206:33:16,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21476/203307 [24:23:45<206:33:12,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21476/203307 [24:23:45<206:33:12,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21477/203307 [24:23:49<206:33:04,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21477/203307 [24:23:49<206:33:04,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21478/203307 [24:23:53<206:33:02,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21478/203307 [24:23:53<206:33:02,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21479/203307 [24:23:57<206:32:59,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21479/203307 [24:23:57<206:32:59,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21480/203307 [24:24:01<206:32:51,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21480/203307 [24:24:01<206:32:51,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21481/203307 [24:24:04<206:32:44,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  11%|█         | 21481/203307 [24:24:04<206:32:44,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21482/203307 [24:24:09<206:32:43,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21482/203307 [24:24:09<206:32:43,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21483/203307 [24:24:13<206:32:41,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21483/203307 [24:24:13<206:32:41,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21484/203307 [24:24:18<206:32:39,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21484/203307 [24:24:18<206:32:39,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21485/203307 [24:24:22<206:32:37,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21485/203307 [24:24:22<206:32:37,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21486/203307 [24:24:26<206:32:33,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21486/203307 [24:24:26<206:32:33,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21487/203307 [24:24:30<206:32:31,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21487/203307 [24:24:30<206:32:31,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21488/203307 [24:24:34<206:32:24,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21488/203307 [24:24:34<206:32:24,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21489/203307 [24:24:38<206:32:17,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21489/203307 [24:24:38<206:32:17,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21490/203307 [24:24:42<206:32:11,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21490/203307 [24:24:42<206:32:11,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21491/203307 [24:24:46<206:32:11,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21491/203307 [24:24:46<206:32:11,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21492/203307 [24:24:51<206:32:10,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21492/203307 [24:24:51<206:32:10,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21493/203307 [24:24:55<206:32:08,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21493/203307 [24:24:55<206:32:08,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21494/203307 [24:24:59<206:32:02,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21494/203307 [24:24:59<206:32:02,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21495/203307 [24:25:03<206:32:00,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21495/203307 [24:25:03<206:32:01,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21496/203307 [24:25:08<206:31:58,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21496/203307 [24:25:08<206:31:58,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21497/203307 [24:25:11<206:31:51,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21497/203307 [24:25:11<206:31:51,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21498/203307 [24:25:15<206:31:44,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21498/203307 [24:25:15<206:31:44,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21499/203307 [24:25:20<206:31:43,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21499/203307 [24:25:20<206:31:43,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21500/203307 [24:25:23<206:31:36,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21500/203307 [24:25:23<206:31:36,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21501/203307 [24:25:28<206:31:37,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  11%|█         | 21501/203307 [24:25:28<206:31:37,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21502/203307 [24:25:32<206:31:30,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21502/203307 [24:25:32<206:31:30,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21503/203307 [24:25:36<206:31:23,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21503/203307 [24:25:36<206:31:23,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21504/203307 [24:25:40<206:31:22,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21504/203307 [24:25:40<206:31:22,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21505/203307 [24:25:44<206:31:20,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21505/203307 [24:25:44<206:31:20,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21506/203307 [24:25:48<206:31:13,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21506/203307 [24:25:48<206:31:13,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21507/203307 [24:25:52<206:31:07,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21507/203307 [24:25:52<206:31:07,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21508/203307 [24:25:56<206:31:06,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21508/203307 [24:25:56<206:31:06,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21509/203307 [24:26:00<206:31:00,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21509/203307 [24:26:00<206:31:00,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21510/203307 [24:26:05<206:30:59,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21510/203307 [24:26:05<206:30:59,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21511/203307 [24:26:08<206:30:52,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21511/203307 [24:26:08<206:30:52,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21512/203307 [24:26:12<206:30:46,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21512/203307 [24:26:12<206:30:46,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21513/203307 [24:26:17<206:30:44,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21513/203307 [24:26:17<206:30:44,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21514/203307 [24:26:21<206:30:38,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21514/203307 [24:26:21<206:30:38,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21515/203307 [24:26:24<206:30:31,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21515/203307 [24:26:24<206:30:31,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21516/203307 [24:26:29<206:30:29,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21516/203307 [24:26:29<206:30:29,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21517/203307 [24:26:33<206:30:28,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21517/203307 [24:26:33<206:30:28,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21518/203307 [24:26:37<206:30:27,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21518/203307 [24:26:37<206:30:27,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21519/203307 [24:26:41<206:30:20,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21519/203307 [24:26:41<206:30:20,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21520/203307 [24:26:45<206:30:13,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21520/203307 [24:26:45<206:30:13,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21521/203307 [24:26:49<206:30:11,  0.24it/s, v_num=t5e6, training/loss=0.0834]Epoch 0:  11%|█         | 21521/203307 [24:26:49<206:30:11,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21522/203307 [24:26:54<206:30:08,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21522/203307 [24:26:54<206:30:08,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21523/203307 [24:26:58<206:30:05,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21523/203307 [24:26:58<206:30:05,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21524/203307 [24:27:02<206:30:01,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21524/203307 [24:27:02<206:30:01,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21525/203307 [24:27:06<206:29:59,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21525/203307 [24:27:06<206:29:59,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21526/203307 [24:27:11<206:29:57,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21526/203307 [24:27:11<206:29:57,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21527/203307 [24:27:15<206:29:55,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21527/203307 [24:27:15<206:29:55,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21528/203307 [24:27:19<206:29:48,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21528/203307 [24:27:19<206:29:48,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21529/203307 [24:27:22<206:29:40,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21529/203307 [24:27:22<206:29:40,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21530/203307 [24:27:27<206:29:38,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21530/203307 [24:27:27<206:29:38,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21531/203307 [24:27:31<206:29:36,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21531/203307 [24:27:31<206:29:36,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21532/203307 [24:27:35<206:29:32,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21532/203307 [24:27:35<206:29:32,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21533/203307 [24:27:39<206:29:29,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21533/203307 [24:27:39<206:29:29,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21534/203307 [24:27:44<206:29:28,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21534/203307 [24:27:44<206:29:28,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21535/203307 [24:27:48<206:29:25,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21535/203307 [24:27:48<206:29:25,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21536/203307 [24:27:52<206:29:24,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21536/203307 [24:27:52<206:29:24,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21537/203307 [24:27:56<206:29:16,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21537/203307 [24:27:56<206:29:16,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21538/203307 [24:28:00<206:29:09,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21538/203307 [24:28:00<206:29:09,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21539/203307 [24:28:04<206:29:07,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21539/203307 [24:28:04<206:29:07,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21540/203307 [24:28:08<206:29:03,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21540/203307 [24:28:08<206:29:03,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21541/203307 [24:28:12<206:29:00,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  11%|█         | 21541/203307 [24:28:12<206:29:00,  0.24it/s, v_num=t5e6, training/loss=0.088] Epoch 0:  11%|█         | 21542/203307 [24:28:16<206:28:53,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21542/203307 [24:28:16<206:28:53,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21543/203307 [24:28:21<206:28:52,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21543/203307 [24:28:21<206:28:52,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21544/203307 [24:28:25<206:28:50,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21544/203307 [24:28:25<206:28:50,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21545/203307 [24:28:29<206:28:43,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21545/203307 [24:28:29<206:28:43,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21546/203307 [24:28:32<206:28:36,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21546/203307 [24:28:32<206:28:36,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21547/203307 [24:28:37<206:28:33,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21547/203307 [24:28:37<206:28:33,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21548/203307 [24:28:41<206:28:30,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21548/203307 [24:28:41<206:28:30,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21549/203307 [24:28:45<206:28:27,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21549/203307 [24:28:45<206:28:27,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21550/203307 [24:28:49<206:28:23,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21550/203307 [24:28:49<206:28:23,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21551/203307 [24:28:54<206:28:21,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21551/203307 [24:28:54<206:28:21,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21552/203307 [24:28:57<206:28:13,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21552/203307 [24:28:57<206:28:13,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21553/203307 [24:29:02<206:28:11,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21553/203307 [24:29:02<206:28:11,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21554/203307 [24:29:05<206:28:04,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21554/203307 [24:29:05<206:28:04,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21555/203307 [24:29:09<206:27:56,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21555/203307 [24:29:09<206:27:56,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21556/203307 [24:29:13<206:27:54,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21556/203307 [24:29:13<206:27:54,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21557/203307 [24:29:17<206:27:52,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21557/203307 [24:29:17<206:27:52,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21558/203307 [24:29:22<206:27:48,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21558/203307 [24:29:22<206:27:48,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21559/203307 [24:29:26<206:27:45,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21559/203307 [24:29:26<206:27:45,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21560/203307 [24:29:30<206:27:44,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21560/203307 [24:29:30<206:27:44,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21561/203307 [24:29:34<206:27:36,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█         | 21561/203307 [24:29:34<206:27:36,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21562/203307 [24:29:38<206:27:35,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21562/203307 [24:29:38<206:27:35,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21563/203307 [24:29:42<206:27:27,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21563/203307 [24:29:42<206:27:27,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21564/203307 [24:29:46<206:27:19,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21564/203307 [24:29:46<206:27:19,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21565/203307 [24:29:50<206:27:17,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21565/203307 [24:29:50<206:27:17,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21566/203307 [24:29:54<206:27:15,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21566/203307 [24:29:54<206:27:15,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21567/203307 [24:29:58<206:27:11,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21567/203307 [24:29:58<206:27:11,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21568/203307 [24:30:03<206:27:08,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21568/203307 [24:30:03<206:27:08,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21569/203307 [24:30:07<206:27:06,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21569/203307 [24:30:07<206:27:06,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21570/203307 [24:30:11<206:27:04,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21570/203307 [24:30:11<206:27:04,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21571/203307 [24:30:15<206:26:56,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21571/203307 [24:30:15<206:26:56,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21572/203307 [24:30:19<206:26:49,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21572/203307 [24:30:19<206:26:49,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21573/203307 [24:30:23<206:26:47,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21573/203307 [24:30:23<206:26:47,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21574/203307 [24:30:27<206:26:45,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21574/203307 [24:30:27<206:26:45,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21575/203307 [24:30:31<206:26:38,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21575/203307 [24:30:31<206:26:38,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21576/203307 [24:30:35<206:26:35,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21576/203307 [24:30:35<206:26:35,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21577/203307 [24:30:40<206:26:34,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21577/203307 [24:30:40<206:26:34,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21578/203307 [24:30:43<206:26:26,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21578/203307 [24:30:43<206:26:27,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21579/203307 [24:30:48<206:26:25,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21579/203307 [24:30:48<206:26:25,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21580/203307 [24:30:51<206:26:17,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21580/203307 [24:30:52<206:26:17,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21581/203307 [24:30:55<206:26:10,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  11%|█         | 21581/203307 [24:30:55<206:26:10,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21582/203307 [24:30:59<206:26:07,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21582/203307 [24:30:59<206:26:07,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21583/203307 [24:31:04<206:26:04,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21583/203307 [24:31:04<206:26:05,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21584/203307 [24:31:07<206:25:57,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21584/203307 [24:31:07<206:25:57,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21585/203307 [24:31:12<206:25:54,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21585/203307 [24:31:12<206:25:54,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21586/203307 [24:31:16<206:25:52,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21586/203307 [24:31:16<206:25:52,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21587/203307 [24:31:20<206:25:45,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21587/203307 [24:31:20<206:25:45,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21588/203307 [24:31:24<206:25:43,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21588/203307 [24:31:24<206:25:43,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21589/203307 [24:31:28<206:25:36,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21589/203307 [24:31:28<206:25:36,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21590/203307 [24:31:32<206:25:29,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21590/203307 [24:31:32<206:25:29,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21591/203307 [24:31:36<206:25:27,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21591/203307 [24:31:36<206:25:27,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21592/203307 [24:31:40<206:25:20,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21592/203307 [24:31:40<206:25:20,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21593/203307 [24:31:44<206:25:17,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21593/203307 [24:31:44<206:25:17,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21594/203307 [24:31:48<206:25:13,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21594/203307 [24:31:48<206:25:13,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21595/203307 [24:31:52<206:25:11,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21595/203307 [24:31:52<206:25:11,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21596/203307 [24:31:57<206:25:10,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21596/203307 [24:31:57<206:25:10,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21597/203307 [24:32:00<206:25:03,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21597/203307 [24:32:00<206:25:03,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21598/203307 [24:32:04<206:24:55,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21598/203307 [24:32:04<206:24:55,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21599/203307 [24:32:08<206:24:53,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21599/203307 [24:32:08<206:24:53,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21600/203307 [24:32:13<206:24:50,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21600/203307 [24:32:13<206:24:50,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21601/203307 [24:32:17<206:24:47,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 21601/203307 [24:32:17<206:24:47,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21602/203307 [24:32:21<206:24:41,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21602/203307 [24:32:21<206:24:41,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21603/203307 [24:32:25<206:24:40,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21603/203307 [24:32:25<206:24:40,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21604/203307 [24:32:29<206:24:36,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21604/203307 [24:32:29<206:24:36,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21605/203307 [24:32:34<206:24:35,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21605/203307 [24:32:34<206:24:35,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21606/203307 [24:32:38<206:24:28,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21606/203307 [24:32:38<206:24:28,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21607/203307 [24:32:41<206:24:21,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21607/203307 [24:32:41<206:24:21,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21608/203307 [24:32:46<206:24:20,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21608/203307 [24:32:46<206:24:20,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21609/203307 [24:32:50<206:24:17,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21609/203307 [24:32:50<206:24:17,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21610/203307 [24:32:54<206:24:14,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21610/203307 [24:32:54<206:24:14,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21611/203307 [24:32:58<206:24:07,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21611/203307 [24:32:58<206:24:07,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21612/203307 [24:33:02<206:24:06,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21612/203307 [24:33:02<206:24:06,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21613/203307 [24:33:07<206:24:03,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21613/203307 [24:33:07<206:24:03,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21614/203307 [24:33:11<206:24:01,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21614/203307 [24:33:11<206:24:01,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21615/203307 [24:33:15<206:23:53,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21615/203307 [24:33:15<206:23:53,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21616/203307 [24:33:19<206:23:51,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21616/203307 [24:33:19<206:23:51,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21617/203307 [24:33:23<206:23:49,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21617/203307 [24:33:23<206:23:49,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21618/203307 [24:33:27<206:23:47,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21618/203307 [24:33:28<206:23:47,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21619/203307 [24:33:31<206:23:40,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21619/203307 [24:33:31<206:23:40,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21620/203307 [24:33:35<206:23:33,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21620/203307 [24:33:35<206:23:33,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21621/203307 [24:33:39<206:23:32,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  11%|█         | 21621/203307 [24:33:39<206:23:32,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21622/203307 [24:33:44<206:23:31,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21622/203307 [24:33:44<206:23:32,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21623/203307 [24:33:48<206:23:25,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21623/203307 [24:33:48<206:23:25,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21624/203307 [24:33:52<206:23:22,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21624/203307 [24:33:52<206:23:22,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21625/203307 [24:33:56<206:23:21,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21625/203307 [24:33:56<206:23:21,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21626/203307 [24:34:01<206:23:19,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21626/203307 [24:34:01<206:23:19,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21627/203307 [24:34:04<206:23:11,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21627/203307 [24:34:04<206:23:11,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21628/203307 [24:34:08<206:23:04,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21628/203307 [24:34:08<206:23:04,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21629/203307 [24:34:13<206:23:03,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21629/203307 [24:34:13<206:23:03,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21630/203307 [24:34:16<206:22:56,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21630/203307 [24:34:16<206:22:56,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21631/203307 [24:34:21<206:22:56,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21631/203307 [24:34:21<206:22:56,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21632/203307 [24:34:25<206:22:48,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21632/203307 [24:34:25<206:22:48,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21633/203307 [24:34:29<206:22:45,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21633/203307 [24:34:29<206:22:45,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21634/203307 [24:34:33<206:22:43,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21634/203307 [24:34:33<206:22:43,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21635/203307 [24:34:37<206:22:41,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21635/203307 [24:34:37<206:22:41,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21636/203307 [24:34:41<206:22:33,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21636/203307 [24:34:41<206:22:33,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21637/203307 [24:34:45<206:22:30,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21637/203307 [24:34:45<206:22:30,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21638/203307 [24:34:50<206:22:28,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21638/203307 [24:34:50<206:22:28,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21639/203307 [24:34:53<206:22:21,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21639/203307 [24:34:53<206:22:21,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21640/203307 [24:34:58<206:22:20,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21640/203307 [24:34:58<206:22:20,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21641/203307 [24:35:02<206:22:17,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  11%|█         | 21641/203307 [24:35:02<206:22:17,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21642/203307 [24:35:06<206:22:09,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21642/203307 [24:35:06<206:22:09,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21643/203307 [24:35:10<206:22:07,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21643/203307 [24:35:10<206:22:07,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21644/203307 [24:35:14<206:22:00,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21644/203307 [24:35:14<206:22:00,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21645/203307 [24:35:18<206:21:54,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21645/203307 [24:35:18<206:21:54,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21646/203307 [24:35:21<206:21:47,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21646/203307 [24:35:21<206:21:47,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21647/203307 [24:35:26<206:21:45,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21647/203307 [24:35:26<206:21:45,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21648/203307 [24:35:30<206:21:43,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21648/203307 [24:35:30<206:21:43,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21649/203307 [24:35:34<206:21:39,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21649/203307 [24:35:34<206:21:40,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21650/203307 [24:35:38<206:21:32,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21650/203307 [24:35:38<206:21:32,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21651/203307 [24:35:42<206:21:29,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21651/203307 [24:35:42<206:21:29,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21652/203307 [24:35:46<206:21:26,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21652/203307 [24:35:46<206:21:26,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21653/203307 [24:35:50<206:21:18,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21653/203307 [24:35:50<206:21:18,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21654/203307 [24:35:54<206:21:10,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21654/203307 [24:35:54<206:21:10,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21655/203307 [24:35:58<206:21:09,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21655/203307 [24:35:58<206:21:09,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21656/203307 [24:36:02<206:21:01,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21656/203307 [24:36:02<206:21:01,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21657/203307 [24:36:06<206:20:59,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21657/203307 [24:36:06<206:20:59,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21658/203307 [24:36:10<206:20:56,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21658/203307 [24:36:10<206:20:56,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21659/203307 [24:36:14<206:20:48,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21659/203307 [24:36:14<206:20:48,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21660/203307 [24:36:18<206:20:46,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21660/203307 [24:36:18<206:20:47,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21661/203307 [24:36:23<206:20:44,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  11%|█         | 21661/203307 [24:36:23<206:20:44,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21662/203307 [24:36:26<206:20:37,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21662/203307 [24:36:26<206:20:37,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21663/203307 [24:36:30<206:20:30,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21663/203307 [24:36:30<206:20:30,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21664/203307 [24:36:35<206:20:30,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21664/203307 [24:36:35<206:20:30,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21665/203307 [24:36:38<206:20:22,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21665/203307 [24:36:38<206:20:22,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21666/203307 [24:36:43<206:20:22,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21666/203307 [24:36:43<206:20:22,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21667/203307 [24:36:47<206:20:18,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21667/203307 [24:36:47<206:20:18,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21668/203307 [24:36:51<206:20:15,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21668/203307 [24:36:51<206:20:15,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21669/203307 [24:36:55<206:20:12,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21669/203307 [24:36:55<206:20:12,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21670/203307 [24:36:59<206:20:06,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21670/203307 [24:36:59<206:20:06,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21671/203307 [24:37:03<206:19:58,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21671/203307 [24:37:03<206:19:59,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21672/203307 [24:37:07<206:19:51,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21672/203307 [24:37:07<206:19:52,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21673/203307 [24:37:11<206:19:51,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21673/203307 [24:37:11<206:19:51,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21674/203307 [24:37:15<206:19:49,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21674/203307 [24:37:15<206:19:49,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21675/203307 [24:37:20<206:19:45,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21675/203307 [24:37:20<206:19:45,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21676/203307 [24:37:24<206:19:42,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21676/203307 [24:37:24<206:19:42,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21677/203307 [24:37:28<206:19:39,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21677/203307 [24:37:28<206:19:39,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21678/203307 [24:37:32<206:19:36,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21678/203307 [24:37:32<206:19:36,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21679/203307 [24:37:36<206:19:29,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21679/203307 [24:37:36<206:19:29,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21680/203307 [24:37:40<206:19:22,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21680/203307 [24:37:40<206:19:22,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21681/203307 [24:37:44<206:19:20,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  11%|█         | 21681/203307 [24:37:44<206:19:20,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21682/203307 [24:37:48<206:19:13,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21682/203307 [24:37:48<206:19:13,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21683/203307 [24:37:52<206:19:11,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21683/203307 [24:37:52<206:19:11,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21684/203307 [24:37:56<206:19:04,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21684/203307 [24:37:56<206:19:04,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21685/203307 [24:38:00<206:19:01,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21685/203307 [24:38:00<206:19:01,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21686/203307 [24:38:04<206:18:58,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21686/203307 [24:38:04<206:18:58,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21687/203307 [24:38:09<206:18:55,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21687/203307 [24:38:09<206:18:55,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21688/203307 [24:38:12<206:18:48,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21688/203307 [24:38:12<206:18:48,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21689/203307 [24:38:16<206:18:41,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21689/203307 [24:38:16<206:18:41,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21690/203307 [24:38:20<206:18:40,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21690/203307 [24:38:20<206:18:40,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21691/203307 [24:38:25<206:18:38,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21691/203307 [24:38:25<206:18:38,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21692/203307 [24:38:29<206:18:37,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21692/203307 [24:38:29<206:18:37,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21693/203307 [24:38:34<206:18:34,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21693/203307 [24:38:34<206:18:34,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21694/203307 [24:38:38<206:18:30,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21694/203307 [24:38:38<206:18:30,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21695/203307 [24:38:42<206:18:28,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21695/203307 [24:38:42<206:18:28,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21696/203307 [24:38:46<206:18:22,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21696/203307 [24:38:46<206:18:22,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21697/203307 [24:38:50<206:18:15,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21697/203307 [24:38:50<206:18:15,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21698/203307 [24:38:53<206:18:08,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21698/203307 [24:38:53<206:18:08,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21699/203307 [24:38:58<206:18:08,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21699/203307 [24:38:58<206:18:08,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21700/203307 [24:39:02<206:18:07,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21700/203307 [24:39:02<206:18:07,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21701/203307 [24:39:07<206:18:04,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  11%|█         | 21701/203307 [24:39:07<206:18:04,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21702/203307 [24:39:11<206:18:00,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21702/203307 [24:39:11<206:18:00,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21703/203307 [24:39:15<206:17:58,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21703/203307 [24:39:15<206:17:58,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21704/203307 [24:39:19<206:17:55,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21704/203307 [24:39:19<206:17:55,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21705/203307 [24:39:23<206:17:47,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21705/203307 [24:39:23<206:17:47,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21706/203307 [24:39:27<206:17:40,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21706/203307 [24:39:27<206:17:40,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21707/203307 [24:39:31<206:17:38,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21707/203307 [24:39:31<206:17:38,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21708/203307 [24:39:35<206:17:36,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21708/203307 [24:39:35<206:17:36,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21709/203307 [24:39:40<206:17:36,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21709/203307 [24:39:40<206:17:36,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21710/203307 [24:39:44<206:17:33,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21710/203307 [24:39:44<206:17:33,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21711/203307 [24:39:48<206:17:25,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21711/203307 [24:39:48<206:17:25,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21712/203307 [24:39:52<206:17:22,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21712/203307 [24:39:52<206:17:22,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21713/203307 [24:39:56<206:17:19,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21713/203307 [24:39:56<206:17:19,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21714/203307 [24:40:00<206:17:12,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21714/203307 [24:40:00<206:17:13,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21715/203307 [24:40:04<206:17:05,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21715/203307 [24:40:04<206:17:05,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21716/203307 [24:40:08<206:17:04,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21716/203307 [24:40:08<206:17:04,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21717/203307 [24:40:12<206:16:57,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21717/203307 [24:40:12<206:16:57,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21718/203307 [24:40:16<206:16:56,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21718/203307 [24:40:16<206:16:56,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21719/203307 [24:40:20<206:16:49,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21719/203307 [24:40:20<206:16:49,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21720/203307 [24:40:24<206:16:41,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21720/203307 [24:40:24<206:16:41,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21721/203307 [24:40:28<206:16:39,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█         | 21721/203307 [24:40:28<206:16:39,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21722/203307 [24:40:32<206:16:32,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21722/203307 [24:40:32<206:16:32,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21723/203307 [24:40:35<206:16:25,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21723/203307 [24:40:35<206:16:25,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21724/203307 [24:40:40<206:16:22,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21724/203307 [24:40:40<206:16:22,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21725/203307 [24:40:44<206:16:20,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21725/203307 [24:40:44<206:16:20,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21726/203307 [24:40:48<206:16:18,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21726/203307 [24:40:48<206:16:18,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21727/203307 [24:40:52<206:16:11,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21727/203307 [24:40:52<206:16:11,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21728/203307 [24:40:56<206:16:04,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21728/203307 [24:40:56<206:16:04,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21729/203307 [24:41:00<206:16:02,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21729/203307 [24:41:00<206:16:02,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21730/203307 [24:41:04<206:15:59,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21730/203307 [24:41:04<206:15:59,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21731/203307 [24:41:08<206:15:52,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21731/203307 [24:41:08<206:15:52,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21732/203307 [24:41:12<206:15:44,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21732/203307 [24:41:12<206:15:44,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21733/203307 [24:41:16<206:15:43,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21733/203307 [24:41:16<206:15:43,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21734/203307 [24:41:20<206:15:36,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21734/203307 [24:41:20<206:15:36,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21735/203307 [24:41:24<206:15:35,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21735/203307 [24:41:24<206:15:35,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21736/203307 [24:41:28<206:15:27,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21736/203307 [24:41:28<206:15:27,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21737/203307 [24:41:32<206:15:19,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21737/203307 [24:41:32<206:15:19,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21738/203307 [24:41:36<206:15:16,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21738/203307 [24:41:36<206:15:16,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21739/203307 [24:41:40<206:15:13,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21739/203307 [24:41:40<206:15:13,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21740/203307 [24:41:44<206:15:06,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21740/203307 [24:41:44<206:15:06,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21741/203307 [24:41:48<206:15:04,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  11%|█         | 21741/203307 [24:41:48<206:15:04,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21742/203307 [24:41:53<206:15:03,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21742/203307 [24:41:53<206:15:03,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21743/203307 [24:41:57<206:14:59,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21743/203307 [24:41:57<206:14:59,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21744/203307 [24:42:01<206:14:57,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21744/203307 [24:42:01<206:14:58,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21745/203307 [24:42:05<206:14:50,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21745/203307 [24:42:05<206:14:50,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21746/203307 [24:42:08<206:14:42,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21746/203307 [24:42:08<206:14:42,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21747/203307 [24:42:13<206:14:40,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21747/203307 [24:42:13<206:14:40,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21748/203307 [24:42:17<206:14:37,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21748/203307 [24:42:17<206:14:37,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21749/203307 [24:42:21<206:14:34,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21749/203307 [24:42:21<206:14:34,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21750/203307 [24:42:25<206:14:27,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21750/203307 [24:42:25<206:14:27,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21751/203307 [24:42:29<206:14:26,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21751/203307 [24:42:29<206:14:26,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21752/203307 [24:42:34<206:14:25,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21752/203307 [24:42:34<206:14:25,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21753/203307 [24:42:38<206:14:19,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21753/203307 [24:42:38<206:14:19,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21754/203307 [24:42:42<206:14:13,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21754/203307 [24:42:42<206:14:13,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21755/203307 [24:42:46<206:14:10,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21755/203307 [24:42:46<206:14:10,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21756/203307 [24:42:50<206:14:08,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21756/203307 [24:42:50<206:14:08,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21757/203307 [24:42:54<206:14:01,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21757/203307 [24:42:54<206:14:01,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21758/203307 [24:42:58<206:13:58,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21758/203307 [24:42:58<206:13:58,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21759/203307 [24:43:03<206:13:57,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21759/203307 [24:43:03<206:13:57,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21760/203307 [24:43:07<206:13:55,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21760/203307 [24:43:07<206:13:55,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21761/203307 [24:43:11<206:13:54,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 21761/203307 [24:43:11<206:13:54,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21762/203307 [24:43:15<206:13:47,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21762/203307 [24:43:15<206:13:47,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21763/203307 [24:43:19<206:13:40,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21763/203307 [24:43:19<206:13:40,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21764/203307 [24:43:23<206:13:38,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21764/203307 [24:43:23<206:13:38,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21765/203307 [24:43:27<206:13:35,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21765/203307 [24:43:27<206:13:35,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21766/203307 [24:43:32<206:13:31,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21766/203307 [24:43:32<206:13:31,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21767/203307 [24:43:35<206:13:24,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21767/203307 [24:43:35<206:13:24,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21768/203307 [24:43:40<206:13:22,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21768/203307 [24:43:40<206:13:22,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21769/203307 [24:43:43<206:13:15,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21769/203307 [24:43:43<206:13:15,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21770/203307 [24:43:48<206:13:13,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21770/203307 [24:43:48<206:13:13,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21771/203307 [24:43:51<206:13:05,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21771/203307 [24:43:51<206:13:05,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21772/203307 [24:43:55<206:12:57,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21772/203307 [24:43:55<206:12:57,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21773/203307 [24:43:59<206:12:55,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21773/203307 [24:43:59<206:12:55,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21774/203307 [24:44:03<206:12:52,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21774/203307 [24:44:03<206:12:52,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21775/203307 [24:44:08<206:12:49,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21775/203307 [24:44:08<206:12:49,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21776/203307 [24:44:12<206:12:47,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21776/203307 [24:44:12<206:12:47,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21777/203307 [24:44:17<206:12:46,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21777/203307 [24:44:17<206:12:46,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21778/203307 [24:44:21<206:12:44,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21778/203307 [24:44:21<206:12:44,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21779/203307 [24:44:25<206:12:37,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21779/203307 [24:44:25<206:12:37,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21780/203307 [24:44:28<206:12:30,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21780/203307 [24:44:28<206:12:30,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21781/203307 [24:44:33<206:12:28,  0.24it/s, v_num=t5e6, training/loss=0.0747]Epoch 0:  11%|█         | 21781/203307 [24:44:33<206:12:28,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21782/203307 [24:44:37<206:12:25,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21782/203307 [24:44:37<206:12:25,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21783/203307 [24:44:41<206:12:23,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21783/203307 [24:44:41<206:12:23,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21784/203307 [24:44:45<206:12:16,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21784/203307 [24:44:45<206:12:16,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21785/203307 [24:44:49<206:12:15,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21785/203307 [24:44:49<206:12:15,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21786/203307 [24:44:53<206:12:09,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21786/203307 [24:44:53<206:12:09,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21787/203307 [24:44:58<206:12:08,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21787/203307 [24:44:58<206:12:08,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21788/203307 [24:45:01<206:12:01,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21788/203307 [24:45:01<206:12:01,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21789/203307 [24:45:05<206:11:53,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21789/203307 [24:45:05<206:11:53,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21790/203307 [24:45:09<206:11:51,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21790/203307 [24:45:09<206:11:51,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21791/203307 [24:45:14<206:11:48,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21791/203307 [24:45:14<206:11:48,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21792/203307 [24:45:17<206:11:42,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21792/203307 [24:45:17<206:11:42,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21793/203307 [24:45:22<206:11:40,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21793/203307 [24:45:22<206:11:40,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21794/203307 [24:45:26<206:11:39,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21794/203307 [24:45:26<206:11:39,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21795/203307 [24:45:30<206:11:33,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21795/203307 [24:45:30<206:11:33,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21796/203307 [24:45:35<206:11:31,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21796/203307 [24:45:35<206:11:31,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21797/203307 [24:45:38<206:11:24,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21797/203307 [24:45:38<206:11:24,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21798/203307 [24:45:42<206:11:17,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21798/203307 [24:45:42<206:11:17,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21799/203307 [24:45:46<206:11:16,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21799/203307 [24:45:46<206:11:16,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21800/203307 [24:45:50<206:11:09,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21800/203307 [24:45:50<206:11:09,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21801/203307 [24:45:55<206:11:07,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  11%|█         | 21801/203307 [24:45:55<206:11:07,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21802/203307 [24:45:59<206:11:04,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21802/203307 [24:45:59<206:11:04,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21803/203307 [24:46:03<206:11:03,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21803/203307 [24:46:03<206:11:03,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21804/203307 [24:46:08<206:11:01,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21804/203307 [24:46:08<206:11:01,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21805/203307 [24:46:11<206:10:55,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21805/203307 [24:46:11<206:10:55,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21806/203307 [24:46:15<206:10:47,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21806/203307 [24:46:15<206:10:47,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21807/203307 [24:46:19<206:10:45,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21807/203307 [24:46:19<206:10:45,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21808/203307 [24:46:24<206:10:44,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21808/203307 [24:46:24<206:10:44,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21809/203307 [24:46:28<206:10:37,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21809/203307 [24:46:28<206:10:37,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21810/203307 [24:46:32<206:10:34,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21810/203307 [24:46:32<206:10:34,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21811/203307 [24:46:36<206:10:33,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21811/203307 [24:46:36<206:10:33,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21812/203307 [24:46:40<206:10:27,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21812/203307 [24:46:40<206:10:27,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21813/203307 [24:46:45<206:10:26,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21813/203307 [24:46:45<206:10:26,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21814/203307 [24:46:48<206:10:19,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21814/203307 [24:46:48<206:10:19,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21815/203307 [24:46:52<206:10:12,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21815/203307 [24:46:52<206:10:12,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21816/203307 [24:46:56<206:10:10,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21816/203307 [24:46:56<206:10:10,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21817/203307 [24:47:01<206:10:08,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21817/203307 [24:47:01<206:10:08,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21818/203307 [24:47:05<206:10:04,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21818/203307 [24:47:05<206:10:04,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21819/203307 [24:47:09<206:09:57,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21819/203307 [24:47:09<206:09:58,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21820/203307 [24:47:13<206:09:57,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21820/203307 [24:47:13<206:09:57,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21821/203307 [24:47:17<206:09:50,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  11%|█         | 21821/203307 [24:47:17<206:09:50,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21822/203307 [24:47:21<206:09:50,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21822/203307 [24:47:21<206:09:50,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21823/203307 [24:47:25<206:09:43,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21823/203307 [24:47:25<206:09:43,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21824/203307 [24:47:29<206:09:40,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21824/203307 [24:47:29<206:09:40,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21825/203307 [24:47:34<206:09:38,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21825/203307 [24:47:34<206:09:38,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21826/203307 [24:47:38<206:09:36,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21826/203307 [24:47:38<206:09:36,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21827/203307 [24:47:42<206:09:28,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21827/203307 [24:47:42<206:09:28,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21828/203307 [24:47:45<206:09:21,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21828/203307 [24:47:46<206:09:21,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21829/203307 [24:47:50<206:09:20,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21829/203307 [24:47:50<206:09:20,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21830/203307 [24:47:54<206:09:18,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21830/203307 [24:47:54<206:09:18,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21831/203307 [24:47:58<206:09:10,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21831/203307 [24:47:58<206:09:11,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21832/203307 [24:48:02<206:09:03,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21832/203307 [24:48:02<206:09:03,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21833/203307 [24:48:06<206:09:01,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21833/203307 [24:48:06<206:09:01,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21834/203307 [24:48:10<206:08:58,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21834/203307 [24:48:10<206:08:58,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21835/203307 [24:48:15<206:08:56,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21835/203307 [24:48:15<206:08:56,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21836/203307 [24:48:18<206:08:49,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21836/203307 [24:48:18<206:08:49,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21837/203307 [24:48:23<206:08:47,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21837/203307 [24:48:23<206:08:47,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21838/203307 [24:48:26<206:08:39,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21838/203307 [24:48:26<206:08:39,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21839/203307 [24:48:31<206:08:38,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21839/203307 [24:48:31<206:08:38,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21840/203307 [24:48:34<206:08:31,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21840/203307 [24:48:34<206:08:31,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21841/203307 [24:48:39<206:08:28,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  11%|█         | 21841/203307 [24:48:39<206:08:28,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21842/203307 [24:48:43<206:08:25,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21842/203307 [24:48:43<206:08:25,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21843/203307 [24:48:47<206:08:22,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21843/203307 [24:48:47<206:08:22,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21844/203307 [24:48:51<206:08:15,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21844/203307 [24:48:51<206:08:15,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21845/203307 [24:48:55<206:08:08,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21845/203307 [24:48:55<206:08:08,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21846/203307 [24:48:59<206:08:07,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21846/203307 [24:48:59<206:08:07,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21847/203307 [24:49:03<206:08:03,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21847/203307 [24:49:03<206:08:03,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21848/203307 [24:49:07<206:08:01,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21848/203307 [24:49:07<206:08:01,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21849/203307 [24:49:12<206:07:58,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21849/203307 [24:49:12<206:07:58,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21850/203307 [24:49:15<206:07:51,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21850/203307 [24:49:15<206:07:51,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21851/203307 [24:49:20<206:07:49,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21851/203307 [24:49:20<206:07:49,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21852/203307 [24:49:24<206:07:42,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21852/203307 [24:49:24<206:07:42,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21853/203307 [24:49:27<206:07:35,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21853/203307 [24:49:27<206:07:35,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21854/203307 [24:49:31<206:07:28,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21854/203307 [24:49:31<206:07:28,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21855/203307 [24:49:35<206:07:27,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21855/203307 [24:49:35<206:07:27,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21856/203307 [24:49:40<206:07:25,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21856/203307 [24:49:40<206:07:25,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21857/203307 [24:49:44<206:07:18,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21857/203307 [24:49:44<206:07:18,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21858/203307 [24:49:48<206:07:15,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21858/203307 [24:49:48<206:07:15,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21859/203307 [24:49:52<206:07:13,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21859/203307 [24:49:52<206:07:13,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21860/203307 [24:49:56<206:07:11,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21860/203307 [24:49:56<206:07:11,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21861/203307 [24:50:00<206:07:04,  0.24it/s, v_num=t5e6, training/loss=0.0928]Epoch 0:  11%|█         | 21861/203307 [24:50:00<206:07:04,  0.24it/s, v_num=t5e6, training/loss=0.082] Epoch 0:  11%|█         | 21862/203307 [24:50:04<206:06:57,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21862/203307 [24:50:04<206:06:57,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21863/203307 [24:50:08<206:06:56,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21863/203307 [24:50:08<206:06:56,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21864/203307 [24:50:13<206:06:52,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21864/203307 [24:50:13<206:06:53,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21865/203307 [24:50:17<206:06:52,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21865/203307 [24:50:17<206:06:52,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21866/203307 [24:50:21<206:06:48,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21866/203307 [24:50:21<206:06:48,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21867/203307 [24:50:25<206:06:41,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21867/203307 [24:50:25<206:06:41,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21868/203307 [24:50:29<206:06:39,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21868/203307 [24:50:29<206:06:39,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21869/203307 [24:50:33<206:06:36,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21869/203307 [24:50:33<206:06:36,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21870/203307 [24:50:37<206:06:28,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21870/203307 [24:50:37<206:06:28,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21871/203307 [24:50:41<206:06:21,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21871/203307 [24:50:41<206:06:21,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21872/203307 [24:50:45<206:06:20,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21872/203307 [24:50:45<206:06:20,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21873/203307 [24:50:49<206:06:13,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21873/203307 [24:50:49<206:06:13,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21874/203307 [24:50:53<206:06:12,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21874/203307 [24:50:53<206:06:12,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21875/203307 [24:50:57<206:06:04,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21875/203307 [24:50:57<206:06:04,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21876/203307 [24:51:01<206:06:01,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21876/203307 [24:51:01<206:06:01,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21877/203307 [24:51:06<206:05:59,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21877/203307 [24:51:06<206:05:59,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21878/203307 [24:51:09<206:05:51,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21878/203307 [24:51:09<206:05:51,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21879/203307 [24:51:13<206:05:45,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21879/203307 [24:51:13<206:05:45,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21880/203307 [24:51:17<206:05:38,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21880/203307 [24:51:17<206:05:38,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21881/203307 [24:51:21<206:05:37,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 21881/203307 [24:51:21<206:05:37,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21882/203307 [24:51:26<206:05:36,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21882/203307 [24:51:26<206:05:36,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21883/203307 [24:51:30<206:05:33,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21883/203307 [24:51:30<206:05:33,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21884/203307 [24:51:34<206:05:25,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21884/203307 [24:51:34<206:05:25,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21885/203307 [24:51:38<206:05:23,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21885/203307 [24:51:38<206:05:23,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21886/203307 [24:51:42<206:05:20,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21886/203307 [24:51:42<206:05:20,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21887/203307 [24:51:46<206:05:12,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21887/203307 [24:51:46<206:05:12,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21888/203307 [24:51:49<206:05:04,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21888/203307 [24:51:49<206:05:04,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21889/203307 [24:51:54<206:05:03,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21889/203307 [24:51:54<206:05:03,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21890/203307 [24:51:58<206:04:56,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21890/203307 [24:51:58<206:04:56,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21891/203307 [24:52:02<206:04:55,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21891/203307 [24:52:02<206:04:55,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21892/203307 [24:52:06<206:04:47,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21892/203307 [24:52:06<206:04:47,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21893/203307 [24:52:10<206:04:44,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21893/203307 [24:52:10<206:04:45,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21894/203307 [24:52:14<206:04:42,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21894/203307 [24:52:14<206:04:42,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21895/203307 [24:52:19<206:04:40,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21895/203307 [24:52:19<206:04:40,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21896/203307 [24:52:22<206:04:33,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21896/203307 [24:52:22<206:04:33,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21897/203307 [24:52:26<206:04:27,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21897/203307 [24:52:26<206:04:27,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21898/203307 [24:52:31<206:04:25,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21898/203307 [24:52:31<206:04:25,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21899/203307 [24:52:35<206:04:22,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21899/203307 [24:52:35<206:04:22,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21900/203307 [24:52:39<206:04:20,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21900/203307 [24:52:39<206:04:20,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21901/203307 [24:52:43<206:04:17,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█         | 21901/203307 [24:52:43<206:04:17,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21902/203307 [24:52:47<206:04:10,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21902/203307 [24:52:47<206:04:10,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21903/203307 [24:52:51<206:04:08,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21903/203307 [24:52:51<206:04:08,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21904/203307 [24:52:55<206:04:01,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21904/203307 [24:52:55<206:04:01,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21905/203307 [24:52:59<206:03:53,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21905/203307 [24:52:59<206:03:53,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21906/203307 [24:53:03<206:03:46,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21906/203307 [24:53:03<206:03:46,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21907/203307 [24:53:07<206:03:45,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21907/203307 [24:53:07<206:03:45,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21908/203307 [24:53:11<206:03:43,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21908/203307 [24:53:11<206:03:43,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21909/203307 [24:53:15<206:03:36,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21909/203307 [24:53:15<206:03:36,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21910/203307 [24:53:19<206:03:33,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21910/203307 [24:53:19<206:03:33,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21911/203307 [24:53:24<206:03:31,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21911/203307 [24:53:24<206:03:31,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21912/203307 [24:53:28<206:03:28,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21912/203307 [24:53:28<206:03:28,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21913/203307 [24:53:32<206:03:21,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21913/203307 [24:53:32<206:03:21,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21914/203307 [24:53:35<206:03:13,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21914/203307 [24:53:35<206:03:13,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21915/203307 [24:53:40<206:03:12,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21915/203307 [24:53:40<206:03:12,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21916/203307 [24:53:44<206:03:09,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21916/203307 [24:53:44<206:03:09,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21917/203307 [24:53:48<206:03:07,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21917/203307 [24:53:48<206:03:07,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21918/203307 [24:53:52<206:03:04,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21918/203307 [24:53:52<206:03:04,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21919/203307 [24:53:56<206:02:56,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21919/203307 [24:53:56<206:02:56,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21920/203307 [24:54:00<206:02:53,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21920/203307 [24:54:00<206:02:53,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21921/203307 [24:54:05<206:02:51,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  11%|█         | 21921/203307 [24:54:05<206:02:51,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21922/203307 [24:54:08<206:02:44,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21922/203307 [24:54:08<206:02:44,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21923/203307 [24:54:12<206:02:36,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21923/203307 [24:54:12<206:02:37,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21924/203307 [24:54:16<206:02:35,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21924/203307 [24:54:16<206:02:35,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21925/203307 [24:54:20<206:02:28,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21925/203307 [24:54:20<206:02:28,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21926/203307 [24:54:25<206:02:28,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21926/203307 [24:54:25<206:02:28,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21927/203307 [24:54:29<206:02:21,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21927/203307 [24:54:29<206:02:21,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21928/203307 [24:54:33<206:02:19,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21928/203307 [24:54:33<206:02:19,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21929/203307 [24:54:37<206:02:17,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21929/203307 [24:54:37<206:02:17,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21930/203307 [24:54:41<206:02:11,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21930/203307 [24:54:41<206:02:11,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21931/203307 [24:54:45<206:02:04,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21931/203307 [24:54:45<206:02:04,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21932/203307 [24:54:48<206:01:56,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21932/203307 [24:54:48<206:01:56,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21933/203307 [24:54:53<206:01:56,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21933/203307 [24:54:53<206:01:56,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21934/203307 [24:54:57<206:01:54,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21934/203307 [24:54:57<206:01:54,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21935/203307 [24:55:02<206:01:52,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21935/203307 [24:55:02<206:01:52,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21936/203307 [24:55:05<206:01:45,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21936/203307 [24:55:05<206:01:45,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21937/203307 [24:55:10<206:01:43,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21937/203307 [24:55:10<206:01:43,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21938/203307 [24:55:14<206:01:41,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21938/203307 [24:55:14<206:01:41,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21939/203307 [24:55:18<206:01:34,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21939/203307 [24:55:18<206:01:34,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21940/203307 [24:55:21<206:01:26,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21940/203307 [24:55:21<206:01:26,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21941/203307 [24:55:26<206:01:24,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  11%|█         | 21941/203307 [24:55:26<206:01:24,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21942/203307 [24:55:30<206:01:17,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21942/203307 [24:55:30<206:01:17,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21943/203307 [24:55:34<206:01:16,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21943/203307 [24:55:34<206:01:16,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21944/203307 [24:55:38<206:01:09,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21944/203307 [24:55:38<206:01:09,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21945/203307 [24:55:42<206:01:05,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21945/203307 [24:55:42<206:01:05,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21946/203307 [24:55:46<206:01:03,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21946/203307 [24:55:46<206:01:03,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21947/203307 [24:55:50<206:01:00,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21947/203307 [24:55:50<206:01:00,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21948/203307 [24:55:54<206:00:52,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21948/203307 [24:55:54<206:00:52,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21949/203307 [24:55:58<206:00:50,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21949/203307 [24:55:58<206:00:50,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21950/203307 [24:56:03<206:00:48,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21950/203307 [24:56:03<206:00:48,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21951/203307 [24:56:07<206:00:45,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21951/203307 [24:56:07<206:00:45,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21952/203307 [24:56:11<206:00:42,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21952/203307 [24:56:11<206:00:42,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21953/203307 [24:56:15<206:00:34,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21953/203307 [24:56:15<206:00:34,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21954/203307 [24:56:19<206:00:28,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21954/203307 [24:56:19<206:00:28,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21955/203307 [24:56:23<206:00:27,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21955/203307 [24:56:23<206:00:27,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21956/203307 [24:56:27<206:00:20,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21956/203307 [24:56:27<206:00:20,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21957/203307 [24:56:30<206:00:12,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21957/203307 [24:56:30<206:00:12,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21958/203307 [24:56:35<206:00:09,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21958/203307 [24:56:35<206:00:09,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21959/203307 [24:56:39<206:00:07,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21959/203307 [24:56:39<206:00:07,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21960/203307 [24:56:43<206:00:06,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21960/203307 [24:56:43<206:00:06,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21961/203307 [24:56:47<205:59:58,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 21961/203307 [24:56:47<205:59:58,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21962/203307 [24:56:51<205:59:51,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21962/203307 [24:56:51<205:59:51,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21963/203307 [24:56:55<205:59:48,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21963/203307 [24:56:55<205:59:48,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21964/203307 [24:56:59<205:59:46,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21964/203307 [24:56:59<205:59:46,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21965/203307 [24:57:03<205:59:38,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21965/203307 [24:57:03<205:59:38,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21966/203307 [24:57:07<205:59:34,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21966/203307 [24:57:07<205:59:34,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21967/203307 [24:57:11<205:59:32,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21967/203307 [24:57:11<205:59:32,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21968/203307 [24:57:16<205:59:31,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21968/203307 [24:57:16<205:59:31,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21969/203307 [24:57:20<205:59:30,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21969/203307 [24:57:20<205:59:30,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21970/203307 [24:57:24<205:59:23,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21970/203307 [24:57:24<205:59:23,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21971/203307 [24:57:28<205:59:16,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21971/203307 [24:57:28<205:59:16,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21972/203307 [24:57:32<205:59:15,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21972/203307 [24:57:32<205:59:15,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21973/203307 [24:57:37<205:59:13,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21973/203307 [24:57:37<205:59:13,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21974/203307 [24:57:41<205:59:09,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21974/203307 [24:57:41<205:59:10,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21975/203307 [24:57:45<205:59:03,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21975/203307 [24:57:45<205:59:03,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21976/203307 [24:57:49<205:59:02,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21976/203307 [24:57:49<205:59:02,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21977/203307 [24:57:53<205:58:55,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21977/203307 [24:57:53<205:58:55,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21978/203307 [24:57:57<205:58:54,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21978/203307 [24:57:57<205:58:54,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21979/203307 [24:58:01<205:58:47,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21979/203307 [24:58:01<205:58:47,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21980/203307 [24:58:05<205:58:40,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21980/203307 [24:58:05<205:58:40,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21981/203307 [24:58:09<205:58:38,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 21981/203307 [24:58:09<205:58:38,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21982/203307 [24:58:13<205:58:34,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21982/203307 [24:58:13<205:58:34,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21983/203307 [24:58:18<205:58:32,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21983/203307 [24:58:18<205:58:32,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21984/203307 [24:58:21<205:58:26,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21984/203307 [24:58:21<205:58:26,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21985/203307 [24:58:26<205:58:25,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21985/203307 [24:58:26<205:58:25,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21986/203307 [24:58:30<205:58:24,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21986/203307 [24:58:30<205:58:24,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21987/203307 [24:58:34<205:58:17,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21987/203307 [24:58:34<205:58:17,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21988/203307 [24:58:38<205:58:09,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21988/203307 [24:58:38<205:58:10,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21989/203307 [24:58:42<205:58:08,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21989/203307 [24:58:42<205:58:08,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21990/203307 [24:58:46<205:58:06,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21990/203307 [24:58:46<205:58:06,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21991/203307 [24:58:51<205:58:04,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21991/203307 [24:58:51<205:58:04,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21992/203307 [24:58:54<205:57:57,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21992/203307 [24:58:55<205:57:57,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21993/203307 [24:58:59<205:57:55,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21993/203307 [24:58:59<205:57:55,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21994/203307 [24:59:03<205:57:49,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21994/203307 [24:59:03<205:57:49,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21995/203307 [24:59:07<205:57:48,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21995/203307 [24:59:07<205:57:48,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21996/203307 [24:59:11<205:57:40,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21996/203307 [24:59:11<205:57:40,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21997/203307 [24:59:15<205:57:33,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21997/203307 [24:59:15<205:57:33,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21998/203307 [24:59:19<205:57:31,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21998/203307 [24:59:19<205:57:31,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21999/203307 [24:59:23<205:57:29,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 21999/203307 [24:59:23<205:57:29,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22000/203307 [24:59:27<205:57:22,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22000/203307 [24:59:27<205:57:22,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22001/203307 [24:59:31<205:57:20,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22001/203307 [24:59:31<205:57:20,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22002/203307 [24:59:36<205:57:19,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22002/203307 [24:59:36<205:57:19,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22003/203307 [24:59:40<205:57:12,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22003/203307 [24:59:40<205:57:12,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22004/203307 [24:59:44<205:57:11,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22004/203307 [24:59:44<205:57:11,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22005/203307 [24:59:48<205:57:04,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22005/203307 [24:59:48<205:57:04,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22006/203307 [24:59:51<205:56:56,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22006/203307 [24:59:51<205:56:56,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22007/203307 [24:59:56<205:56:55,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22007/203307 [24:59:56<205:56:55,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22008/203307 [25:00:00<205:56:52,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22008/203307 [25:00:00<205:56:52,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22009/203307 [25:00:04<205:56:49,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22009/203307 [25:00:04<205:56:49,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22010/203307 [25:00:08<205:56:46,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22010/203307 [25:00:08<205:56:46,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22011/203307 [25:00:13<205:56:45,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22011/203307 [25:00:13<205:56:45,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22012/203307 [25:00:17<205:56:43,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22012/203307 [25:00:17<205:56:43,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22013/203307 [25:00:21<205:56:36,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22013/203307 [25:00:21<205:56:36,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22014/203307 [25:00:25<205:56:30,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22014/203307 [25:00:25<205:56:30,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22015/203307 [25:00:29<205:56:28,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22015/203307 [25:00:29<205:56:28,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22016/203307 [25:00:33<205:56:25,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22016/203307 [25:00:34<205:56:25,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22017/203307 [25:00:37<205:56:19,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22017/203307 [25:00:37<205:56:19,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22018/203307 [25:00:42<205:56:17,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22018/203307 [25:00:42<205:56:17,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22019/203307 [25:00:46<205:56:15,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22019/203307 [25:00:46<205:56:15,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22020/203307 [25:00:50<205:56:09,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22020/203307 [25:00:50<205:56:09,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22021/203307 [25:00:54<205:56:07,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  11%|█         | 22021/203307 [25:00:54<205:56:07,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22022/203307 [25:00:58<205:56:00,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22022/203307 [25:00:58<205:56:00,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22023/203307 [25:01:02<205:55:53,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22023/203307 [25:01:02<205:55:53,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22024/203307 [25:01:06<205:55:51,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22024/203307 [25:01:06<205:55:51,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22025/203307 [25:01:10<205:55:49,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22025/203307 [25:01:10<205:55:49,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22026/203307 [25:01:14<205:55:45,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22026/203307 [25:01:14<205:55:45,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22027/203307 [25:01:18<205:55:39,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22027/203307 [25:01:18<205:55:39,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22028/203307 [25:01:23<205:55:38,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22028/203307 [25:01:23<205:55:38,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22029/203307 [25:01:27<205:55:32,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22029/203307 [25:01:27<205:55:32,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22030/203307 [25:01:31<205:55:31,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22030/203307 [25:01:31<205:55:31,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22031/203307 [25:01:35<205:55:24,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22031/203307 [25:01:35<205:55:24,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22032/203307 [25:01:39<205:55:17,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22032/203307 [25:01:39<205:55:17,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22033/203307 [25:01:43<205:55:15,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22033/203307 [25:01:43<205:55:15,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22034/203307 [25:01:47<205:55:09,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22034/203307 [25:01:47<205:55:09,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22035/203307 [25:01:51<205:55:07,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22035/203307 [25:01:51<205:55:07,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22036/203307 [25:01:55<205:55:03,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22036/203307 [25:01:55<205:55:03,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22037/203307 [25:02:00<205:55:02,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22037/203307 [25:02:00<205:55:02,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22038/203307 [25:02:04<205:54:59,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22038/203307 [25:02:04<205:55:00,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22039/203307 [25:02:08<205:54:53,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22039/203307 [25:02:08<205:54:53,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22040/203307 [25:02:11<205:54:46,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22040/203307 [25:02:11<205:54:46,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22041/203307 [25:02:16<205:54:45,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  11%|█         | 22041/203307 [25:02:16<205:54:45,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22042/203307 [25:02:20<205:54:43,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22042/203307 [25:02:20<205:54:43,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22043/203307 [25:02:25<205:54:40,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22043/203307 [25:02:25<205:54:40,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22044/203307 [25:02:28<205:54:33,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22044/203307 [25:02:28<205:54:33,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22045/203307 [25:02:33<205:54:32,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22045/203307 [25:02:33<205:54:32,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22046/203307 [25:02:36<205:54:25,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22046/203307 [25:02:36<205:54:25,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22047/203307 [25:02:41<205:54:24,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22047/203307 [25:02:41<205:54:24,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22048/203307 [25:02:45<205:54:18,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22048/203307 [25:02:45<205:54:18,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22049/203307 [25:02:49<205:54:15,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22049/203307 [25:02:49<205:54:15,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22050/203307 [25:02:53<205:54:12,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22050/203307 [25:02:53<205:54:12,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22051/203307 [25:02:58<205:54:10,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22051/203307 [25:02:58<205:54:10,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22052/203307 [25:03:01<205:54:03,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22052/203307 [25:03:01<205:54:03,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22053/203307 [25:03:05<205:54:00,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22053/203307 [25:03:05<205:54:00,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22054/203307 [25:03:10<205:53:58,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22054/203307 [25:03:10<205:53:58,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22055/203307 [25:03:14<205:53:50,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22055/203307 [25:03:14<205:53:50,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22056/203307 [25:03:18<205:53:49,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22056/203307 [25:03:18<205:53:49,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22057/203307 [25:03:22<205:53:41,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22057/203307 [25:03:22<205:53:41,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22058/203307 [25:03:26<205:53:39,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22058/203307 [25:03:26<205:53:39,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22059/203307 [25:03:30<205:53:37,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22059/203307 [25:03:30<205:53:37,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22060/203307 [25:03:34<205:53:34,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22060/203307 [25:03:34<205:53:34,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22061/203307 [25:03:38<205:53:27,  0.24it/s, v_num=t5e6, training/loss=0.0808]Epoch 0:  11%|█         | 22061/203307 [25:03:38<205:53:27,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22062/203307 [25:03:42<205:53:20,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22062/203307 [25:03:42<205:53:21,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22063/203307 [25:03:46<205:53:19,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22063/203307 [25:03:46<205:53:19,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22064/203307 [25:03:51<205:53:17,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22064/203307 [25:03:51<205:53:17,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22065/203307 [25:03:55<205:53:11,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22065/203307 [25:03:55<205:53:11,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22066/203307 [25:03:59<205:53:08,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22066/203307 [25:03:59<205:53:08,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22067/203307 [25:04:03<205:53:06,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22067/203307 [25:04:03<205:53:06,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22068/203307 [25:04:08<205:53:04,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22068/203307 [25:04:08<205:53:05,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22069/203307 [25:04:11<205:52:58,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22069/203307 [25:04:11<205:52:58,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22070/203307 [25:04:15<205:52:50,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22070/203307 [25:04:15<205:52:51,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22071/203307 [25:04:19<205:52:49,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22071/203307 [25:04:19<205:52:49,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22072/203307 [25:04:24<205:52:45,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22072/203307 [25:04:24<205:52:46,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22073/203307 [25:04:28<205:52:44,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22073/203307 [25:04:28<205:52:44,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22074/203307 [25:04:32<205:52:40,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22074/203307 [25:04:32<205:52:40,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22075/203307 [25:04:36<205:52:33,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22075/203307 [25:04:36<205:52:33,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22076/203307 [25:04:40<205:52:31,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22076/203307 [25:04:40<205:52:31,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22077/203307 [25:04:44<205:52:28,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22077/203307 [25:04:44<205:52:28,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22078/203307 [25:04:48<205:52:21,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22078/203307 [25:04:48<205:52:21,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22079/203307 [25:04:52<205:52:14,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22079/203307 [25:04:52<205:52:14,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22080/203307 [25:04:56<205:52:14,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22080/203307 [25:04:56<205:52:14,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22081/203307 [25:05:00<205:52:07,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  11%|█         | 22081/203307 [25:05:00<205:52:07,  0.24it/s, v_num=t5e6, training/loss=0.082] Epoch 0:  11%|█         | 22082/203307 [25:05:05<205:52:06,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22082/203307 [25:05:05<205:52:06,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22083/203307 [25:05:09<205:52:03,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22083/203307 [25:05:09<205:52:03,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22084/203307 [25:05:13<205:51:57,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22084/203307 [25:05:13<205:51:57,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22085/203307 [25:05:17<205:51:55,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22085/203307 [25:05:17<205:51:55,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22086/203307 [25:05:21<205:51:49,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22086/203307 [25:05:21<205:51:49,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22087/203307 [25:05:25<205:51:41,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22087/203307 [25:05:25<205:51:41,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22088/203307 [25:05:28<205:51:35,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22088/203307 [25:05:28<205:51:35,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22089/203307 [25:05:33<205:51:34,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22089/203307 [25:05:33<205:51:34,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22090/203307 [25:05:37<205:51:32,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22090/203307 [25:05:37<205:51:32,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22091/203307 [25:05:42<205:51:30,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22091/203307 [25:05:42<205:51:30,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22092/203307 [25:05:45<205:51:23,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22092/203307 [25:05:45<205:51:24,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22093/203307 [25:05:50<205:51:21,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22093/203307 [25:05:50<205:51:21,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22094/203307 [25:05:54<205:51:18,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22094/203307 [25:05:54<205:51:18,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22095/203307 [25:05:58<205:51:11,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22095/203307 [25:05:58<205:51:11,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22096/203307 [25:06:01<205:51:05,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22096/203307 [25:06:01<205:51:05,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22097/203307 [25:06:06<205:51:03,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22097/203307 [25:06:06<205:51:03,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22098/203307 [25:06:10<205:50:56,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22098/203307 [25:06:10<205:50:56,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22099/203307 [25:06:14<205:50:55,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22099/203307 [25:06:14<205:50:55,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22100/203307 [25:06:18<205:50:49,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22100/203307 [25:06:18<205:50:49,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22101/203307 [25:06:22<205:50:47,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  11%|█         | 22101/203307 [25:06:22<205:50:47,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22102/203307 [25:06:27<205:50:45,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22102/203307 [25:06:27<205:50:45,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22103/203307 [25:06:31<205:50:41,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22103/203307 [25:06:31<205:50:41,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22104/203307 [25:06:34<205:50:34,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22104/203307 [25:06:34<205:50:34,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22105/203307 [25:06:38<205:50:27,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22105/203307 [25:06:38<205:50:27,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22106/203307 [25:06:43<205:50:27,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22106/203307 [25:06:43<205:50:27,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22107/203307 [25:06:47<205:50:23,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22107/203307 [25:06:47<205:50:23,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22108/203307 [25:06:51<205:50:22,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22108/203307 [25:06:51<205:50:22,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22109/203307 [25:06:55<205:50:14,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22109/203307 [25:06:55<205:50:15,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22110/203307 [25:06:59<205:50:12,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22110/203307 [25:06:59<205:50:12,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22111/203307 [25:07:04<205:50:10,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22111/203307 [25:07:04<205:50:10,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22112/203307 [25:07:07<205:50:03,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22112/203307 [25:07:07<205:50:03,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22113/203307 [25:07:11<205:49:56,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22113/203307 [25:07:11<205:49:56,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22114/203307 [25:07:15<205:49:49,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22114/203307 [25:07:15<205:49:49,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22115/203307 [25:07:19<205:49:48,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22115/203307 [25:07:19<205:49:48,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22116/203307 [25:07:24<205:49:47,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22116/203307 [25:07:24<205:49:47,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22117/203307 [25:07:28<205:49:44,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22117/203307 [25:07:28<205:49:44,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22118/203307 [25:07:32<205:49:41,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22118/203307 [25:07:32<205:49:41,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22119/203307 [25:07:36<205:49:39,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22119/203307 [25:07:36<205:49:39,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22120/203307 [25:07:41<205:49:36,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22120/203307 [25:07:41<205:49:36,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22121/203307 [25:07:44<205:49:29,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  11%|█         | 22121/203307 [25:07:44<205:49:29,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22122/203307 [25:07:48<205:49:21,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22122/203307 [25:07:48<205:49:21,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22123/203307 [25:07:53<205:49:20,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22123/203307 [25:07:53<205:49:20,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22124/203307 [25:07:57<205:49:17,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22124/203307 [25:07:57<205:49:17,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22125/203307 [25:08:01<205:49:15,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22125/203307 [25:08:01<205:49:15,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22126/203307 [25:08:05<205:49:13,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22126/203307 [25:08:05<205:49:13,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22127/203307 [25:08:09<205:49:06,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22127/203307 [25:08:09<205:49:06,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22128/203307 [25:08:13<205:49:04,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22128/203307 [25:08:14<205:49:04,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22129/203307 [25:08:18<205:49:01,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22129/203307 [25:08:18<205:49:01,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22130/203307 [25:08:22<205:48:55,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22130/203307 [25:08:22<205:48:55,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22131/203307 [25:08:25<205:48:48,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22131/203307 [25:08:25<205:48:48,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22132/203307 [25:08:30<205:48:47,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22132/203307 [25:08:30<205:48:47,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22133/203307 [25:08:34<205:48:44,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22133/203307 [25:08:34<205:48:44,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22134/203307 [25:08:38<205:48:42,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22134/203307 [25:08:38<205:48:42,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22135/203307 [25:08:43<205:48:39,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22135/203307 [25:08:43<205:48:39,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22136/203307 [25:08:46<205:48:31,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22136/203307 [25:08:46<205:48:32,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22137/203307 [25:08:51<205:48:29,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22137/203307 [25:08:51<205:48:29,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22138/203307 [25:08:54<205:48:22,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22138/203307 [25:08:54<205:48:22,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22139/203307 [25:08:58<205:48:14,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22139/203307 [25:08:58<205:48:14,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22140/203307 [25:09:02<205:48:07,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22140/203307 [25:09:02<205:48:07,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22141/203307 [25:09:06<205:48:06,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  11%|█         | 22141/203307 [25:09:06<205:48:06,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22142/203307 [25:09:10<205:48:04,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22142/203307 [25:09:10<205:48:04,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22143/203307 [25:09:15<205:48:02,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22143/203307 [25:09:15<205:48:02,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22144/203307 [25:09:19<205:47:58,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22144/203307 [25:09:19<205:47:59,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22145/203307 [25:09:23<205:47:56,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22145/203307 [25:09:23<205:47:56,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22146/203307 [25:09:27<205:47:53,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22146/203307 [25:09:27<205:47:53,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22147/203307 [25:09:31<205:47:46,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22147/203307 [25:09:31<205:47:46,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22148/203307 [25:09:35<205:47:38,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22148/203307 [25:09:35<205:47:38,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22149/203307 [25:09:39<205:47:38,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22149/203307 [25:09:39<205:47:38,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22150/203307 [25:09:43<205:47:31,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22150/203307 [25:09:43<205:47:31,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22151/203307 [25:09:48<205:47:30,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22151/203307 [25:09:48<205:47:30,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22152/203307 [25:09:51<205:47:22,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22152/203307 [25:09:51<205:47:22,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22153/203307 [25:09:55<205:47:18,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22153/203307 [25:09:55<205:47:18,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22154/203307 [25:10:00<205:47:16,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22154/203307 [25:10:00<205:47:16,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22155/203307 [25:10:04<205:47:13,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22155/203307 [25:10:04<205:47:13,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22156/203307 [25:10:08<205:47:05,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22156/203307 [25:10:08<205:47:05,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22157/203307 [25:10:11<205:46:58,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22157/203307 [25:10:11<205:46:58,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22158/203307 [25:10:16<205:46:57,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22158/203307 [25:10:16<205:46:57,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22159/203307 [25:10:19<205:46:50,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22159/203307 [25:10:19<205:46:50,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22160/203307 [25:10:24<205:46:49,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22160/203307 [25:10:24<205:46:49,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22161/203307 [25:10:28<205:46:46,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  11%|█         | 22161/203307 [25:10:28<205:46:46,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22162/203307 [25:10:32<205:46:38,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22162/203307 [25:10:32<205:46:38,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22163/203307 [25:10:36<205:46:36,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22163/203307 [25:10:36<205:46:36,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22164/203307 [25:10:40<205:46:29,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22164/203307 [25:10:40<205:46:29,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22165/203307 [25:10:43<205:46:21,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22165/203307 [25:10:43<205:46:21,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22166/203307 [25:10:48<205:46:19,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22166/203307 [25:10:48<205:46:19,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22167/203307 [25:10:52<205:46:17,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22167/203307 [25:10:52<205:46:17,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22168/203307 [25:10:56<205:46:15,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22168/203307 [25:10:56<205:46:15,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22169/203307 [25:11:00<205:46:08,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22169/203307 [25:11:00<205:46:08,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22170/203307 [25:11:04<205:46:01,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22170/203307 [25:11:04<205:46:01,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22171/203307 [25:11:08<205:46:00,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22171/203307 [25:11:08<205:46:00,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22172/203307 [25:11:13<205:45:56,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22172/203307 [25:11:13<205:45:57,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22173/203307 [25:11:16<205:45:50,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22173/203307 [25:11:16<205:45:50,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22174/203307 [25:11:21<205:45:47,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22174/203307 [25:11:21<205:45:47,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22175/203307 [25:11:25<205:45:45,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22175/203307 [25:11:25<205:45:45,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22176/203307 [25:11:29<205:45:42,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22176/203307 [25:11:29<205:45:42,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22177/203307 [25:11:33<205:45:40,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22177/203307 [25:11:33<205:45:40,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22178/203307 [25:11:37<205:45:32,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22178/203307 [25:11:37<205:45:32,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22179/203307 [25:11:41<205:45:25,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22179/203307 [25:11:41<205:45:25,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22180/203307 [25:11:45<205:45:24,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22180/203307 [25:11:45<205:45:24,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22181/203307 [25:11:50<205:45:21,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  11%|█         | 22181/203307 [25:11:50<205:45:22,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22182/203307 [25:11:53<205:45:14,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22182/203307 [25:11:53<205:45:14,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22183/203307 [25:11:58<205:45:12,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22183/203307 [25:11:58<205:45:12,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22184/203307 [25:12:02<205:45:10,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22184/203307 [25:12:02<205:45:10,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22185/203307 [25:12:06<205:45:07,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22185/203307 [25:12:06<205:45:07,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22186/203307 [25:12:11<205:45:05,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22186/203307 [25:12:11<205:45:05,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22187/203307 [25:12:14<205:44:58,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22187/203307 [25:12:14<205:44:58,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22188/203307 [25:12:18<205:44:53,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22188/203307 [25:12:18<205:44:53,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22189/203307 [25:12:23<205:44:50,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22189/203307 [25:12:23<205:44:51,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22190/203307 [25:12:26<205:44:43,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22190/203307 [25:12:26<205:44:43,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22191/203307 [25:12:30<205:44:40,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22191/203307 [25:12:30<205:44:40,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22192/203307 [25:12:34<205:44:33,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22192/203307 [25:12:34<205:44:33,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22193/203307 [25:12:38<205:44:31,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22193/203307 [25:12:38<205:44:31,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22194/203307 [25:12:43<205:44:29,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22194/203307 [25:12:43<205:44:29,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22195/203307 [25:12:47<205:44:22,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22195/203307 [25:12:47<205:44:22,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22196/203307 [25:12:50<205:44:14,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22196/203307 [25:12:50<205:44:14,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22197/203307 [25:12:54<205:44:12,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22197/203307 [25:12:54<205:44:12,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22198/203307 [25:12:59<205:44:09,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22198/203307 [25:12:59<205:44:09,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22199/203307 [25:13:03<205:44:05,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22199/203307 [25:13:03<205:44:05,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22200/203307 [25:13:07<205:43:58,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22200/203307 [25:13:07<205:43:58,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22201/203307 [25:13:11<205:43:56,  0.24it/s, v_num=t5e6, training/loss=0.0908]Epoch 0:  11%|█         | 22201/203307 [25:13:11<205:43:56,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22202/203307 [25:13:15<205:43:49,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22202/203307 [25:13:15<205:43:49,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22203/203307 [25:13:19<205:43:47,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22203/203307 [25:13:19<205:43:47,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22204/203307 [25:13:23<205:43:40,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22204/203307 [25:13:23<205:43:40,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22205/203307 [25:13:26<205:43:32,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22205/203307 [25:13:26<205:43:32,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22206/203307 [25:13:31<205:43:29,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22206/203307 [25:13:31<205:43:29,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22207/203307 [25:13:35<205:43:26,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22207/203307 [25:13:35<205:43:26,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22208/203307 [25:13:39<205:43:23,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22208/203307 [25:13:39<205:43:23,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22209/203307 [25:13:43<205:43:16,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22209/203307 [25:13:43<205:43:16,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22210/203307 [25:13:47<205:43:14,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22210/203307 [25:13:47<205:43:14,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22211/203307 [25:13:51<205:43:06,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22211/203307 [25:13:51<205:43:06,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22212/203307 [25:13:55<205:43:04,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22212/203307 [25:13:55<205:43:04,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22213/203307 [25:13:59<205:42:57,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22213/203307 [25:13:59<205:42:57,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22214/203307 [25:14:02<205:42:49,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22214/203307 [25:14:02<205:42:49,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22215/203307 [25:14:07<205:42:47,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22215/203307 [25:14:07<205:42:47,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22216/203307 [25:14:11<205:42:44,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22216/203307 [25:14:11<205:42:44,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22217/203307 [25:14:15<205:42:37,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22217/203307 [25:14:15<205:42:37,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22218/203307 [25:14:19<205:42:34,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22218/203307 [25:14:19<205:42:34,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22219/203307 [25:14:23<205:42:34,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22219/203307 [25:14:23<205:42:34,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22220/203307 [25:14:28<205:42:31,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22220/203307 [25:14:28<205:42:31,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22221/203307 [25:14:32<205:42:24,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  11%|█         | 22221/203307 [25:14:32<205:42:24,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22222/203307 [25:14:35<205:42:17,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22222/203307 [25:14:35<205:42:17,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22223/203307 [25:14:39<205:42:15,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22223/203307 [25:14:39<205:42:15,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22224/203307 [25:14:44<205:42:12,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22224/203307 [25:14:44<205:42:12,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22225/203307 [25:14:48<205:42:09,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22225/203307 [25:14:48<205:42:09,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22226/203307 [25:14:52<205:42:05,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22226/203307 [25:14:52<205:42:05,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22227/203307 [25:14:57<205:42:04,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22227/203307 [25:14:57<205:42:04,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22228/203307 [25:15:00<205:41:58,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22228/203307 [25:15:00<205:41:58,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22229/203307 [25:15:05<205:41:57,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22229/203307 [25:15:05<205:41:57,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22230/203307 [25:15:09<205:41:50,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22230/203307 [25:15:09<205:41:50,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22231/203307 [25:15:12<205:41:43,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22231/203307 [25:15:12<205:41:43,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22232/203307 [25:15:17<205:41:40,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22232/203307 [25:15:17<205:41:40,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22233/203307 [25:15:21<205:41:38,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22233/203307 [25:15:21<205:41:38,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22234/203307 [25:15:25<205:41:34,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22234/203307 [25:15:25<205:41:34,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22235/203307 [25:15:29<205:41:32,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22235/203307 [25:15:29<205:41:32,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22236/203307 [25:15:34<205:41:31,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22236/203307 [25:15:34<205:41:31,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22237/203307 [25:15:38<205:41:24,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22237/203307 [25:15:38<205:41:24,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22238/203307 [25:15:42<205:41:22,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22238/203307 [25:15:42<205:41:22,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22239/203307 [25:15:46<205:41:15,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22239/203307 [25:15:46<205:41:15,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22240/203307 [25:15:49<205:41:08,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22240/203307 [25:15:49<205:41:08,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22241/203307 [25:15:54<205:41:06,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22241/203307 [25:15:54<205:41:06,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22242/203307 [25:15:58<205:41:02,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22242/203307 [25:15:58<205:41:02,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22243/203307 [25:16:02<205:41:00,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22243/203307 [25:16:02<205:41:00,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22244/203307 [25:16:06<205:40:53,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22244/203307 [25:16:06<205:40:53,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22245/203307 [25:16:10<205:40:52,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22245/203307 [25:16:10<205:40:52,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22246/203307 [25:16:15<205:40:50,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22246/203307 [25:16:15<205:40:50,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22247/203307 [25:16:19<205:40:44,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22247/203307 [25:16:19<205:40:44,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22248/203307 [25:16:22<205:40:36,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22248/203307 [25:16:22<205:40:36,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22249/203307 [25:16:27<205:40:34,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22249/203307 [25:16:27<205:40:34,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22250/203307 [25:16:31<205:40:31,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22250/203307 [25:16:31<205:40:31,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22251/203307 [25:16:35<205:40:28,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22251/203307 [25:16:35<205:40:28,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22252/203307 [25:16:39<205:40:24,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22252/203307 [25:16:39<205:40:25,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22253/203307 [25:16:43<205:40:22,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22253/203307 [25:16:43<205:40:22,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22254/203307 [25:16:47<205:40:15,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22254/203307 [25:16:47<205:40:15,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22255/203307 [25:16:51<205:40:13,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22255/203307 [25:16:51<205:40:13,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22256/203307 [25:16:55<205:40:06,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22256/203307 [25:16:55<205:40:06,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22257/203307 [25:16:59<205:39:58,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22257/203307 [25:16:59<205:39:58,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22258/203307 [25:17:03<205:39:56,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22258/203307 [25:17:03<205:39:56,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22259/203307 [25:17:07<205:39:52,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22259/203307 [25:17:07<205:39:53,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22260/203307 [25:17:12<205:39:49,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22260/203307 [25:17:12<205:39:49,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22261/203307 [25:17:16<205:39:47,  0.24it/s, v_num=t5e6, training/loss=0.0935]Epoch 0:  11%|█         | 22261/203307 [25:17:16<205:39:47,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22262/203307 [25:17:20<205:39:46,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22262/203307 [25:17:20<205:39:46,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22263/203307 [25:17:24<205:39:39,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22263/203307 [25:17:24<205:39:39,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22264/203307 [25:17:28<205:39:38,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22264/203307 [25:17:28<205:39:38,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22265/203307 [25:17:32<205:39:30,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22265/203307 [25:17:32<205:39:30,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22266/203307 [25:17:36<205:39:27,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22266/203307 [25:17:36<205:39:27,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22267/203307 [25:17:41<205:39:25,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22267/203307 [25:17:41<205:39:25,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22268/203307 [25:17:45<205:39:22,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22268/203307 [25:17:45<205:39:22,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22269/203307 [25:17:49<205:39:18,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22269/203307 [25:17:49<205:39:18,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22270/203307 [25:17:53<205:39:11,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22270/203307 [25:17:53<205:39:11,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22271/203307 [25:17:57<205:39:10,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22271/203307 [25:17:57<205:39:10,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22272/203307 [25:18:01<205:39:07,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22272/203307 [25:18:01<205:39:07,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22273/203307 [25:18:05<205:39:00,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22273/203307 [25:18:05<205:39:00,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22274/203307 [25:18:09<205:38:57,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22274/203307 [25:18:09<205:38:57,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22275/203307 [25:18:14<205:38:54,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22275/203307 [25:18:14<205:38:54,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22276/203307 [25:18:18<205:38:51,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22276/203307 [25:18:18<205:38:51,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22277/203307 [25:18:22<205:38:44,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22277/203307 [25:18:22<205:38:44,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22278/203307 [25:18:25<205:38:38,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22278/203307 [25:18:25<205:38:38,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22279/203307 [25:18:30<205:38:37,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22279/203307 [25:18:30<205:38:37,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22280/203307 [25:18:34<205:38:31,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22280/203307 [25:18:34<205:38:31,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22281/203307 [25:18:38<205:38:29,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  11%|█         | 22281/203307 [25:18:38<205:38:29,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22282/203307 [25:18:42<205:38:22,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22282/203307 [25:18:42<205:38:22,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22283/203307 [25:18:46<205:38:20,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22283/203307 [25:18:46<205:38:20,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22284/203307 [25:18:50<205:38:18,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22284/203307 [25:18:50<205:38:18,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22285/203307 [25:18:55<205:38:16,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22285/203307 [25:18:55<205:38:16,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22286/203307 [25:18:59<205:38:08,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22286/203307 [25:18:59<205:38:08,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22287/203307 [25:19:02<205:38:02,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22287/203307 [25:19:02<205:38:02,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22288/203307 [25:19:07<205:38:01,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22288/203307 [25:19:07<205:38:01,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22289/203307 [25:19:11<205:37:54,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22289/203307 [25:19:11<205:37:54,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22290/203307 [25:19:15<205:37:53,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22290/203307 [25:19:15<205:37:53,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22291/203307 [25:19:19<205:37:50,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22291/203307 [25:19:19<205:37:50,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22292/203307 [25:19:23<205:37:42,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22292/203307 [25:19:23<205:37:42,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22293/203307 [25:19:27<205:37:40,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22293/203307 [25:19:27<205:37:40,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22294/203307 [25:19:31<205:37:33,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22294/203307 [25:19:31<205:37:33,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22295/203307 [25:19:35<205:37:26,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22295/203307 [25:19:35<205:37:26,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22296/203307 [25:19:39<205:37:22,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22296/203307 [25:19:39<205:37:23,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22297/203307 [25:19:43<205:37:21,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22297/203307 [25:19:43<205:37:21,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22298/203307 [25:19:47<205:37:18,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22298/203307 [25:19:47<205:37:18,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22299/203307 [25:19:52<205:37:15,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22299/203307 [25:19:52<205:37:15,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22300/203307 [25:19:55<205:37:08,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22300/203307 [25:19:55<205:37:08,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22301/203307 [25:20:00<205:37:05,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  11%|█         | 22301/203307 [25:20:00<205:37:05,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22302/203307 [25:20:04<205:37:02,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22302/203307 [25:20:04<205:37:02,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22303/203307 [25:20:08<205:36:55,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22303/203307 [25:20:08<205:36:55,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22304/203307 [25:20:11<205:36:47,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22304/203307 [25:20:11<205:36:47,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22305/203307 [25:20:16<205:36:46,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22305/203307 [25:20:16<205:36:46,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22306/203307 [25:20:20<205:36:43,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22306/203307 [25:20:20<205:36:43,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22307/203307 [25:20:24<205:36:41,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22307/203307 [25:20:24<205:36:41,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22308/203307 [25:20:28<205:36:38,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22308/203307 [25:20:28<205:36:38,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22309/203307 [25:20:32<205:36:30,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22309/203307 [25:20:32<205:36:30,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22310/203307 [25:20:36<205:36:27,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22310/203307 [25:20:36<205:36:27,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22311/203307 [25:20:40<205:36:24,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22311/203307 [25:20:40<205:36:24,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22312/203307 [25:20:44<205:36:16,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22312/203307 [25:20:44<205:36:16,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22313/203307 [25:20:48<205:36:09,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22313/203307 [25:20:48<205:36:09,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22314/203307 [25:20:52<205:36:08,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22314/203307 [25:20:52<205:36:08,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22315/203307 [25:20:56<205:36:04,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22315/203307 [25:20:56<205:36:04,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22316/203307 [25:21:01<205:36:03,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22316/203307 [25:21:01<205:36:03,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22317/203307 [25:21:04<205:35:55,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22317/203307 [25:21:04<205:35:55,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22318/203307 [25:21:09<205:35:52,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22318/203307 [25:21:09<205:35:52,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22319/203307 [25:21:13<205:35:49,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22319/203307 [25:21:13<205:35:49,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22320/203307 [25:21:17<205:35:41,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22320/203307 [25:21:17<205:35:41,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22321/203307 [25:21:20<205:35:34,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  11%|█         | 22321/203307 [25:21:20<205:35:34,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22322/203307 [25:21:24<205:35:27,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22322/203307 [25:21:24<205:35:27,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22323/203307 [25:21:28<205:35:26,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22323/203307 [25:21:28<205:35:26,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22324/203307 [25:21:33<205:35:26,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22324/203307 [25:21:33<205:35:26,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22325/203307 [25:21:37<205:35:19,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22325/203307 [25:21:37<205:35:20,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22326/203307 [25:21:41<205:35:16,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22326/203307 [25:21:41<205:35:16,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22327/203307 [25:21:45<205:35:14,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22327/203307 [25:21:45<205:35:14,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22328/203307 [25:21:50<205:35:10,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22328/203307 [25:21:50<205:35:10,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22329/203307 [25:21:53<205:35:03,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22329/203307 [25:21:53<205:35:03,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22330/203307 [25:21:57<205:34:56,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22330/203307 [25:21:57<205:34:56,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22331/203307 [25:22:01<205:34:55,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22331/203307 [25:22:01<205:34:55,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22332/203307 [25:22:05<205:34:48,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22332/203307 [25:22:05<205:34:48,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22333/203307 [25:22:10<205:34:46,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22333/203307 [25:22:10<205:34:46,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22334/203307 [25:22:13<205:34:39,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22334/203307 [25:22:13<205:34:39,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22335/203307 [25:22:17<205:34:36,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22335/203307 [25:22:17<205:34:36,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22336/203307 [25:22:22<205:34:34,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22336/203307 [25:22:22<205:34:34,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22337/203307 [25:22:26<205:34:31,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22337/203307 [25:22:26<205:34:31,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22338/203307 [25:22:30<205:34:24,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22338/203307 [25:22:30<205:34:24,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22339/203307 [25:22:34<205:34:18,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22339/203307 [25:22:34<205:34:18,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22340/203307 [25:22:38<205:34:17,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22340/203307 [25:22:38<205:34:17,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22341/203307 [25:22:42<205:34:15,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22341/203307 [25:22:42<205:34:15,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22342/203307 [25:22:47<205:34:13,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22342/203307 [25:22:47<205:34:13,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22343/203307 [25:22:51<205:34:10,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22343/203307 [25:22:51<205:34:10,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22344/203307 [25:22:55<205:34:03,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22344/203307 [25:22:55<205:34:03,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22345/203307 [25:22:59<205:34:01,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22345/203307 [25:22:59<205:34:01,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22346/203307 [25:23:03<205:33:55,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22346/203307 [25:23:03<205:33:55,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22347/203307 [25:23:07<205:33:48,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22347/203307 [25:23:07<205:33:48,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22348/203307 [25:23:10<205:33:41,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22348/203307 [25:23:10<205:33:41,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22349/203307 [25:23:15<205:33:41,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22349/203307 [25:23:15<205:33:41,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22350/203307 [25:23:19<205:33:40,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22350/203307 [25:23:19<205:33:40,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22351/203307 [25:23:24<205:33:37,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22351/203307 [25:23:24<205:33:37,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22352/203307 [25:23:27<205:33:30,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22352/203307 [25:23:27<205:33:30,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22353/203307 [25:23:32<205:33:28,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22353/203307 [25:23:32<205:33:28,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22354/203307 [25:23:36<205:33:25,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22354/203307 [25:23:36<205:33:25,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22355/203307 [25:23:40<205:33:18,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22355/203307 [25:23:40<205:33:18,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22356/203307 [25:23:43<205:33:11,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22356/203307 [25:23:43<205:33:11,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22357/203307 [25:23:48<205:33:10,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22357/203307 [25:23:48<205:33:10,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22358/203307 [25:23:52<205:33:08,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22358/203307 [25:23:52<205:33:08,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22359/203307 [25:23:57<205:33:06,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22359/203307 [25:23:57<205:33:06,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22360/203307 [25:24:01<205:33:03,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22360/203307 [25:24:01<205:33:03,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22361/203307 [25:24:04<205:32:56,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  11%|█         | 22361/203307 [25:24:04<205:32:56,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22362/203307 [25:24:09<205:32:53,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22362/203307 [25:24:09<205:32:53,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22363/203307 [25:24:13<205:32:50,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22363/203307 [25:24:13<205:32:50,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22364/203307 [25:24:17<205:32:42,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22364/203307 [25:24:17<205:32:42,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22365/203307 [25:24:20<205:32:36,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22365/203307 [25:24:20<205:32:36,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22366/203307 [25:24:25<205:32:35,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22366/203307 [25:24:25<205:32:35,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22367/203307 [25:24:29<205:32:28,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22367/203307 [25:24:29<205:32:28,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22368/203307 [25:24:33<205:32:27,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22368/203307 [25:24:33<205:32:27,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22369/203307 [25:24:37<205:32:24,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22369/203307 [25:24:37<205:32:24,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22370/203307 [25:24:41<205:32:17,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22370/203307 [25:24:41<205:32:17,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22371/203307 [25:24:45<205:32:15,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22371/203307 [25:24:45<205:32:15,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22372/203307 [25:24:49<205:32:08,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22372/203307 [25:24:49<205:32:08,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22373/203307 [25:24:53<205:32:00,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22373/203307 [25:24:53<205:32:00,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22374/203307 [25:24:57<205:31:58,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22374/203307 [25:24:57<205:31:58,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22375/203307 [25:25:02<205:31:57,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22375/203307 [25:25:02<205:31:57,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22376/203307 [25:25:06<205:31:55,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22376/203307 [25:25:06<205:31:55,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22377/203307 [25:25:10<205:31:52,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22377/203307 [25:25:10<205:31:52,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22378/203307 [25:25:14<205:31:45,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22378/203307 [25:25:14<205:31:45,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22379/203307 [25:25:18<205:31:42,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22379/203307 [25:25:18<205:31:42,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22380/203307 [25:25:22<205:31:40,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22380/203307 [25:25:22<205:31:40,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22381/203307 [25:25:26<205:31:32,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  11%|█         | 22381/203307 [25:25:26<205:31:32,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22382/203307 [25:25:30<205:31:24,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22382/203307 [25:25:30<205:31:24,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22383/203307 [25:25:34<205:31:23,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22383/203307 [25:25:34<205:31:23,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22384/203307 [25:25:38<205:31:16,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22384/203307 [25:25:38<205:31:16,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22385/203307 [25:25:42<205:31:14,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22385/203307 [25:25:42<205:31:14,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22386/203307 [25:25:46<205:31:07,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22386/203307 [25:25:46<205:31:08,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22387/203307 [25:25:50<205:31:04,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22387/203307 [25:25:50<205:31:04,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22388/203307 [25:25:55<205:31:03,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22388/203307 [25:25:55<205:31:03,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22389/203307 [25:25:59<205:31:00,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22389/203307 [25:25:59<205:31:00,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22390/203307 [25:26:03<205:30:53,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22390/203307 [25:26:03<205:30:53,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22391/203307 [25:26:07<205:30:51,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22391/203307 [25:26:07<205:30:51,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22392/203307 [25:26:11<205:30:49,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22392/203307 [25:26:11<205:30:49,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22393/203307 [25:26:16<205:30:46,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22393/203307 [25:26:16<205:30:46,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22394/203307 [25:26:20<205:30:45,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22394/203307 [25:26:20<205:30:45,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22395/203307 [25:26:24<205:30:37,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22395/203307 [25:26:24<205:30:37,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22396/203307 [25:26:28<205:30:33,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22396/203307 [25:26:28<205:30:33,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22397/203307 [25:26:32<205:30:32,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22397/203307 [25:26:32<205:30:32,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22398/203307 [25:26:36<205:30:25,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22398/203307 [25:26:36<205:30:25,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22399/203307 [25:26:40<205:30:22,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22399/203307 [25:26:40<205:30:22,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22400/203307 [25:26:44<205:30:15,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22400/203307 [25:26:44<205:30:15,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22401/203307 [25:26:48<205:30:13,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  11%|█         | 22401/203307 [25:26:48<205:30:13,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22402/203307 [25:26:53<205:30:11,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22402/203307 [25:26:53<205:30:11,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22403/203307 [25:26:56<205:30:04,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22403/203307 [25:26:56<205:30:04,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22404/203307 [25:27:00<205:30:01,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22404/203307 [25:27:00<205:30:01,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22405/203307 [25:27:05<205:29:58,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22405/203307 [25:27:05<205:29:59,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22406/203307 [25:27:09<205:29:56,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22406/203307 [25:27:09<205:29:56,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22407/203307 [25:27:13<205:29:49,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22407/203307 [25:27:13<205:29:49,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22408/203307 [25:27:17<205:29:47,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22408/203307 [25:27:17<205:29:47,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22409/203307 [25:27:22<205:29:45,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22409/203307 [25:27:22<205:29:45,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22410/203307 [25:27:26<205:29:43,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22410/203307 [25:27:26<205:29:43,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22411/203307 [25:27:30<205:29:42,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22411/203307 [25:27:30<205:29:42,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22412/203307 [25:27:34<205:29:34,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22412/203307 [25:27:34<205:29:34,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22413/203307 [25:27:38<205:29:27,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22413/203307 [25:27:38<205:29:27,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22414/203307 [25:27:42<205:29:26,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22414/203307 [25:27:42<205:29:26,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22415/203307 [25:27:46<205:29:23,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22415/203307 [25:27:46<205:29:23,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22416/203307 [25:27:51<205:29:20,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22416/203307 [25:27:51<205:29:20,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22417/203307 [25:27:54<205:29:13,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22417/203307 [25:27:54<205:29:13,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22418/203307 [25:27:59<205:29:11,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22418/203307 [25:27:59<205:29:11,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22419/203307 [25:28:02<205:29:05,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22419/203307 [25:28:02<205:29:05,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22420/203307 [25:28:07<205:29:03,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22420/203307 [25:28:07<205:29:03,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22421/203307 [25:28:11<205:28:56,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█         | 22421/203307 [25:28:11<205:28:56,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22422/203307 [25:28:14<205:28:48,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22422/203307 [25:28:14<205:28:48,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22423/203307 [25:28:19<205:28:47,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22423/203307 [25:28:19<205:28:47,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22424/203307 [25:28:23<205:28:45,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22424/203307 [25:28:23<205:28:45,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22425/203307 [25:28:27<205:28:38,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22425/203307 [25:28:27<205:28:38,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22426/203307 [25:28:31<205:28:36,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22426/203307 [25:28:31<205:28:36,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22427/203307 [25:28:35<205:28:34,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22427/203307 [25:28:35<205:28:34,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22428/203307 [25:28:40<205:28:32,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22428/203307 [25:28:40<205:28:32,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22429/203307 [25:28:43<205:28:25,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22429/203307 [25:28:43<205:28:25,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22430/203307 [25:28:47<205:28:18,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22430/203307 [25:28:47<205:28:18,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22431/203307 [25:28:52<205:28:16,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22431/203307 [25:28:52<205:28:16,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22432/203307 [25:28:56<205:28:13,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22432/203307 [25:28:56<205:28:13,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22433/203307 [25:29:00<205:28:09,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22433/203307 [25:29:00<205:28:09,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22434/203307 [25:29:04<205:28:01,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22434/203307 [25:29:04<205:28:01,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22435/203307 [25:29:08<205:28:00,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22435/203307 [25:29:08<205:28:00,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22436/203307 [25:29:12<205:27:53,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22436/203307 [25:29:12<205:27:53,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22437/203307 [25:29:16<205:27:52,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22437/203307 [25:29:16<205:27:52,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22438/203307 [25:29:20<205:27:45,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22438/203307 [25:29:20<205:27:45,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22439/203307 [25:29:24<205:27:38,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22439/203307 [25:29:24<205:27:38,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22440/203307 [25:29:28<205:27:36,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22440/203307 [25:29:28<205:27:36,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22441/203307 [25:29:32<205:27:34,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  11%|█         | 22441/203307 [25:29:32<205:27:34,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22442/203307 [25:29:36<205:27:27,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22442/203307 [25:29:36<205:27:27,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22443/203307 [25:29:40<205:27:24,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22443/203307 [25:29:40<205:27:24,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22444/203307 [25:29:45<205:27:23,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22444/203307 [25:29:45<205:27:23,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22445/203307 [25:29:48<205:27:15,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22445/203307 [25:29:48<205:27:15,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22446/203307 [25:29:53<205:27:14,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22446/203307 [25:29:53<205:27:14,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22447/203307 [25:29:57<205:27:07,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22447/203307 [25:29:57<205:27:07,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22448/203307 [25:30:00<205:26:59,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22448/203307 [25:30:00<205:26:59,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22449/203307 [25:30:05<205:26:58,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22449/203307 [25:30:05<205:26:58,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22450/203307 [25:30:09<205:26:54,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22450/203307 [25:30:09<205:26:54,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22451/203307 [25:30:13<205:26:50,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22451/203307 [25:30:13<205:26:50,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22452/203307 [25:30:17<205:26:43,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22452/203307 [25:30:17<205:26:43,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22453/203307 [25:30:21<205:26:42,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22453/203307 [25:30:21<205:26:42,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22454/203307 [25:30:25<205:26:40,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22454/203307 [25:30:25<205:26:40,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22455/203307 [25:30:29<205:26:33,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22455/203307 [25:30:29<205:26:33,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22456/203307 [25:30:33<205:26:26,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22456/203307 [25:30:33<205:26:26,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22457/203307 [25:30:37<205:26:24,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22457/203307 [25:30:37<205:26:24,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22458/203307 [25:30:41<205:26:21,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22458/203307 [25:30:41<205:26:21,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22459/203307 [25:30:45<205:26:14,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22459/203307 [25:30:45<205:26:14,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22460/203307 [25:30:49<205:26:11,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22460/203307 [25:30:49<205:26:11,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22461/203307 [25:30:54<205:26:09,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█         | 22461/203307 [25:30:54<205:26:09,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22462/203307 [25:30:58<205:26:03,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22462/203307 [25:30:58<205:26:03,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22463/203307 [25:31:02<205:26:01,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22463/203307 [25:31:02<205:26:01,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22464/203307 [25:31:06<205:25:53,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22464/203307 [25:31:06<205:25:53,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22465/203307 [25:31:09<205:25:46,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22465/203307 [25:31:09<205:25:46,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22466/203307 [25:31:14<205:25:44,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22466/203307 [25:31:14<205:25:44,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22467/203307 [25:31:18<205:25:41,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22467/203307 [25:31:18<205:25:41,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22468/203307 [25:31:22<205:25:38,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22468/203307 [25:31:22<205:25:38,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22469/203307 [25:31:26<205:25:32,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22469/203307 [25:31:26<205:25:32,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22470/203307 [25:31:30<205:25:31,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22470/203307 [25:31:30<205:25:31,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22471/203307 [25:31:34<205:25:24,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22471/203307 [25:31:34<205:25:24,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22472/203307 [25:31:39<205:25:23,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22472/203307 [25:31:39<205:25:23,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22473/203307 [25:31:42<205:25:16,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22473/203307 [25:31:42<205:25:16,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22474/203307 [25:31:47<205:25:14,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22474/203307 [25:31:47<205:25:14,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22475/203307 [25:31:51<205:25:11,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22475/203307 [25:31:51<205:25:11,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22476/203307 [25:31:55<205:25:09,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22476/203307 [25:31:55<205:25:09,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22477/203307 [25:31:59<205:25:05,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22477/203307 [25:31:59<205:25:05,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22478/203307 [25:32:03<205:24:58,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22478/203307 [25:32:03<205:24:58,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22479/203307 [25:32:08<205:24:57,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22479/203307 [25:32:08<205:24:57,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22480/203307 [25:32:12<205:24:55,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22480/203307 [25:32:12<205:24:55,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22481/203307 [25:32:16<205:24:48,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  11%|█         | 22481/203307 [25:32:16<205:24:48,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22482/203307 [25:32:19<205:24:40,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22482/203307 [25:32:19<205:24:40,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22483/203307 [25:32:24<205:24:40,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22483/203307 [25:32:24<205:24:40,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22484/203307 [25:32:28<205:24:38,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22484/203307 [25:32:28<205:24:38,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22485/203307 [25:32:32<205:24:35,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22485/203307 [25:32:32<205:24:35,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22486/203307 [25:32:36<205:24:29,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22486/203307 [25:32:36<205:24:29,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22487/203307 [25:32:41<205:24:27,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22487/203307 [25:32:41<205:24:27,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22488/203307 [25:32:44<205:24:20,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22488/203307 [25:32:44<205:24:20,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22489/203307 [25:32:49<205:24:19,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22489/203307 [25:32:49<205:24:19,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22490/203307 [25:32:53<205:24:12,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22490/203307 [25:32:53<205:24:12,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22491/203307 [25:32:57<205:24:09,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22491/203307 [25:32:57<205:24:09,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22492/203307 [25:33:01<205:24:07,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22492/203307 [25:33:01<205:24:07,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22493/203307 [25:33:05<205:24:04,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22493/203307 [25:33:05<205:24:04,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22494/203307 [25:33:09<205:23:57,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22494/203307 [25:33:09<205:23:57,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22495/203307 [25:33:13<205:23:53,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22495/203307 [25:33:13<205:23:53,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22496/203307 [25:33:18<205:23:52,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22496/203307 [25:33:18<205:23:52,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22497/203307 [25:33:21<205:23:45,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22497/203307 [25:33:21<205:23:45,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22498/203307 [25:33:26<205:23:44,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22498/203307 [25:33:26<205:23:44,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22499/203307 [25:33:30<205:23:40,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22499/203307 [25:33:30<205:23:40,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22500/203307 [25:33:34<205:23:34,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22500/203307 [25:33:34<205:23:34,  0.24it/s, v_num=t5e6, training/loss=0.0851]
Validation: |          | 0/? [00:00<?, ?it/s][A
Validation:   0%|          | 0/1 [00:00<?, ?it/s][A


Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s][A[A

Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:25,  1.16it/s][A[A

Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:24,  1.17it/s][A[A

Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:23,  1.17it/s][A[A

Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:22,  1.17it/s][A[A

Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:21,  1.16it/s][A[A

Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:21,  1.16it/s][A[A

Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:20,  1.15it/s][A[A

Sampling (mamba memory):  54%|█████▍    | 108/200 [00:06<01:19,  1.15it/s][A[A

Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:19,  1.15it/s][A[A

Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:18,  1.15it/s][A[A

Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:25,  1.16it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:24,  1.16it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:24,  1.15it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:23,  1.15it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:22,  1.15it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:22,  1.14it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:21,  1.14it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:06<01:20,  1.14it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:20,  1.14it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:19,  1.13it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:18,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:27,  1.14it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:26,  1.14it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:25,  1.13it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:25,  1.13it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:24,  1.13it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:23,  1.13it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:22,  1.12it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:21,  1.13it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:20,  1.14it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:19,  1.13it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:18,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:27,  1.13it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:26,  1.14it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:25,  1.13it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:24,  1.13it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:24,  1.13it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:23,  1.13it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:22,  1.12it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:21,  1.13it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:20,  1.13it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:20,  1.12it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:19,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:29,  1.11it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:27,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:26,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:25,  1.12it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:24,  1.12it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:23,  1.12it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:23,  1.11it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:22,  1.12it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:21,  1.12it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:20,  1.12it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:19,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:29,  1.11it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:27,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:26,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:25,  1.12it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:25,  1.12it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:23,  1.12it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:23,  1.12it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:22,  1.12it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:22,  1.11it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:21,  1.11it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:20,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:29,  1.11it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:28,  1.11it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:27,  1.10it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:27,  1.10it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:26,  1.10it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:25,  1.10it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:24,  1.10it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:23,  1.10it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:21,  1.11it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:09<01:21,  1.10it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:10<01:21,  1.0Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:30,  1.09it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:29,  1.10it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:28,  1.10it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:27,  1.10it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:26,  1.09it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:25,  1.10it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:25,  1.09it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:24,  1.09it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:23,  1.08it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:09<01:23,  1.08it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:10<01:22,  1.0Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:17,  1.14it/s][A[A

Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:17,  1.14it/s][A[A

Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:16,  1.14it/s][A[A

Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:15,  1.14it/s][A[A

Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:14,  1.14it/s][A[A

Sampling (mamba memory):  58%|█████▊    | 116/200 [00:13<01:13,  1.14it/s][A[A

Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:12,  1.14it/s][A[A

Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:12,  1.14it/s][A[A

Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:11,  1.13it/s][A[A

Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:11,  1.13it/s][A[A

Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:10,  1.13it/s][A[A

Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:09,  1.13it/s][A[A

3it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:18,  1.13it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:17,  1.13it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:16,  1.13it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:15,  1.13it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:14,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:13,  1.12it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:13,  1.12it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:12,  1.12it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:11,  1.12it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:10,  1.12it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:10,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 123/3it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:17,  1.13it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:16,  1.13it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:15,  1.13it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:15,  1.13it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:14,  1.13it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:13,  1.13it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:12,  1.13it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:12,  1.12it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:11,  1.12it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:10,  1.12it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:10,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 123/2it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:18,  1.12it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:17,  1.12it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:16,  1.12it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:15,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:15,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:14,  1.12it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:13,  1.11it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:12,  1.11it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:12,  1.11it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:11,  1.11it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:10,  1.10it/s]Sampling (mamba memory):  62%|██████▏   | 123/2it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:18,  1.11it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:18,  1.11it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:17,  1.11it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:16,  1.11it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:15,  1.11it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:14,  1.11it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:13,  1.11it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:13,  1.10it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:12,  1.10it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:12,  1.10it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:11,  1.10it/s]Sampling (mamba memory):  62%|██████▏   | 123/0it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:19,  1.10it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:19,  1.10it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:18,  1.10it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:17,  1.10it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:16,  1.10it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:15,  1.10it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:14,  1.10it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:14,  1.09it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:13,  1.09it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:19<01:12,  1.09it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:11,  1.09it/s]Sampling (mamba memory):  62%|██████▏   | 123/Sampling (mamba memory):  62%|██████▏   | 123/200 [00:20<01:08,  1.12it/s][A[A

9it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:20,  1.09it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:19,  1.09it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:19,  1.09it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:17,  1.09it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:17,  1.09it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:16,  1.09it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:15,  1.08it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:14,  1.08it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:14,  1.08it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:19<01:13,  1.07it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:20<01:12,  1.07it/s]Sampling (mamba memory):  62%|██████▏   | 123/8it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:11<01:21,  1.08it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:20,  1.08it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:20,  1.07it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:19,  1.07it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:18,  1.07it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:17,  1.07it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:16,  1.07it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:16,  1.06it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:15,  1.06it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:19<01:14,  1.06it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:20<01:13,  1.06it/s]Sampling (mamba memory):  62%|██████▏   | 123/Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:07,  1.12it/s][A[A

Sampling (mamba memory):  62%|██████▎   | 125/200 [00:21<01:06,  1.12it/s][A[A

Sampling (mamba memory):  63%|██████▎   | 126/200 [00:22<01:06,  1.12it/s][A[A

Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:05,  1.12it/s][A[A

Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:04,  1.12it/s][A[A

Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:03,  1.12it/s][A[A

Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:02,  1.12it/s][A[A

Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:01,  1.12it/s][A[A

Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:01,  1.11it/s][A[A

Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:00,  1.11it/s][A[A

Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<00:59,  1.10it/s][A[A

200 [00:20<01:09,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:08,  1.11it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:07,  1.10it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:07,  1.10it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:06,  1.10it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:05,  1.10it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:04,  1.10it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:03,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:03,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:02,  1.09it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:01,  1.09it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:00,  1.09it/s]Sampling (mamba 200 [00:20<01:09,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:08,  1.11it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:08,  1.10it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:07,  1.10it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:06,  1.10it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:05,  1.10it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:04,  1.10it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:03,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:03,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:02,  1.09it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:01,  1.09it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:00,  1.09it/s]Sampling (mamba 200 [00:20<01:10,  1.10it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:09,  1.09it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:08,  1.09it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:07,  1.09it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:06,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:05,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:04,  1.09it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:04,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:03,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:02,  1.09it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:01,  1.09it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:00,  1.08it/s]Sampling (mamba 200 [00:20<01:10,  1.10it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:09,  1.10it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:08,  1.10it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:07,  1.10it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:06,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:05,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:04,  1.09it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:04,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:03,  1.08it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:03,  1.08it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:02,  1.08it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:01,  1.07it/s]Sampling (mamba Sampling (mamba memory):  68%|██████▊   | 135/200 [00:30<00:58,  1.11it/s][A[A

200 [00:20<01:10,  1.09it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:10,  1.09it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:09,  1.08it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:08,  1.07it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:07,  1.08it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:06,  1.08it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:05,  1.08it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:05,  1.08it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:04,  1.07it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:03,  1.07it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:02,  1.07it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<01:01,  1.07it/s]Sampling (mamba 200 [00:21<01:11,  1.07it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:22<01:11,  1.07it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:23<01:10,  1.07it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:09,  1.07it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:08,  1.07it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:07,  1.07it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:06,  1.07it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:05,  1.07it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:04,  1.07it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:03,  1.06it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:03,  1.06it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<01:02,  1.06it/s]Sampling (mamba Sampling (mamba memory):  68%|██████▊   | 136/200 [00:31<00:57,  1.11it/s][A[A

200 [00:21<01:12,  1.06it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:22<01:11,  1.06it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:23<01:11,  1.05it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:24<01:10,  1.05it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:25<01:09,  1.05it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:26<01:08,  1.05it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:27<01:07,  1.05it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:28<01:07,  1.04it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:29<01:06,  1.04it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:30<01:05,  1.04it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:04,  1.04it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<01:03,  1.04it/s]Sampling (mamba Sampling (mamba memory):  68%|██████▊   | 137/200 [00:32<00:56,  1.11it/s][A[A

Sampling (mamba memory):  69%|██████▉   | 138/200 [00:33<00:55,  1.11it/s][A[A

Sampling (mamba memory):  70%|██████▉   | 139/200 [00:34<00:55,  1.11it/s][A[A

Sampling (mamba memory):  70%|███████   | 140/200 [00:35<00:54,  1.10it/s][A[A

Sampling (mamba memory):  70%|███████   | 141/200 [00:36<00:53,  1.10it/s][A[A

Sampling (mamba memory):  71%|███████   | 142/200 [00:37<00:52,  1.10it/s][A[A

Sampling (mamba memory):  72%|███████▏  | 143/200 [00:38<00:51,  1.10it/s][A[A

Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:51,  1.09it/s][A[A

Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:50,  1.09it/s][A[A

memory):  68%|██████▊   | 135/200 [00:31<00:59,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:58,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:57,  1.09it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:57,  1.09it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:56,  1.08it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:55,  1.08it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:36<00:54,  1.08it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:37<00:53,  1.08it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:38<00:52,  1.08it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:51,  1.08it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:51,  1.07it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:31<00:59,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:58,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:57,  1.09it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:56,  1.09it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:56,  1.09it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:55,  1.08it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:36<00:54,  1.08it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:37<00:53,  1.08it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:38<00:52,  1.08it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:52,  1.07it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:51,  1.06it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  73%|███████▎  | 146/200 [00:40<00:49,  1.08it/s][A[A

memory):  68%|██████▊   | 135/200 [00:31<01:00,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:59,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:58,  1.08it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:57,  1.08it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:56,  1.08it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:55,  1.08it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:54,  1.07it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:54,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:53,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:52,  1.07it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:51,  1.07it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:31<01:00,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:59,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:58,  1.07it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:57,  1.07it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:56,  1.08it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:56,  1.07it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:54,  1.07it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:54,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:53,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:52,  1.06it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:51,  1.06it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:32<01:01,  1.06it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:33<01:00,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:59,  1.06it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:58,  1.06it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:57,  1.05it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:56,  1.05it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:56,  1.05it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:55,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:54,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:53,  1.05it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:52,  1.05it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▎  | 147/200 [00:41<00:49,  1.08it/s][A[A

memory):  68%|██████▊   | 135/200 [00:32<01:01,  1.06it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:33<01:00,  1.06it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:34<00:59,  1.06it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:35<00:58,  1.06it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:36<00:58,  1.05it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:37<00:57,  1.05it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:38<00:56,  1.05it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:39<00:55,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:40<00:54,  1.04it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:41<00:53,  1.04it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:52,  1.04it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:32<01:02,  1.04it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:33<01:01,  1.04it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:34<01:00,  1.04it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:35<00:59,  1.03it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:36<00:59,  1.03it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:37<00:58,  1.03it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:38<00:57,  1.03it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:39<00:56,  1.03it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:40<00:55,  1.02it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:41<00:54,  1.02it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:42<00:53,  1.02it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▍  | 148/200 [00:42<00:48,  1.08it/s][A[A

Sampling (mamba memory):  74%|███████▍  | 149/200 [00:43<00:47,  1.08it/s][A[A

Sampling (mamba memory):  75%|███████▌  | 150/200 [00:44<00:46,  1.08it/s][A[A

Sampling (mamba memory):  76%|███████▌  | 151/200 [00:45<00:45,  1.07it/s][A[A

Sampling (mamba memory):  76%|███████▌  | 152/200 [00:46<00:44,  1.07it/s][A[A

Sampling (mamba memory):  76%|███████▋  | 153/200 [00:47<00:43,  1.07it/s][A[A

Sampling (mamba memory):  77%|███████▋  | 154/200 [00:48<00:42,  1.07it/s][A[A

Sampling (mamba memory):  78%|███████▊  | 155/200 [00:49<00:41,  1.08it/s][A[A

Sampling (mamba memory):  78%|███████▊  | 156/200 [00:50<00:40,  1.08it/s][A[A

 | 146/200 [00:41<00:50,  1.07it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:49,  1.07it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:48,  1.07it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:47,  1.07it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:46,  1.07it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:46,  1.06it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:45,  1.06it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:44,  1.06it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:43,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:42,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:41,  1.07it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:51<00:40 | 146/200 [00:41<00:51,  1.06it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:50,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:48,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:47,  1.06it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:46,  1.07it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:45,  1.07it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:45,  1.06it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:44,  1.06it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:43,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:42,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:41,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:40Sampling (mamba memory):  78%|███████▊  | 157/200 [00:51<00:40,  1.07it/s][A[A

 | 146/200 [00:41<00:50,  1.06it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:49,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:48,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:48,  1.06it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:47,  1.06it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:46,  1.06it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:45,  1.06it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:44,  1.05it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:43,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:42,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:41,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:41 | 146/200 [00:42<00:50,  1.06it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:50,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:49,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:48,  1.05it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:47,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:46,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:45,  1.04it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:45,  1.04it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:44,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:43,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:42,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:41Sampling (mamba memory):  79%|███████▉  | 158/200 [00:52<00:39,  1.07it/s][A[A

 | 146/200 [00:42<00:51,  1.04it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:50,  1.04it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:49,  1.04it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:49,  1.04it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:48,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:47,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:48<00:46,  1.03it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:49<00:45,  1.03it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:50<00:44,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:51<00:43,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:52<00:42,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:53<00:41 | 146/200 [00:42<00:52,  1.04it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:51,  1.03it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:50,  1.03it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:49,  1.03it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:48,  1.03it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:47,  1.03it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:48<00:46,  1.03it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:49<00:45,  1.03it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:50<00:44,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:51<00:43,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:52<00:42,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:53<00:41Sampling (mamba memory):  80%|███████▉  | 159/200 [00:53<00:38,  1.07it/s][A[A

 | 146/200 [00:43<00:53,  1.02it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:44<00:52,  1.02it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:45<00:51,  1.01it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:46<00:50,  1.01it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:47<00:49,  1.01it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:48<00:48,  1.01it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:49<00:47,  1.01it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:50<00:46,  1.01it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:51<00:45,  1.00it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:52<00:44,  1.00it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:53<00:43,  1.00it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:54<00:42Sampling (mamba memory):  80%|████████  | 160/200 [00:54<00:37,  1.07it/s][A[A

Sampling (mamba memory):  80%|████████  | 161/200 [00:54<00:36,  1.07it/s][A[A

Sampling (mamba memory):  81%|████████  | 162/200 [00:55<00:35,  1.07it/s][A[A

Sampling (mamba memory):  82%|████████▏ | 163/200 [00:56<00:34,  1.07it/s][A[A

Sampling (mamba memory):  82%|████████▏ | 164/200 [00:57<00:33,  1.07it/s][A[A

Sampling (mamba memory):  82%|████████▎ | 165/200 [00:58<00:32,  1.07it/s][A[A

Sampling (mamba memory):  83%|████████▎ | 166/200 [00:59<00:31,  1.07it/s][A[A

Sampling (mamba memory):  84%|████████▎ | 167/200 [01:00<00:31,  1.06it/s][A[A

,  1.06it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:52<00:39,  1.06it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:53<00:38,  1.06it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:54<00:37,  1.06it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:55<00:36,  1.05it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:56<00:36,  1.05it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:57<00:35,  1.05it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:58<00:34,  1.05it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [00:59<00:33,  1.05it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:00<00:32,  1.05it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:01<00:31,  1.05it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:02<00:30,  1.05it/sSampling (mamba memory):  84%|████████▍ | 168/200 [01:01<00:30,  1.05it/s][A[A

,  1.06it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:52<00:39,  1.06it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:53<00:38,  1.06it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:54<00:37,  1.06it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:55<00:36,  1.06it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:56<00:35,  1.06it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:57<00:35,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:58<00:34,  1.04it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [00:59<00:33,  1.04it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:00<00:32,  1.04it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:01<00:31,  1.03it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:02<00:31,  1.03it/s,  1.05it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:53<00:40,  1.05it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:54<00:39,  1.04it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:55<00:38,  1.04it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:56<00:37,  1.04it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:57<00:36,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:35,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:34,  1.03it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:33,  1.03it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:32,  1.03it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:02<00:32,  1.03it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:03<00:31,  1.02it/s,  1.04it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:53<00:40,  1.04it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:54<00:39,  1.04it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:55<00:38,  1.04it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:56<00:37,  1.04it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:57<00:36,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:35,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:34,  1.03it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:33,  1.03it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:33,  1.03it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:02<00:32,  1.03it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:03<00:31,  1.02it/sSampling (mamba memory):  84%|████████▍ | 169/200 [01:02<00:29,  1.05it/s][A[A

,  1.03it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:54<00:40,  1.03it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:55<00:39,  1.03it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:56<00:38,  1.03it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:57<00:37,  1.03it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:58<00:36,  1.03it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:59<00:36,  1.03it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:00<00:35,  1.02it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:01<00:34,  1.02it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:02<00:33,  1.02it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:03<00:32,  1.01it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:04<00:31,  1.01it/sSampling (mamba memory):  85%|████████▌ | 170/200 [01:03<00:28,  1.04it/s][A[A

,  1.03it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:54<00:40,  1.03it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:55<00:39,  1.03it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:56<00:39,  1.02it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:57<00:38,  1.02it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:58<00:37,  1.01it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:59<00:36,  1.01it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:00<00:35,  1.01it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:01<00:34,  1.00it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:02<00:33,  1.00it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:03<00:32,  1.00it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:04<00:32,  1.01s/itSampling (mamba memory):  86%|████████▌ | 171/200 [01:04<00:27,  1.04it/s][A[A

,  1.00it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:55<00:41,  1.00it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:56<00:40,  1.00it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:57<00:39,  1.00it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:58<00:39,  1.00s/it]Sampling (mamba memory):  81%|████████  | 162/200 [00:59<00:38,  1.00s/it]Sampling (mamba memory):  82%|████████▏ | 163/200 [01:00<00:37,  1.01s/it]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:01<00:36,  1.01s/it]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:02<00:35,  1.02s/it]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:03<00:34,  1.02s/it]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:04<00:33,  1.02s/it]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:05<00:32,  1.03s/itSampling (mamba memory):  86%|████████▌ | 172/200 [01:05<00:26,  1.04it/s][A[A

Sampling (mamba memory):  86%|████████▋ | 173/200 [01:06<00:26,  1.04it/s][A[A

Sampling (mamba memory):  87%|████████▋ | 174/200 [01:07<00:25,  1.03it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 175/200 [01:08<00:24,  1.04it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 176/200 [01:09<00:23,  1.04it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 177/200 [01:10<00:22,  1.05it/s][A[A

Sampling (mamba memory):  89%|████████▉ | 178/200 [01:11<00:21,  1.05it/s][A[A

Sampling (mamba memory):  90%|████████▉ | 179/200 [01:12<00:20,  1.05it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:03<00:29,  1.04it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:04<00:28,  1.04it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:05<00:27,  1.04it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:06<00:27,  1.03it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:07<00:26,  1.03it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:08<00:25,  1.03it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:09<00:24,  1.03it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:10<00:23,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:11<00:22,  1.02it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:12<00:21,  1.02it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:13<00:20,  1.01it/s]]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:03<00:30,  1.03it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:04<00:29,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:05<00:28,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:06<00:27,  1.02it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:07<00:26,  1.02it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:08<00:25,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:09<00:24,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:10<00:23,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:11<00:22,  1.01it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:12<00:21,  1.01it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:13<00:20,  1.01it/s]]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:04<00:30,  1.02it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:04<00:29,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:05<00:28,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:06<00:27,  1.02it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:07<00:26,  1.02it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:08<00:25,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:09<00:24,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:10<00:23,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:11<00:22,  1.02it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:12<00:21,  1.02it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:13<00:20,  1.02it/s]Sampling (mamba memory):  90%|█████████ | 180/200 [01:13<00:19,  1.04it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:04<00:30,  1.02it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:05<00:29,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:06<00:28,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:07<00:27,  1.02it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:08<00:26,  1.02it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:09<00:25,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:10<00:24,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:11<00:23,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:12<00:22,  1.01it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:13<00:21,  1.01it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:14<00:20,  1.01it/s]]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:05<00:30,  1.01it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:06<00:29,  1.00it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:07<00:28,  1.00it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:08<00:27,  1.00it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:09<00:26,  1.00it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:10<00:25,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:11<00:24,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:12<00:23,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:13<00:22,  1.00it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:14<00:22,  1.00s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:15<00:21,  1.00s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:14<00:18,  1.04it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:05<00:31,  1.01s/it]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:06<00:30,  1.01s/it]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:07<00:29,  1.01s/it]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:08<00:28,  1.01s/it]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:09<00:27,  1.01s/it]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:10<00:26,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:11<00:25,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:12<00:24,  1.02s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:13<00:23,  1.02s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:14<00:22,  1.02s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:15<00:21,  1.02s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:15<00:17,  1.04it/s][A[A

Sampling (mamba memory):  92%|█████████▏| 183/200 [01:16<00:16,  1.04it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:06<00:31,  1.03s/it]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:07<00:30,  1.03s/it]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:08<00:30,  1.03s/it]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:09<00:28,  1.03s/it]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:10<00:27,  1.03s/it]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:11<00:26,  1.03s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:13<00:25,  1.04s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:14<00:24,  1.04s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:15<00:23,  1.04s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:16<00:22,  1.04s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:17<00:21,  1.04s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:16<00:15,  1.03it/s][A[A

Sampling (mamba memory):  92%|█████████▎| 185/200 [01:17<00:14,  1.03it/s][A[A

Sampling (mamba memory):  93%|█████████▎| 186/200 [01:18<00:13,  1.03it/s][A[A

Sampling (mamba memory):  94%|█████████▎| 187/200 [01:19<00:12,  1.03it/s][A[A

Sampling (mamba memory):  94%|█████████▍| 188/200 [01:20<00:11,  1.03it/s][A[A

Sampling (mamba memory):  94%|█████████▍| 189/200 [01:21<00:10,  1.03it/s][A[A

Sampling (mamba memory):  95%|█████████▌| 190/200 [01:22<00:09,  1.03it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:14<00:19,  1.01it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:15<00:18,  1.01it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:16<00:17,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:17<00:16,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:18<00:15,  1.01it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:19<00:14,  1.01it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:20<00:13,  1.01it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:21<00:12,  1.01it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:22<00:11,  1.01it/s]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:23<00:10,  1.01it/s]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:24<00Sampling (mamba memory):  90%|█████████ | 180/200 [01:14<00:19,  1.01it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:15<00:18,  1.00it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:16<00:17,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:17<00:16,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:18<00:15,  1.02it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:19<00:14,  1.02it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:20<00:13,  1.01it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:21<00:12,  1.01it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:22<00:11,  1.01it/s]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:23<00:10,  1.01it/s]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:24<00Sampling (mamba memory):  90%|█████████ | 180/200 [01:14<00:19,  1.01it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:15<00:18,  1.01it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:16<00:17,  1.02it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:17<00:16,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:18<00:15,  1.01it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:19<00:14,  1.01it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:20<00:13,  1.01it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:21<00:12,  1.01it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:22<00:11,  1.01it/s]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:23<00:10,  1.00it/s]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:24<00Sampling (mamba memory):  96%|█████████▌| 191/200 [01:23<00:08,  1.03it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:15<00:19,  1.01it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:16<00:18,  1.00it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:17<00:17,  1.00it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:18<00:16,  1.00it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:19<00:16,  1.00s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:20<00:15,  1.00s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:21<00:14,  1.00s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:22<00:13,  1.00s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:23<00:12,  1.00s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:24<00:11,  1.01s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:25<00Sampling (mamba memory):  96%|█████████▌| 192/200 [01:24<00:07,  1.02it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:16<00:20,  1.00s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:17<00:19,  1.00s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:18<00:18,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:19<00:17,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:20<00:16,  1.02s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:21<00:15,  1.02s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:22<00:14,  1.02s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:23<00:13,  1.02s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:24<00:12,  1.03s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:25<00:11,  1.03s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:26<00Sampling (mamba memory):  96%|█████████▋| 193/200 [01:25<00:06,  1.02it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:16<00:20,  1.02s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:17<00:19,  1.02s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:18<00:18,  1.02s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:19<00:17,  1.02s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:20<00:16,  1.02s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:21<00:15,  1.02s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:22<00:14,  1.02s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:23<00:13,  1.03s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:25<00:12,  1.03s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:26<00:11,  1.03s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:27<00Sampling (mamba memory):  97%|█████████▋| 194/200 [01:26<00:05,  1.02it/s][A[A

Sampling (mamba memory):  98%|█████████▊| 195/200 [01:27<00:04,  1.02it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:18<00:20,  1.05s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:19<00:19,  1.05s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:20<00:18,  1.05s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:21<00:17,  1.05s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:22<00:16,  1.05s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:23<00:15,  1.05s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:24<00:14,  1.06s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:25<00:13,  1.06s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:26<00:12,  1.06s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:27<00:11,  1.06s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:28<00Sampling (mamba memory):  98%|█████████▊| 196/200 [01:28<00:03,  1.02it/s][A[A

Sampling (mamba memory):  98%|█████████▊| 197/200 [01:29<00:02,  1.01it/s][A[A

Sampling (mamba memory):  99%|█████████▉| 198/200 [01:30<00:01,  1.01it/s][A[A

Sampling (mamba memory): 100%|█████████▉| 199/200 [01:31<00:00,  1.01it/s][A[A

Sampling (mamba memory): 100%|██████████| 200/200 [01:32<00:00,  1.01it/s][A[ASampling (mamba memory): 100%|██████████| 200/200 [01:37<00:00,  1.02it/s]
Validation DataLoader 0:   0%|          | 0/1 [00:00<?, ?it/s][A
:09,  1.00it/s]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:25<00:09,  1.00s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:26<00:08,  1.00s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:27<00:07,  1.01s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:28<00:06,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:29<00:05,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:30<00:04,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:31<00:03,  1.01s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:32<00:02,  1.01s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:33<00:01,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:34<00:00,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:38<00:00,  1.01it/s]
:09,  1.01it/s]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:25<00:08,  1.00it/s]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:26<00:07,  1.00it/s]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:27<00:07,  1.00s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:28<00:06,  1.00s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:29<00:05,  1.00s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:30<00:04,  1.00s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:31<00:03,  1.01s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:32<00:02,  1.01s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:33<00:01,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:34<00:00,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:39<00:00,  1.01it/s]
:09,  1.00it/s]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:25<00:09,  1.00s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:26<00:08,  1.02s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:27<00:07,  1.02s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:28<00:06,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:29<00:05,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:30<00:04,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:31<00:03,  1.01s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:32<00:02,  1.01s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:33<00:01,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:34<00:00,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:39<00:00,  1.00it/s]
:10,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:26<00:09,  1.01s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:27<00:08,  1.01s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:28<00:07,  1.01s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:29<00:06,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:30<00:05,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:31<00:04,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:32<00:03,  1.02s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:33<00:02,  1.02s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:34<00:01,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:35<00:00,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:40<00:00,  1.00s/it]
:10,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:27<00:09,  1.04s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:28<00:08,  1.04s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:29<00:07,  1.04s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:30<00:06,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:31<00:05,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:32<00:04,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:33<00:03,  1.04s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:34<00:02,  1.04s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:35<00:01,  1.04s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:36<00:00,  1.04s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:41<00:00,  1.02s/it]
:10,  1.04s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:28<00:09,  1.04s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:29<00:08,  1.03s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:30<00:07,  1.04s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:31<00:06,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:32<00:05,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:33<00:04,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:34<00:03,  1.04s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:35<00:02,  1.03s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:36<00:01,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:37<00:00,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:42<00:00,  1.02s/it]
:10,  1.07s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:29<00:09,  1.07s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:30<00:08,  1.07s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:32<00:07,  1.07s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:33<00:06,  1.07s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:34<00:05,  1.07s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:35<00:04,  1.07s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:36<00:03,  1.07s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:37<00:02,  1.07s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:38<00:01,  1.07s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:39<00:00,  1.07s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:44<00:00,  1.04s/it]
Validation DataLoader 0: 100%|██████████| 1/1 [01:37<00:00,  0.01it/s][A
                                                                      [AEpoch 0:  11%|█         | 22500/203307 [25:35:30<205:39:04,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22501/203307 [25:35:35<205:39:07,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22501/203307 [25:35:35<205:39:07,  0.24it/s, v_num=t5e6, training/loss=0.074] Epoch 0:  11%|█         | 22502/203307 [25:35:38<205:39:01,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22502/203307 [25:35:38<205:39:01,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22503/203307 [25:35:43<205:38:58,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22503/203307 [25:35:43<205:38:58,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22504/203307 [25:35:47<205:38:58,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22504/203307 [25:35:47<205:38:58,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22505/203307 [25:35:51<205:38:51,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22505/203307 [25:35:51<205:38:51,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22506/203307 [25:35:55<205:38:45,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22506/203307 [25:35:55<205:38:45,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22507/203307 [25:35:59<205:38:44,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22507/203307 [25:35:59<205:38:44,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22508/203307 [25:36:03<205:38:35,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22508/203307 [25:36:03<205:38:35,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22509/203307 [25:36:07<205:38:29,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22509/203307 [25:36:07<205:38:29,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22510/203307 [25:36:11<205:38:28,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22510/203307 [25:36:11<205:38:28,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22511/203307 [25:36:15<205:38:25,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22511/203307 [25:36:15<205:38:25,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22512/203307 [25:36:20<205:38:22,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22512/203307 [25:36:20<205:38:22,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22513/203307 [25:36:24<205:38:21,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22513/203307 [25:36:24<205:38:21,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22514/203307 [25:36:28<205:38:13,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22514/203307 [25:36:28<205:38:13,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22515/203307 [25:36:32<205:38:12,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22515/203307 [25:36:32<205:38:12,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22516/203307 [25:36:36<205:38:10,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22516/203307 [25:36:36<205:38:10,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22517/203307 [25:36:40<205:38:02,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22517/203307 [25:36:40<205:38:03,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22518/203307 [25:36:44<205:38:00,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22518/203307 [25:36:44<205:38:00,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22519/203307 [25:36:49<205:37:57,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22519/203307 [25:36:49<205:37:57,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22520/203307 [25:36:52<205:37:50,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22520/203307 [25:36:52<205:37:50,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22521/203307 [25:36:57<205:37:48,  0.24it/s, v_num=t5e6, training/loss=0.074]Epoch 0:  11%|█         | 22521/203307 [25:36:57<205:37:48,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22522/203307 [25:37:01<205:37:41,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22522/203307 [25:37:01<205:37:41,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22523/203307 [25:37:04<205:37:34,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22523/203307 [25:37:04<205:37:34,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22524/203307 [25:37:09<205:37:33,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22524/203307 [25:37:09<205:37:33,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22525/203307 [25:37:13<205:37:30,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22525/203307 [25:37:13<205:37:30,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22526/203307 [25:37:17<205:37:23,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22526/203307 [25:37:17<205:37:23,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22527/203307 [25:37:21<205:37:22,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22527/203307 [25:37:21<205:37:22,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22528/203307 [25:37:25<205:37:15,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22528/203307 [25:37:25<205:37:15,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22529/203307 [25:37:29<205:37:08,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22529/203307 [25:37:29<205:37:08,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22530/203307 [25:37:33<205:37:07,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22530/203307 [25:37:33<205:37:07,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22531/203307 [25:37:37<205:37:00,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22531/203307 [25:37:37<205:37:00,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22532/203307 [25:37:40<205:36:52,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22532/203307 [25:37:40<205:36:53,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22533/203307 [25:37:45<205:36:53,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22533/203307 [25:37:45<205:36:53,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22534/203307 [25:37:49<205:36:46,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22534/203307 [25:37:49<205:36:46,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22535/203307 [25:37:53<205:36:39,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22535/203307 [25:37:53<205:36:39,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22536/203307 [25:37:57<205:36:36,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22536/203307 [25:37:57<205:36:36,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22537/203307 [25:38:01<205:36:29,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22537/203307 [25:38:01<205:36:29,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22538/203307 [25:38:04<205:36:21,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22538/203307 [25:38:04<205:36:22,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22539/203307 [25:38:09<205:36:21,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22539/203307 [25:38:09<205:36:21,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22540/203307 [25:38:12<205:36:14,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22540/203307 [25:38:12<205:36:14,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22541/203307 [25:38:17<205:36:13,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  11%|█         | 22541/203307 [25:38:17<205:36:13,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22542/203307 [25:38:21<205:36:11,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22542/203307 [25:38:21<205:36:11,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22543/203307 [25:38:25<205:36:04,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22543/203307 [25:38:25<205:36:04,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22544/203307 [25:38:29<205:36:01,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22544/203307 [25:38:29<205:36:01,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22545/203307 [25:38:34<205:35:59,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22545/203307 [25:38:34<205:35:59,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22546/203307 [25:38:37<205:35:51,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22546/203307 [25:38:37<205:35:52,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22547/203307 [25:38:42<205:35:50,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22547/203307 [25:38:42<205:35:50,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22548/203307 [25:38:46<205:35:46,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22548/203307 [25:38:46<205:35:46,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22549/203307 [25:38:50<205:35:39,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22549/203307 [25:38:50<205:35:39,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22550/203307 [25:38:54<205:35:38,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22550/203307 [25:38:54<205:35:38,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22551/203307 [25:38:58<205:35:35,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22551/203307 [25:38:58<205:35:35,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22552/203307 [25:39:02<205:35:27,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22552/203307 [25:39:02<205:35:27,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22553/203307 [25:39:06<205:35:25,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22553/203307 [25:39:06<205:35:25,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22554/203307 [25:39:10<205:35:18,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22554/203307 [25:39:10<205:35:18,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22555/203307 [25:39:14<205:35:11,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22555/203307 [25:39:14<205:35:11,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22556/203307 [25:39:18<205:35:10,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22556/203307 [25:39:18<205:35:10,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22557/203307 [25:39:22<205:35:06,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22557/203307 [25:39:22<205:35:06,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22558/203307 [25:39:26<205:34:59,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22558/203307 [25:39:26<205:34:59,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22559/203307 [25:39:31<205:34:59,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22559/203307 [25:39:31<205:34:59,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22560/203307 [25:39:34<205:34:52,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22560/203307 [25:39:34<205:34:52,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22561/203307 [25:39:38<205:34:45,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22561/203307 [25:39:38<205:34:45,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22562/203307 [25:39:43<205:34:43,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22562/203307 [25:39:43<205:34:43,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22563/203307 [25:39:46<205:34:36,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22563/203307 [25:39:46<205:34:36,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22564/203307 [25:39:50<205:34:29,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22564/203307 [25:39:50<205:34:29,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22565/203307 [25:39:54<205:34:28,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22565/203307 [25:39:54<205:34:28,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22566/203307 [25:39:59<205:34:25,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22566/203307 [25:39:59<205:34:25,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22567/203307 [25:40:03<205:34:23,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22567/203307 [25:40:03<205:34:23,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22568/203307 [25:40:07<205:34:20,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22568/203307 [25:40:07<205:34:20,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22569/203307 [25:40:11<205:34:13,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22569/203307 [25:40:11<205:34:13,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22570/203307 [25:40:15<205:34:11,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22570/203307 [25:40:15<205:34:11,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22571/203307 [25:40:20<205:34:09,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22571/203307 [25:40:20<205:34:09,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22572/203307 [25:40:23<205:34:02,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22572/203307 [25:40:23<205:34:02,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22573/203307 [25:40:28<205:34:00,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22573/203307 [25:40:28<205:34:00,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22574/203307 [25:40:32<205:33:53,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22574/203307 [25:40:32<205:33:53,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22575/203307 [25:40:36<205:33:49,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22575/203307 [25:40:36<205:33:49,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22576/203307 [25:40:40<205:33:48,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22576/203307 [25:40:40<205:33:48,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22577/203307 [25:40:44<205:33:45,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22577/203307 [25:40:44<205:33:45,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22578/203307 [25:40:48<205:33:37,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22578/203307 [25:40:48<205:33:37,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22579/203307 [25:40:52<205:33:35,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22579/203307 [25:40:52<205:33:35,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22580/203307 [25:40:56<205:33:27,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22580/203307 [25:40:56<205:33:27,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22581/203307 [25:41:00<205:33:21,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█         | 22581/203307 [25:41:00<205:33:21,  0.24it/s, v_num=t5e6, training/loss=0.083] Epoch 0:  11%|█         | 22582/203307 [25:41:04<205:33:20,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22582/203307 [25:41:04<205:33:20,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22583/203307 [25:41:08<205:33:13,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22583/203307 [25:41:08<205:33:13,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22584/203307 [25:41:12<205:33:10,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22584/203307 [25:41:12<205:33:10,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22585/203307 [25:41:17<205:33:08,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22585/203307 [25:41:17<205:33:08,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22586/203307 [25:41:20<205:33:01,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22586/203307 [25:41:20<205:33:01,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22587/203307 [25:41:24<205:32:54,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22587/203307 [25:41:24<205:32:54,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22588/203307 [25:41:28<205:32:52,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22588/203307 [25:41:28<205:32:52,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22589/203307 [25:41:32<205:32:45,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22589/203307 [25:41:32<205:32:45,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22590/203307 [25:41:36<205:32:38,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22590/203307 [25:41:36<205:32:38,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22591/203307 [25:41:40<205:32:37,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22591/203307 [25:41:40<205:32:37,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22592/203307 [25:41:44<205:32:30,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22592/203307 [25:41:44<205:32:30,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22593/203307 [25:41:49<205:32:29,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22593/203307 [25:41:49<205:32:29,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22594/203307 [25:41:53<205:32:27,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22594/203307 [25:41:53<205:32:27,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22595/203307 [25:41:57<205:32:19,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22595/203307 [25:41:57<205:32:19,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22596/203307 [25:42:01<205:32:17,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22596/203307 [25:42:01<205:32:17,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22597/203307 [25:42:05<205:32:15,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22597/203307 [25:42:05<205:32:15,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22598/203307 [25:42:09<205:32:08,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22598/203307 [25:42:09<205:32:08,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22599/203307 [25:42:13<205:32:06,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22599/203307 [25:42:13<205:32:06,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22600/203307 [25:42:17<205:31:59,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22600/203307 [25:42:17<205:31:59,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22601/203307 [25:42:21<205:31:52,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█         | 22601/203307 [25:42:21<205:31:52,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22602/203307 [25:42:25<205:31:51,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22602/203307 [25:42:25<205:31:51,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22603/203307 [25:42:29<205:31:48,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22603/203307 [25:42:29<205:31:48,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22604/203307 [25:42:33<205:31:41,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22604/203307 [25:42:33<205:31:41,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22605/203307 [25:42:38<205:31:39,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22605/203307 [25:42:38<205:31:39,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22606/203307 [25:42:41<205:31:31,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22606/203307 [25:42:41<205:31:31,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22607/203307 [25:42:45<205:31:24,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22607/203307 [25:42:45<205:31:24,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22608/203307 [25:42:50<205:31:24,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22608/203307 [25:42:50<205:31:24,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22609/203307 [25:42:53<205:31:17,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22609/203307 [25:42:53<205:31:17,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22610/203307 [25:42:57<205:31:09,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22610/203307 [25:42:57<205:31:09,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22611/203307 [25:43:01<205:31:09,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22611/203307 [25:43:01<205:31:09,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22612/203307 [25:43:05<205:31:02,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22612/203307 [25:43:05<205:31:02,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22613/203307 [25:43:09<205:30:55,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22613/203307 [25:43:09<205:30:55,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22614/203307 [25:43:13<205:30:53,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22614/203307 [25:43:13<205:30:53,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22615/203307 [25:43:17<205:30:46,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22615/203307 [25:43:17<205:30:46,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22616/203307 [25:43:21<205:30:39,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22616/203307 [25:43:21<205:30:39,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22617/203307 [25:43:25<205:30:39,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22617/203307 [25:43:25<205:30:39,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22618/203307 [25:43:29<205:30:31,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22618/203307 [25:43:29<205:30:31,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22619/203307 [25:43:33<205:30:29,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22619/203307 [25:43:33<205:30:29,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22620/203307 [25:43:38<205:30:26,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22620/203307 [25:43:38<205:30:26,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22621/203307 [25:43:41<205:30:19,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█         | 22621/203307 [25:43:41<205:30:19,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22622/203307 [25:43:46<205:30:17,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22622/203307 [25:43:46<205:30:17,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22623/203307 [25:43:50<205:30:14,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22623/203307 [25:43:50<205:30:14,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22624/203307 [25:43:54<205:30:06,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22624/203307 [25:43:54<205:30:07,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22625/203307 [25:43:58<205:30:05,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22625/203307 [25:43:58<205:30:05,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22626/203307 [25:44:02<205:29:58,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22626/203307 [25:44:02<205:29:58,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22627/203307 [25:44:05<205:29:51,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22627/203307 [25:44:05<205:29:51,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22628/203307 [25:44:10<205:29:50,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22628/203307 [25:44:10<205:29:50,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22629/203307 [25:44:14<205:29:47,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22629/203307 [25:44:14<205:29:47,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22630/203307 [25:44:18<205:29:39,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22630/203307 [25:44:18<205:29:39,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22631/203307 [25:44:22<205:29:37,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22631/203307 [25:44:22<205:29:37,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22632/203307 [25:44:26<205:29:31,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22632/203307 [25:44:26<205:29:31,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22633/203307 [25:44:30<205:29:24,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22633/203307 [25:44:30<205:29:24,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22634/203307 [25:44:34<205:29:24,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22634/203307 [25:44:34<205:29:24,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22635/203307 [25:44:38<205:29:16,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22635/203307 [25:44:38<205:29:16,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22636/203307 [25:44:42<205:29:09,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22636/203307 [25:44:42<205:29:09,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22637/203307 [25:44:46<205:29:08,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22637/203307 [25:44:46<205:29:08,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22638/203307 [25:44:50<205:29:06,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22638/203307 [25:44:50<205:29:06,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22639/203307 [25:44:54<205:28:58,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22639/203307 [25:44:54<205:28:59,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22640/203307 [25:44:59<205:28:57,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22640/203307 [25:44:59<205:28:57,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22641/203307 [25:45:02<205:28:50,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  11%|█         | 22641/203307 [25:45:02<205:28:50,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22642/203307 [25:45:06<205:28:43,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22642/203307 [25:45:06<205:28:43,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22643/203307 [25:45:11<205:28:42,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22643/203307 [25:45:11<205:28:42,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22644/203307 [25:45:14<205:28:35,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22644/203307 [25:45:14<205:28:35,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22645/203307 [25:45:19<205:28:33,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22645/203307 [25:45:19<205:28:33,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22646/203307 [25:45:23<205:28:31,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22646/203307 [25:45:23<205:28:31,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22647/203307 [25:45:27<205:28:28,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22647/203307 [25:45:27<205:28:28,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22648/203307 [25:45:31<205:28:25,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22648/203307 [25:45:31<205:28:25,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22649/203307 [25:45:36<205:28:23,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22649/203307 [25:45:36<205:28:23,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22650/203307 [25:45:39<205:28:16,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22650/203307 [25:45:39<205:28:16,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22651/203307 [25:45:44<205:28:14,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22651/203307 [25:45:44<205:28:14,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22652/203307 [25:45:48<205:28:07,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22652/203307 [25:45:48<205:28:07,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22653/203307 [25:45:51<205:28:00,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22653/203307 [25:45:51<205:28:00,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22654/203307 [25:45:56<205:27:58,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22654/203307 [25:45:56<205:27:59,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22655/203307 [25:46:00<205:27:55,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22655/203307 [25:46:00<205:27:55,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22656/203307 [25:46:04<205:27:52,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22656/203307 [25:46:04<205:27:52,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22657/203307 [25:46:08<205:27:49,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22657/203307 [25:46:08<205:27:49,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22658/203307 [25:46:12<205:27:42,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22658/203307 [25:46:12<205:27:42,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22659/203307 [25:46:16<205:27:34,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22659/203307 [25:46:16<205:27:34,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22660/203307 [25:46:20<205:27:33,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22660/203307 [25:46:20<205:27:33,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22661/203307 [25:46:24<205:27:25,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  11%|█         | 22661/203307 [25:46:24<205:27:25,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22662/203307 [25:46:27<205:27:17,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22662/203307 [25:46:27<205:27:17,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22663/203307 [25:46:32<205:27:16,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22663/203307 [25:46:32<205:27:16,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22664/203307 [25:46:35<205:27:08,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22664/203307 [25:46:35<205:27:08,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22665/203307 [25:46:40<205:27:04,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22665/203307 [25:46:40<205:27:04,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22666/203307 [25:46:44<205:27:02,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22666/203307 [25:46:44<205:27:02,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22667/203307 [25:46:48<205:26:55,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22667/203307 [25:46:48<205:26:55,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22668/203307 [25:46:51<205:26:47,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22668/203307 [25:46:51<205:26:47,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22669/203307 [25:46:56<205:26:46,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22669/203307 [25:46:56<205:26:46,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22670/203307 [25:46:59<205:26:38,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22670/203307 [25:46:59<205:26:38,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22671/203307 [25:47:04<205:26:36,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22671/203307 [25:47:04<205:26:37,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22672/203307 [25:47:08<205:26:33,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22672/203307 [25:47:08<205:26:33,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22673/203307 [25:47:12<205:26:25,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22673/203307 [25:47:12<205:26:25,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22674/203307 [25:47:16<205:26:23,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22674/203307 [25:47:16<205:26:23,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22675/203307 [25:47:20<205:26:21,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22675/203307 [25:47:20<205:26:21,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22676/203307 [25:47:24<205:26:14,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22676/203307 [25:47:24<205:26:14,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22677/203307 [25:47:28<205:26:13,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22677/203307 [25:47:28<205:26:13,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22678/203307 [25:47:32<205:26:06,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22678/203307 [25:47:32<205:26:06,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22679/203307 [25:47:36<205:25:59,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22679/203307 [25:47:36<205:25:59,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22680/203307 [25:47:40<205:25:58,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22680/203307 [25:47:40<205:25:58,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22681/203307 [25:47:45<205:25:56,  0.24it/s, v_num=t5e6, training/loss=0.0837]Epoch 0:  11%|█         | 22681/203307 [25:47:45<205:25:56,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22682/203307 [25:47:48<205:25:49,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22682/203307 [25:47:48<205:25:49,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22683/203307 [25:47:53<205:25:47,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22683/203307 [25:47:53<205:25:47,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22684/203307 [25:47:57<205:25:40,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22684/203307 [25:47:57<205:25:40,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22685/203307 [25:48:00<205:25:32,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22685/203307 [25:48:00<205:25:32,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22686/203307 [25:48:05<205:25:33,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22686/203307 [25:48:05<205:25:33,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22687/203307 [25:48:09<205:25:28,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22687/203307 [25:48:09<205:25:28,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22688/203307 [25:48:12<205:25:20,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22688/203307 [25:48:12<205:25:20,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22689/203307 [25:48:17<205:25:19,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22689/203307 [25:48:17<205:25:19,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22690/203307 [25:48:21<205:25:12,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22690/203307 [25:48:21<205:25:12,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22691/203307 [25:48:25<205:25:07,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22691/203307 [25:48:25<205:25:07,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22692/203307 [25:48:29<205:25:05,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22692/203307 [25:48:29<205:25:05,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22693/203307 [25:48:33<205:24:59,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22693/203307 [25:48:33<205:24:59,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22694/203307 [25:48:37<205:24:55,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22694/203307 [25:48:37<205:24:55,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22695/203307 [25:48:41<205:24:54,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22695/203307 [25:48:41<205:24:54,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22696/203307 [25:48:45<205:24:47,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22696/203307 [25:48:45<205:24:47,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22697/203307 [25:48:50<205:24:46,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22697/203307 [25:48:50<205:24:46,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22698/203307 [25:48:54<205:24:46,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22698/203307 [25:48:54<205:24:46,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22699/203307 [25:48:58<205:24:39,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22699/203307 [25:48:58<205:24:39,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22700/203307 [25:49:02<205:24:37,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22700/203307 [25:49:02<205:24:37,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22701/203307 [25:49:07<205:24:35,  0.24it/s, v_num=t5e6, training/loss=0.0931]Epoch 0:  11%|█         | 22701/203307 [25:49:07<205:24:35,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22702/203307 [25:49:11<205:24:30,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22702/203307 [25:49:11<205:24:30,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22703/203307 [25:49:15<205:24:30,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22703/203307 [25:49:15<205:24:30,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22704/203307 [25:49:19<205:24:23,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22704/203307 [25:49:19<205:24:23,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22705/203307 [25:49:23<205:24:15,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22705/203307 [25:49:23<205:24:15,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22706/203307 [25:49:28<205:24:17,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22706/203307 [25:49:28<205:24:17,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22707/203307 [25:49:32<205:24:15,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22707/203307 [25:49:32<205:24:15,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22708/203307 [25:49:36<205:24:08,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22708/203307 [25:49:36<205:24:08,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22709/203307 [25:49:40<205:24:06,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22709/203307 [25:49:40<205:24:06,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22710/203307 [25:49:44<205:24:03,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22710/203307 [25:49:44<205:24:03,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22711/203307 [25:49:48<205:23:57,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22711/203307 [25:49:48<205:23:57,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22712/203307 [25:49:53<205:23:56,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22712/203307 [25:49:53<205:23:56,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22713/203307 [25:49:56<205:23:50,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22713/203307 [25:49:56<205:23:50,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22714/203307 [25:50:00<205:23:44,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22714/203307 [25:50:00<205:23:44,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22715/203307 [25:50:05<205:23:45,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22715/203307 [25:50:05<205:23:45,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22716/203307 [25:50:09<205:23:38,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22716/203307 [25:50:09<205:23:38,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22717/203307 [25:50:12<205:23:30,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22717/203307 [25:50:12<205:23:31,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22718/203307 [25:50:17<205:23:32,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22718/203307 [25:50:17<205:23:32,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22719/203307 [25:50:21<205:23:28,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22719/203307 [25:50:21<205:23:28,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22720/203307 [25:50:25<205:23:21,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22720/203307 [25:50:25<205:23:21,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22721/203307 [25:50:30<205:23:21,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  11%|█         | 22721/203307 [25:50:30<205:23:21,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22722/203307 [25:50:34<205:23:17,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22722/203307 [25:50:34<205:23:17,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22723/203307 [25:50:38<205:23:15,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22723/203307 [25:50:38<205:23:15,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22724/203307 [25:50:42<205:23:13,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22724/203307 [25:50:42<205:23:13,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22725/203307 [25:50:46<205:23:06,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22725/203307 [25:50:46<205:23:06,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22726/203307 [25:50:51<205:23:06,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22726/203307 [25:50:51<205:23:06,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22727/203307 [25:50:55<205:23:06,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22727/203307 [25:50:55<205:23:06,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22728/203307 [25:51:00<205:23:03,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22728/203307 [25:51:00<205:23:03,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22729/203307 [25:51:04<205:23:01,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22729/203307 [25:51:04<205:23:01,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22730/203307 [25:51:08<205:22:57,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22730/203307 [25:51:08<205:22:57,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22731/203307 [25:51:12<205:22:51,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22731/203307 [25:51:12<205:22:51,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22732/203307 [25:51:16<205:22:50,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22732/203307 [25:51:16<205:22:50,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22733/203307 [25:51:21<205:22:47,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22733/203307 [25:51:21<205:22:47,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22734/203307 [25:51:25<205:22:41,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22734/203307 [25:51:25<205:22:41,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22735/203307 [25:51:29<205:22:41,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22735/203307 [25:51:29<205:22:41,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22736/203307 [25:51:33<205:22:34,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22736/203307 [25:51:33<205:22:34,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22737/203307 [25:51:37<205:22:31,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22737/203307 [25:51:37<205:22:31,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22738/203307 [25:51:42<205:22:30,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22738/203307 [25:51:42<205:22:30,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22739/203307 [25:51:46<205:22:25,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22739/203307 [25:51:46<205:22:25,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22740/203307 [25:51:49<205:22:17,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22740/203307 [25:51:49<205:22:17,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22741/203307 [25:51:54<205:22:16,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  11%|█         | 22741/203307 [25:51:54<205:22:16,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22742/203307 [25:51:58<205:22:12,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22742/203307 [25:51:58<205:22:12,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22743/203307 [25:52:02<205:22:07,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22743/203307 [25:52:02<205:22:07,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22744/203307 [25:52:06<205:22:06,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22744/203307 [25:52:06<205:22:06,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22745/203307 [25:52:10<205:22:01,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22745/203307 [25:52:10<205:22:01,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22746/203307 [25:52:14<205:21:58,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22746/203307 [25:52:14<205:21:58,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22747/203307 [25:52:19<205:21:59,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22747/203307 [25:52:19<205:21:59,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22748/203307 [25:52:23<205:21:52,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22748/203307 [25:52:23<205:21:52,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22749/203307 [25:52:27<205:21:50,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22749/203307 [25:52:27<205:21:50,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22750/203307 [25:52:32<205:21:48,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22750/203307 [25:52:32<205:21:48,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22751/203307 [25:52:36<205:21:44,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22751/203307 [25:52:36<205:21:44,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22752/203307 [25:52:40<205:21:42,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22752/203307 [25:52:40<205:21:42,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22753/203307 [25:52:44<205:21:39,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22753/203307 [25:52:44<205:21:39,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22754/203307 [25:52:48<205:21:32,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22754/203307 [25:52:48<205:21:32,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22755/203307 [25:52:53<205:21:32,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22755/203307 [25:52:53<205:21:32,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22756/203307 [25:52:56<205:21:25,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22756/203307 [25:52:56<205:21:25,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22757/203307 [25:53:00<205:21:18,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22757/203307 [25:53:00<205:21:19,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22758/203307 [25:53:05<205:21:18,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22758/203307 [25:53:05<205:21:18,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22759/203307 [25:53:09<205:21:17,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22759/203307 [25:53:09<205:21:17,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22760/203307 [25:53:13<205:21:10,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22760/203307 [25:53:13<205:21:10,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22761/203307 [25:53:17<205:21:08,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  11%|█         | 22761/203307 [25:53:17<205:21:08,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22762/203307 [25:53:21<205:21:02,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22762/203307 [25:53:21<205:21:02,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22763/203307 [25:53:25<205:20:57,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22763/203307 [25:53:25<205:20:58,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22764/203307 [25:53:30<205:20:58,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22764/203307 [25:53:30<205:20:58,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22765/203307 [25:53:34<205:20:51,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22765/203307 [25:53:34<205:20:51,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22766/203307 [25:53:37<205:20:45,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22766/203307 [25:53:37<205:20:45,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22767/203307 [25:53:42<205:20:46,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22767/203307 [25:53:42<205:20:46,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22768/203307 [25:53:46<205:20:40,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22768/203307 [25:53:46<205:20:40,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22769/203307 [25:53:50<205:20:33,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22769/203307 [25:53:50<205:20:33,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22770/203307 [25:53:54<205:20:33,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22770/203307 [25:53:54<205:20:33,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22771/203307 [25:53:58<205:20:28,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22771/203307 [25:53:58<205:20:28,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22772/203307 [25:54:02<205:20:21,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22772/203307 [25:54:02<205:20:21,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22773/203307 [25:54:07<205:20:20,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22773/203307 [25:54:07<205:20:20,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22774/203307 [25:54:11<205:20:16,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22774/203307 [25:54:11<205:20:16,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22775/203307 [25:54:15<205:20:15,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22775/203307 [25:54:15<205:20:15,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22776/203307 [25:54:20<205:20:13,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22776/203307 [25:54:20<205:20:13,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22777/203307 [25:54:23<205:20:06,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22777/203307 [25:54:23<205:20:06,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22778/203307 [25:54:28<205:20:05,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22778/203307 [25:54:28<205:20:05,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22779/203307 [25:54:32<205:20:05,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22779/203307 [25:54:32<205:20:05,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22780/203307 [25:54:36<205:19:58,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22780/203307 [25:54:36<205:19:58,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22781/203307 [25:54:40<205:19:56,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  11%|█         | 22781/203307 [25:54:40<205:19:56,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22782/203307 [25:54:45<205:19:53,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22782/203307 [25:54:45<205:19:53,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22783/203307 [25:54:49<205:19:48,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22783/203307 [25:54:49<205:19:48,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22784/203307 [25:54:53<205:19:48,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22784/203307 [25:54:53<205:19:48,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22785/203307 [25:54:58<205:19:45,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22785/203307 [25:54:58<205:19:45,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22786/203307 [25:55:01<205:19:40,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22786/203307 [25:55:01<205:19:40,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22787/203307 [25:55:06<205:19:41,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22787/203307 [25:55:06<205:19:41,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22788/203307 [25:55:10<205:19:34,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22788/203307 [25:55:10<205:19:34,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22789/203307 [25:55:14<205:19:27,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22789/203307 [25:55:14<205:19:27,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22790/203307 [25:55:18<205:19:28,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22790/203307 [25:55:18<205:19:28,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22791/203307 [25:55:22<205:19:24,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22791/203307 [25:55:22<205:19:24,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22792/203307 [25:55:26<205:19:16,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22792/203307 [25:55:26<205:19:16,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22793/203307 [25:55:31<205:19:16,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22793/203307 [25:55:31<205:19:16,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22794/203307 [25:55:34<205:19:09,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22794/203307 [25:55:34<205:19:09,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22795/203307 [25:55:38<205:19:04,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22795/203307 [25:55:38<205:19:04,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22796/203307 [25:55:43<205:19:02,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22796/203307 [25:55:43<205:19:02,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22797/203307 [25:55:46<205:18:54,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22797/203307 [25:55:46<205:18:54,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22798/203307 [25:55:50<205:18:48,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22798/203307 [25:55:50<205:18:48,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22799/203307 [25:55:55<205:18:48,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22799/203307 [25:55:55<205:18:48,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22800/203307 [25:55:59<205:18:44,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22800/203307 [25:55:59<205:18:44,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22801/203307 [25:56:03<205:18:42,  0.24it/s, v_num=t5e6, training/loss=0.0832]Epoch 0:  11%|█         | 22801/203307 [25:56:03<205:18:42,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22802/203307 [25:56:08<205:18:40,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22802/203307 [25:56:08<205:18:40,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22803/203307 [25:56:12<205:18:35,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22803/203307 [25:56:12<205:18:35,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22804/203307 [25:56:16<205:18:33,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22804/203307 [25:56:16<205:18:33,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22805/203307 [25:56:20<205:18:31,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22805/203307 [25:56:20<205:18:31,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22806/203307 [25:56:24<205:18:24,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22806/203307 [25:56:24<205:18:24,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22807/203307 [25:56:29<205:18:23,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22807/203307 [25:56:29<205:18:23,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22808/203307 [25:56:32<205:18:16,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22808/203307 [25:56:32<205:18:16,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22809/203307 [25:56:37<205:18:13,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22809/203307 [25:56:37<205:18:13,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22810/203307 [25:56:41<205:18:12,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22810/203307 [25:56:41<205:18:12,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22811/203307 [25:56:45<205:18:09,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22811/203307 [25:56:45<205:18:09,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22812/203307 [25:56:49<205:18:01,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22812/203307 [25:56:49<205:18:01,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22813/203307 [25:56:53<205:17:59,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22813/203307 [25:56:53<205:17:59,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22814/203307 [25:56:57<205:17:52,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22814/203307 [25:56:57<205:17:52,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22815/203307 [25:57:01<205:17:47,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22815/203307 [25:57:01<205:17:47,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22816/203307 [25:57:05<205:17:46,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22816/203307 [25:57:05<205:17:46,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22817/203307 [25:57:09<205:17:39,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22817/203307 [25:57:09<205:17:39,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22818/203307 [25:57:13<205:17:35,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22818/203307 [25:57:13<205:17:35,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22819/203307 [25:57:18<205:17:34,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22819/203307 [25:57:18<205:17:34,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22820/203307 [25:57:22<205:17:28,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22820/203307 [25:57:22<205:17:28,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22821/203307 [25:57:25<205:17:22,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  11%|█         | 22821/203307 [25:57:25<205:17:22,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22822/203307 [25:57:30<205:17:20,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22822/203307 [25:57:30<205:17:20,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22823/203307 [25:57:34<205:17:14,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22823/203307 [25:57:34<205:17:14,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22824/203307 [25:57:37<205:17:07,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22824/203307 [25:57:37<205:17:07,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22825/203307 [25:57:42<205:17:07,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22825/203307 [25:57:42<205:17:07,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22826/203307 [25:57:46<205:17:00,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22826/203307 [25:57:46<205:17:00,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22827/203307 [25:57:50<205:16:58,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22827/203307 [25:57:50<205:16:58,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22828/203307 [25:57:54<205:16:56,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22828/203307 [25:57:54<205:16:56,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22829/203307 [25:57:58<205:16:49,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22829/203307 [25:57:58<205:16:49,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22830/203307 [25:58:03<205:16:47,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22830/203307 [25:58:03<205:16:47,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22831/203307 [25:58:07<205:16:45,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22831/203307 [25:58:07<205:16:45,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22832/203307 [25:58:11<205:16:39,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22832/203307 [25:58:11<205:16:39,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22833/203307 [25:58:15<205:16:37,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22833/203307 [25:58:15<205:16:37,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22834/203307 [25:58:19<205:16:31,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22834/203307 [25:58:19<205:16:31,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22835/203307 [25:58:23<205:16:23,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22835/203307 [25:58:23<205:16:23,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22836/203307 [25:58:27<205:16:23,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22836/203307 [25:58:27<205:16:23,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22837/203307 [25:58:31<205:16:20,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22837/203307 [25:58:31<205:16:20,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22838/203307 [25:58:35<205:16:13,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22838/203307 [25:58:35<205:16:13,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22839/203307 [25:58:40<205:16:11,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22839/203307 [25:58:40<205:16:11,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22840/203307 [25:58:43<205:16:04,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22840/203307 [25:58:43<205:16:04,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22841/203307 [25:58:47<205:15:57,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  11%|█         | 22841/203307 [25:58:47<205:15:57,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22842/203307 [25:58:51<205:15:56,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22842/203307 [25:58:51<205:15:56,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22843/203307 [25:58:55<205:15:49,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22843/203307 [25:58:55<205:15:49,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22844/203307 [25:58:59<205:15:42,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22844/203307 [25:58:59<205:15:42,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22845/203307 [25:59:03<205:15:41,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22845/203307 [25:59:03<205:15:41,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22846/203307 [25:59:07<205:15:34,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22846/203307 [25:59:07<205:15:34,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22847/203307 [25:59:11<205:15:27,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22847/203307 [25:59:11<205:15:27,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22848/203307 [25:59:15<205:15:26,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22848/203307 [25:59:15<205:15:26,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22849/203307 [25:59:19<205:15:19,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22849/203307 [25:59:19<205:15:19,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22850/203307 [25:59:23<205:15:12,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22850/203307 [25:59:23<205:15:12,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22851/203307 [25:59:27<205:15:11,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22851/203307 [25:59:27<205:15:11,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22852/203307 [25:59:31<205:15:04,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22852/203307 [25:59:31<205:15:04,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22853/203307 [25:59:35<205:15:03,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22853/203307 [25:59:35<205:15:03,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22854/203307 [25:59:40<205:15:00,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22854/203307 [25:59:40<205:15:00,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22855/203307 [25:59:43<205:14:53,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22855/203307 [25:59:43<205:14:53,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22856/203307 [25:59:48<205:14:50,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22856/203307 [25:59:48<205:14:50,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22857/203307 [25:59:52<205:14:48,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22857/203307 [25:59:52<205:14:48,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22858/203307 [25:59:56<205:14:41,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22858/203307 [25:59:56<205:14:41,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22859/203307 [26:00:00<205:14:40,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22859/203307 [26:00:00<205:14:40,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22860/203307 [26:00:04<205:14:33,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22860/203307 [26:00:04<205:14:33,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22861/203307 [26:00:08<205:14:26,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  11%|█         | 22861/203307 [26:00:08<205:14:26,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 22862/203307 [26:00:12<205:14:25,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 22862/203307 [26:00:12<205:14:25,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 22863/203307 [26:00:16<205:14:22,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 22863/203307 [26:00:16<205:14:22,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 22864/203307 [26:00:20<205:14:15,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 22864/203307 [26:00:20<205:14:15,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 22865/203307 [26:00:24<205:14:12,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 22865/203307 [26:00:24<205:14:13,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 22866/203307 [26:00:28<205:14:06,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 22866/203307 [26:00:28<205:14:06,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 22867/203307 [26:00:32<205:14:00,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 22867/203307 [26:00:32<205:14:00,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 22868/203307 [26:00:37<205:13:59,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 22868/203307 [26:00:37<205:13:59,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 22869/203307 [26:00:40<205:13:51,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 22869/203307 [26:00:40<205:13:52,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 22870/203307 [26:00:44<205:13:45,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 22870/203307 [26:00:44<205:13:45,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 22871/203307 [26:00:49<205:13:45,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 22871/203307 [26:00:49<205:13:45,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 22872/203307 [26:00:53<205:13:41,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█         | 22872/203307 [26:00:53<205:13:41,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█▏        | 22873/203307 [26:00:57<205:13:35,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█▏        | 22873/203307 [26:00:57<205:13:35,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█▏        | 22874/203307 [26:01:01<205:13:33,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█▏        | 22874/203307 [26:01:01<205:13:33,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█▏        | 22875/203307 [26:01:05<205:13:26,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█▏        | 22875/203307 [26:01:05<205:13:27,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█▏        | 22876/203307 [26:01:09<205:13:20,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█▏        | 22876/203307 [26:01:09<205:13:20,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█▏        | 22877/203307 [26:01:13<205:13:19,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█▏        | 22877/203307 [26:01:13<205:13:19,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█▏        | 22878/203307 [26:01:17<205:13:12,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█▏        | 22878/203307 [26:01:17<205:13:12,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█▏        | 22879/203307 [26:01:21<205:13:11,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█▏        | 22879/203307 [26:01:21<205:13:11,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█▏        | 22880/203307 [26:01:26<205:13:09,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█▏        | 22880/203307 [26:01:26<205:13:09,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█▏        | 22881/203307 [26:01:30<205:13:06,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  11%|█▏        | 22881/203307 [26:01:30<205:13:06,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22882/203307 [26:01:34<205:13:04,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22882/203307 [26:01:34<205:13:04,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22883/203307 [26:01:39<205:13:02,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22883/203307 [26:01:39<205:13:02,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22884/203307 [26:01:42<205:12:56,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22884/203307 [26:01:42<205:12:56,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22885/203307 [26:01:47<205:12:55,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22885/203307 [26:01:47<205:12:55,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22886/203307 [26:01:51<205:12:48,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22886/203307 [26:01:51<205:12:48,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22887/203307 [26:01:54<205:12:41,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22887/203307 [26:01:54<205:12:41,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22888/203307 [26:01:59<205:12:41,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22888/203307 [26:01:59<205:12:41,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22889/203307 [26:02:03<205:12:38,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22889/203307 [26:02:03<205:12:38,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22890/203307 [26:02:07<205:12:35,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22890/203307 [26:02:07<205:12:35,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22891/203307 [26:02:12<205:12:33,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22891/203307 [26:02:12<205:12:33,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22892/203307 [26:02:16<205:12:27,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22892/203307 [26:02:16<205:12:27,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22893/203307 [26:02:19<205:12:20,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22893/203307 [26:02:19<205:12:20,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22894/203307 [26:02:24<205:12:20,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22894/203307 [26:02:24<205:12:20,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22895/203307 [26:02:28<205:12:12,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22895/203307 [26:02:28<205:12:12,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22896/203307 [26:02:31<205:12:05,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22896/203307 [26:02:31<205:12:05,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22897/203307 [26:02:36<205:12:05,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22897/203307 [26:02:36<205:12:05,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22898/203307 [26:02:40<205:11:59,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22898/203307 [26:02:40<205:11:59,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22899/203307 [26:02:44<205:11:56,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22899/203307 [26:02:44<205:11:56,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22900/203307 [26:02:48<205:11:54,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22900/203307 [26:02:48<205:11:54,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22901/203307 [26:02:52<205:11:47,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  11%|█▏        | 22901/203307 [26:02:52<205:11:47,  0.24it/s, v_num=t5e6, training/loss=0.087] Epoch 0:  11%|█▏        | 22902/203307 [26:02:56<205:11:39,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22902/203307 [26:02:56<205:11:39,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22903/203307 [26:03:00<205:11:39,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22903/203307 [26:03:00<205:11:39,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22904/203307 [26:03:04<205:11:32,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22904/203307 [26:03:04<205:11:32,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22905/203307 [26:03:08<205:11:31,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22905/203307 [26:03:08<205:11:31,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22906/203307 [26:03:13<205:11:30,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22906/203307 [26:03:13<205:11:30,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22907/203307 [26:03:17<205:11:23,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22907/203307 [26:03:17<205:11:23,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22908/203307 [26:03:21<205:11:22,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22908/203307 [26:03:21<205:11:22,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22909/203307 [26:03:26<205:11:20,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22909/203307 [26:03:26<205:11:20,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22910/203307 [26:03:29<205:11:13,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22910/203307 [26:03:29<205:11:13,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22911/203307 [26:03:34<205:11:12,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22911/203307 [26:03:34<205:11:12,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22912/203307 [26:03:38<205:11:06,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22912/203307 [26:03:38<205:11:06,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22913/203307 [26:03:41<205:10:59,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22913/203307 [26:03:41<205:10:59,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22914/203307 [26:03:46<205:10:58,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22914/203307 [26:03:46<205:10:58,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22915/203307 [26:03:50<205:10:55,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22915/203307 [26:03:50<205:10:55,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22916/203307 [26:03:54<205:10:48,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22916/203307 [26:03:54<205:10:48,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22917/203307 [26:03:58<205:10:46,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22917/203307 [26:03:58<205:10:46,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22918/203307 [26:04:02<205:10:39,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22918/203307 [26:04:02<205:10:39,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22919/203307 [26:04:06<205:10:32,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22919/203307 [26:04:06<205:10:32,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22920/203307 [26:04:10<205:10:31,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22920/203307 [26:04:10<205:10:31,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22921/203307 [26:04:14<205:10:25,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  11%|█▏        | 22921/203307 [26:04:14<205:10:25,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22922/203307 [26:04:18<205:10:18,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22922/203307 [26:04:18<205:10:19,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22923/203307 [26:04:22<205:10:18,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22923/203307 [26:04:22<205:10:18,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22924/203307 [26:04:26<205:10:11,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22924/203307 [26:04:26<205:10:12,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22925/203307 [26:04:30<205:10:05,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22925/203307 [26:04:30<205:10:05,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22926/203307 [26:04:34<205:10:03,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22926/203307 [26:04:34<205:10:03,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22927/203307 [26:04:38<205:09:57,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22927/203307 [26:04:38<205:09:57,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22928/203307 [26:04:42<205:09:50,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22928/203307 [26:04:42<205:09:50,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22929/203307 [26:04:47<205:09:50,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22929/203307 [26:04:47<205:09:50,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22930/203307 [26:04:50<205:09:44,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22930/203307 [26:04:50<205:09:44,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22931/203307 [26:04:55<205:09:43,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22931/203307 [26:04:55<205:09:43,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22932/203307 [26:04:59<205:09:40,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22932/203307 [26:04:59<205:09:40,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22933/203307 [26:05:03<205:09:33,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22933/203307 [26:05:03<205:09:33,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22934/203307 [26:05:07<205:09:30,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22934/203307 [26:05:07<205:09:30,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22935/203307 [26:05:11<205:09:28,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22935/203307 [26:05:11<205:09:28,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22936/203307 [26:05:15<205:09:21,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22936/203307 [26:05:15<205:09:21,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22937/203307 [26:05:19<205:09:19,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22937/203307 [26:05:19<205:09:19,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22938/203307 [26:05:23<205:09:13,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22938/203307 [26:05:23<205:09:13,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22939/203307 [26:05:27<205:09:06,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22939/203307 [26:05:27<205:09:06,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22940/203307 [26:05:32<205:09:05,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22940/203307 [26:05:32<205:09:05,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22941/203307 [26:05:36<205:09:03,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  11%|█▏        | 22941/203307 [26:05:36<205:09:03,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22942/203307 [26:05:39<205:08:55,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22942/203307 [26:05:39<205:08:55,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22943/203307 [26:05:44<205:08:53,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22943/203307 [26:05:44<205:08:53,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22944/203307 [26:05:48<205:08:50,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22944/203307 [26:05:48<205:08:50,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22945/203307 [26:05:52<205:08:43,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22945/203307 [26:05:52<205:08:43,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22946/203307 [26:05:56<205:08:42,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22946/203307 [26:05:56<205:08:42,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22947/203307 [26:06:00<205:08:35,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22947/203307 [26:06:00<205:08:35,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22948/203307 [26:06:04<205:08:27,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22948/203307 [26:06:04<205:08:27,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22949/203307 [26:06:08<205:08:26,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22949/203307 [26:06:08<205:08:26,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22950/203307 [26:06:12<205:08:18,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22950/203307 [26:06:12<205:08:19,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22951/203307 [26:06:16<205:08:12,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22951/203307 [26:06:16<205:08:12,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22952/203307 [26:06:20<205:08:11,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22952/203307 [26:06:20<205:08:11,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22953/203307 [26:06:24<205:08:07,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22953/203307 [26:06:24<205:08:07,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22954/203307 [26:06:28<205:08:00,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22954/203307 [26:06:28<205:08:00,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22955/203307 [26:06:32<205:07:59,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22955/203307 [26:06:32<205:07:59,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22956/203307 [26:06:36<205:07:52,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22956/203307 [26:06:36<205:07:52,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22957/203307 [26:06:41<205:07:51,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22957/203307 [26:06:41<205:07:51,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22958/203307 [26:06:45<205:07:48,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22958/203307 [26:06:45<205:07:48,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22959/203307 [26:06:49<205:07:41,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22959/203307 [26:06:49<205:07:41,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22960/203307 [26:06:53<205:07:39,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22960/203307 [26:06:53<205:07:39,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22961/203307 [26:06:57<205:07:38,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  11%|█▏        | 22961/203307 [26:06:57<205:07:38,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22962/203307 [26:07:02<205:07:35,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22962/203307 [26:07:02<205:07:35,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22963/203307 [26:07:06<205:07:33,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22963/203307 [26:07:06<205:07:33,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22964/203307 [26:07:10<205:07:27,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22964/203307 [26:07:10<205:07:27,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22965/203307 [26:07:13<205:07:20,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22965/203307 [26:07:13<205:07:20,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22966/203307 [26:07:18<205:07:19,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22966/203307 [26:07:18<205:07:19,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22967/203307 [26:07:22<205:07:16,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22967/203307 [26:07:22<205:07:16,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22968/203307 [26:07:26<205:07:08,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22968/203307 [26:07:26<205:07:08,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22969/203307 [26:07:30<205:07:07,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22969/203307 [26:07:30<205:07:07,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22970/203307 [26:07:34<205:07:01,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22970/203307 [26:07:34<205:07:01,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22971/203307 [26:07:38<205:06:58,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22971/203307 [26:07:38<205:06:58,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22972/203307 [26:07:43<205:06:56,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22972/203307 [26:07:43<205:06:56,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22973/203307 [26:07:46<205:06:49,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22973/203307 [26:07:46<205:06:49,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22974/203307 [26:07:50<205:06:43,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22974/203307 [26:07:50<205:06:43,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22975/203307 [26:07:55<205:06:42,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22975/203307 [26:07:55<205:06:42,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22976/203307 [26:07:59<205:06:35,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22976/203307 [26:07:59<205:06:35,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22977/203307 [26:08:02<205:06:29,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22977/203307 [26:08:02<205:06:29,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22978/203307 [26:08:07<205:06:28,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22978/203307 [26:08:07<205:06:28,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22979/203307 [26:08:11<205:06:21,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22979/203307 [26:08:11<205:06:21,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22980/203307 [26:08:15<205:06:18,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22980/203307 [26:08:15<205:06:18,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22981/203307 [26:08:19<205:06:16,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  11%|█▏        | 22981/203307 [26:08:19<205:06:16,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22982/203307 [26:08:23<205:06:09,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22982/203307 [26:08:23<205:06:09,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22983/203307 [26:08:28<205:06:08,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22983/203307 [26:08:28<205:06:08,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22984/203307 [26:08:32<205:06:06,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22984/203307 [26:08:32<205:06:06,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22985/203307 [26:08:36<205:05:59,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22985/203307 [26:08:36<205:05:59,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22986/203307 [26:08:40<205:05:57,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22986/203307 [26:08:40<205:05:57,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22987/203307 [26:08:44<205:05:55,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22987/203307 [26:08:44<205:05:55,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22988/203307 [26:08:48<205:05:48,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22988/203307 [26:08:48<205:05:48,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22989/203307 [26:08:52<205:05:46,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22989/203307 [26:08:52<205:05:46,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22990/203307 [26:08:56<205:05:40,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22990/203307 [26:08:56<205:05:40,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22991/203307 [26:09:00<205:05:32,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22991/203307 [26:09:00<205:05:32,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22992/203307 [26:09:04<205:05:30,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22992/203307 [26:09:04<205:05:30,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22993/203307 [26:09:08<205:05:28,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22993/203307 [26:09:08<205:05:28,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22994/203307 [26:09:12<205:05:20,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22994/203307 [26:09:12<205:05:20,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22995/203307 [26:09:17<205:05:18,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22995/203307 [26:09:17<205:05:19,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22996/203307 [26:09:20<205:05:13,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22996/203307 [26:09:20<205:05:13,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22997/203307 [26:09:24<205:05:06,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22997/203307 [26:09:24<205:05:06,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22998/203307 [26:09:29<205:05:05,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22998/203307 [26:09:29<205:05:05,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22999/203307 [26:09:32<205:04:58,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 22999/203307 [26:09:32<205:04:58,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 23000/203307 [26:09:36<205:04:52,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 23000/203307 [26:09:36<205:04:52,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 23001/203307 [26:09:41<205:04:51,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  11%|█▏        | 23001/203307 [26:09:41<205:04:51,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23002/203307 [26:09:44<205:04:44,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23002/203307 [26:09:44<205:04:44,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23003/203307 [26:09:48<205:04:37,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23003/203307 [26:09:48<205:04:37,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23004/203307 [26:09:53<205:04:36,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23004/203307 [26:09:53<205:04:36,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23005/203307 [26:09:56<205:04:29,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23005/203307 [26:09:56<205:04:29,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23006/203307 [26:10:00<205:04:22,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23006/203307 [26:10:00<205:04:22,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23007/203307 [26:10:05<205:04:21,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23007/203307 [26:10:05<205:04:21,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23008/203307 [26:10:08<205:04:14,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23008/203307 [26:10:08<205:04:14,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23009/203307 [26:10:13<205:04:13,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23009/203307 [26:10:13<205:04:13,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23010/203307 [26:10:17<205:04:11,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23010/203307 [26:10:17<205:04:11,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23011/203307 [26:10:21<205:04:04,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23011/203307 [26:10:21<205:04:04,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23012/203307 [26:10:25<205:04:01,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23012/203307 [26:10:25<205:04:01,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23013/203307 [26:10:30<205:03:59,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23013/203307 [26:10:30<205:03:59,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23014/203307 [26:10:33<205:03:52,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23014/203307 [26:10:33<205:03:52,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23015/203307 [26:10:38<205:03:51,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23015/203307 [26:10:38<205:03:51,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23016/203307 [26:10:42<205:03:47,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23016/203307 [26:10:42<205:03:47,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23017/203307 [26:10:45<205:03:39,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23017/203307 [26:10:45<205:03:39,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23018/203307 [26:10:50<205:03:38,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23018/203307 [26:10:50<205:03:38,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23019/203307 [26:10:54<205:03:35,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23019/203307 [26:10:54<205:03:35,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23020/203307 [26:10:58<205:03:28,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23020/203307 [26:10:58<205:03:28,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23021/203307 [26:11:02<205:03:26,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  11%|█▏        | 23021/203307 [26:11:02<205:03:26,  0.24it/s, v_num=t5e6, training/loss=0.080] Epoch 0:  11%|█▏        | 23022/203307 [26:11:06<205:03:19,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23022/203307 [26:11:06<205:03:19,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23023/203307 [26:11:10<205:03:11,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23023/203307 [26:11:10<205:03:11,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23024/203307 [26:11:14<205:03:10,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23024/203307 [26:11:14<205:03:10,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23025/203307 [26:11:18<205:03:07,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23025/203307 [26:11:18<205:03:07,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23026/203307 [26:11:22<205:03:00,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23026/203307 [26:11:22<205:03:00,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23027/203307 [26:11:27<205:02:59,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23027/203307 [26:11:27<205:02:59,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23028/203307 [26:11:30<205:02:52,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23028/203307 [26:11:30<205:02:52,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23029/203307 [26:11:34<205:02:45,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23029/203307 [26:11:34<205:02:45,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23030/203307 [26:11:38<205:02:43,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23030/203307 [26:11:38<205:02:43,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23031/203307 [26:11:42<205:02:36,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23031/203307 [26:11:42<205:02:36,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23032/203307 [26:11:46<205:02:28,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23032/203307 [26:11:46<205:02:28,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23033/203307 [26:11:50<205:02:27,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23033/203307 [26:11:50<205:02:27,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23034/203307 [26:11:54<205:02:24,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23034/203307 [26:11:54<205:02:24,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23035/203307 [26:11:59<205:02:22,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23035/203307 [26:11:59<205:02:22,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23036/203307 [26:12:03<205:02:19,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23036/203307 [26:12:03<205:02:19,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23037/203307 [26:12:07<205:02:11,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23037/203307 [26:12:07<205:02:11,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23038/203307 [26:12:11<205:02:08,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23038/203307 [26:12:11<205:02:08,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23039/203307 [26:12:15<205:02:06,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23039/203307 [26:12:15<205:02:06,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23040/203307 [26:12:19<205:02:00,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23040/203307 [26:12:19<205:02:00,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23041/203307 [26:12:23<205:01:57,  0.24it/s, v_num=t5e6, training/loss=0.080]Epoch 0:  11%|█▏        | 23041/203307 [26:12:23<205:01:57,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23042/203307 [26:12:27<205:01:51,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23042/203307 [26:12:27<205:01:51,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23043/203307 [26:12:31<205:01:48,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23043/203307 [26:12:31<205:01:48,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23044/203307 [26:12:36<205:01:46,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23044/203307 [26:12:36<205:01:46,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23045/203307 [26:12:40<205:01:43,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23045/203307 [26:12:40<205:01:43,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23046/203307 [26:12:44<205:01:36,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23046/203307 [26:12:44<205:01:36,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23047/203307 [26:12:48<205:01:34,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23047/203307 [26:12:48<205:01:34,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23048/203307 [26:12:52<205:01:29,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23048/203307 [26:12:52<205:01:29,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23049/203307 [26:12:56<205:01:23,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23049/203307 [26:12:56<205:01:23,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23050/203307 [26:13:00<205:01:21,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23050/203307 [26:13:00<205:01:21,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23051/203307 [26:13:04<205:01:14,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23051/203307 [26:13:04<205:01:14,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23052/203307 [26:13:08<205:01:11,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23052/203307 [26:13:08<205:01:11,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23053/203307 [26:13:13<205:01:10,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23053/203307 [26:13:13<205:01:10,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23054/203307 [26:13:16<205:01:03,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23054/203307 [26:13:16<205:01:03,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23055/203307 [26:13:20<205:00:56,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23055/203307 [26:13:20<205:00:56,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23056/203307 [26:13:25<205:00:55,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23056/203307 [26:13:25<205:00:55,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23057/203307 [26:13:28<205:00:48,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23057/203307 [26:13:28<205:00:48,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23058/203307 [26:13:32<205:00:41,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23058/203307 [26:13:32<205:00:41,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23059/203307 [26:13:37<205:00:40,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23059/203307 [26:13:37<205:00:40,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23060/203307 [26:13:40<205:00:33,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23060/203307 [26:13:40<205:00:33,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23061/203307 [26:13:45<205:00:31,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  11%|█▏        | 23061/203307 [26:13:45<205:00:31,  0.24it/s, v_num=t5e6, training/loss=0.083] Epoch 0:  11%|█▏        | 23062/203307 [26:13:49<205:00:29,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23062/203307 [26:13:49<205:00:29,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23063/203307 [26:13:53<205:00:22,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23063/203307 [26:13:53<205:00:22,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23064/203307 [26:13:57<205:00:20,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23064/203307 [26:13:57<205:00:20,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23065/203307 [26:14:01<205:00:17,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23065/203307 [26:14:01<205:00:17,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23066/203307 [26:14:05<205:00:10,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23066/203307 [26:14:05<205:00:10,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23067/203307 [26:14:09<205:00:09,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23067/203307 [26:14:09<205:00:09,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23068/203307 [26:14:13<205:00:02,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23068/203307 [26:14:13<205:00:02,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23069/203307 [26:14:17<204:59:55,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23069/203307 [26:14:17<204:59:55,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23070/203307 [26:14:21<204:59:54,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23070/203307 [26:14:21<204:59:54,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23071/203307 [26:14:26<204:59:51,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23071/203307 [26:14:26<204:59:51,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23072/203307 [26:14:29<204:59:44,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23072/203307 [26:14:29<204:59:44,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23073/203307 [26:14:34<204:59:41,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23073/203307 [26:14:34<204:59:41,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23074/203307 [26:14:37<204:59:34,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23074/203307 [26:14:37<204:59:34,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23075/203307 [26:14:41<204:59:27,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23075/203307 [26:14:41<204:59:27,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23076/203307 [26:14:46<204:59:26,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23076/203307 [26:14:46<204:59:26,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23077/203307 [26:14:49<204:59:19,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23077/203307 [26:14:49<204:59:19,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23078/203307 [26:14:53<204:59:12,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23078/203307 [26:14:53<204:59:12,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23079/203307 [26:14:57<204:59:11,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23079/203307 [26:14:57<204:59:11,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23080/203307 [26:15:01<204:59:04,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23080/203307 [26:15:01<204:59:04,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23081/203307 [26:15:05<204:58:57,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  11%|█▏        | 23081/203307 [26:15:05<204:58:57,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23082/203307 [26:15:09<204:58:55,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23082/203307 [26:15:09<204:58:55,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23083/203307 [26:15:13<204:58:48,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23083/203307 [26:15:13<204:58:48,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23084/203307 [26:15:17<204:58:41,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23084/203307 [26:15:17<204:58:41,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23085/203307 [26:15:21<204:58:40,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23085/203307 [26:15:21<204:58:40,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23086/203307 [26:15:25<204:58:33,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23086/203307 [26:15:25<204:58:34,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23087/203307 [26:15:29<204:58:32,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23087/203307 [26:15:29<204:58:32,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23088/203307 [26:15:34<204:58:30,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23088/203307 [26:15:34<204:58:30,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23089/203307 [26:15:37<204:58:22,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23089/203307 [26:15:37<204:58:22,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23090/203307 [26:15:42<204:58:20,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23090/203307 [26:15:42<204:58:20,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23091/203307 [26:15:46<204:58:18,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23091/203307 [26:15:46<204:58:18,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23092/203307 [26:15:50<204:58:11,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23092/203307 [26:15:50<204:58:11,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23093/203307 [26:15:54<204:58:09,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23093/203307 [26:15:54<204:58:09,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23094/203307 [26:15:58<204:58:02,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23094/203307 [26:15:58<204:58:02,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23095/203307 [26:16:02<204:57:55,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23095/203307 [26:16:02<204:57:55,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23096/203307 [26:16:06<204:57:54,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23096/203307 [26:16:06<204:57:54,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23097/203307 [26:16:10<204:57:51,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23097/203307 [26:16:10<204:57:51,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23098/203307 [26:16:14<204:57:44,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23098/203307 [26:16:14<204:57:44,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23099/203307 [26:16:19<204:57:43,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23099/203307 [26:16:19<204:57:43,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23100/203307 [26:16:22<204:57:36,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23100/203307 [26:16:22<204:57:36,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23101/203307 [26:16:26<204:57:30,  0.24it/s, v_num=t5e6, training/loss=0.0804]Epoch 0:  11%|█▏        | 23101/203307 [26:16:26<204:57:30,  0.24it/s, v_num=t5e6, training/loss=0.094] Epoch 0:  11%|█▏        | 23102/203307 [26:16:31<204:57:28,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23102/203307 [26:16:31<204:57:28,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23103/203307 [26:16:34<204:57:21,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23103/203307 [26:16:34<204:57:21,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23104/203307 [26:16:38<204:57:14,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23104/203307 [26:16:38<204:57:14,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23105/203307 [26:16:42<204:57:13,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23105/203307 [26:16:42<204:57:13,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23106/203307 [26:16:47<204:57:10,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23106/203307 [26:16:47<204:57:10,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23107/203307 [26:16:50<204:57:02,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23107/203307 [26:16:50<204:57:02,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23108/203307 [26:16:55<204:57:00,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23108/203307 [26:16:55<204:57:00,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23109/203307 [26:16:58<204:56:54,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23109/203307 [26:16:58<204:56:54,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23110/203307 [26:17:02<204:56:47,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23110/203307 [26:17:02<204:56:47,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23111/203307 [26:17:07<204:56:45,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23111/203307 [26:17:07<204:56:45,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23112/203307 [26:17:10<204:56:38,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23112/203307 [26:17:10<204:56:38,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23113/203307 [26:17:15<204:56:36,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23113/203307 [26:17:15<204:56:36,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23114/203307 [26:17:19<204:56:34,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23114/203307 [26:17:19<204:56:34,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23115/203307 [26:17:23<204:56:31,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23115/203307 [26:17:23<204:56:31,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23116/203307 [26:17:27<204:56:28,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23116/203307 [26:17:27<204:56:28,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23117/203307 [26:17:32<204:56:25,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23117/203307 [26:17:32<204:56:25,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23118/203307 [26:17:35<204:56:18,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23118/203307 [26:17:35<204:56:18,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23119/203307 [26:17:40<204:56:16,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23119/203307 [26:17:40<204:56:16,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23120/203307 [26:17:44<204:56:09,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23120/203307 [26:17:44<204:56:09,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23121/203307 [26:17:47<204:56:01,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  11%|█▏        | 23121/203307 [26:17:47<204:56:01,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23122/203307 [26:17:52<204:56:00,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23122/203307 [26:17:52<204:56:00,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23123/203307 [26:17:56<204:55:57,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23123/203307 [26:17:56<204:55:57,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23124/203307 [26:18:00<204:55:54,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23124/203307 [26:18:00<204:55:54,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23125/203307 [26:18:04<204:55:51,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23125/203307 [26:18:04<204:55:51,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23126/203307 [26:18:08<204:55:44,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23126/203307 [26:18:08<204:55:44,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23127/203307 [26:18:12<204:55:37,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23127/203307 [26:18:12<204:55:37,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23128/203307 [26:18:16<204:55:36,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23128/203307 [26:18:16<204:55:36,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23129/203307 [26:18:20<204:55:30,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23129/203307 [26:18:20<204:55:30,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23130/203307 [26:18:24<204:55:23,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23130/203307 [26:18:24<204:55:23,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23131/203307 [26:18:28<204:55:23,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23131/203307 [26:18:28<204:55:23,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23132/203307 [26:18:32<204:55:16,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23132/203307 [26:18:32<204:55:16,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23133/203307 [26:18:36<204:55:13,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23133/203307 [26:18:36<204:55:13,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23134/203307 [26:18:41<204:55:11,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23134/203307 [26:18:41<204:55:11,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23135/203307 [26:18:44<204:55:03,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23135/203307 [26:18:44<204:55:03,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23136/203307 [26:18:48<204:54:56,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23136/203307 [26:18:48<204:54:56,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23137/203307 [26:18:53<204:54:55,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23137/203307 [26:18:53<204:54:55,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23138/203307 [26:18:56<204:54:47,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23138/203307 [26:18:56<204:54:47,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23139/203307 [26:19:01<204:54:45,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23139/203307 [26:19:01<204:54:45,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23140/203307 [26:19:05<204:54:43,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23140/203307 [26:19:05<204:54:43,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23141/203307 [26:19:09<204:54:35,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  11%|█▏        | 23141/203307 [26:19:09<204:54:35,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23142/203307 [26:19:13<204:54:33,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23142/203307 [26:19:13<204:54:33,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23143/203307 [26:19:17<204:54:30,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23143/203307 [26:19:17<204:54:30,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23144/203307 [26:19:21<204:54:23,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23144/203307 [26:19:21<204:54:23,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23145/203307 [26:19:25<204:54:22,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23145/203307 [26:19:25<204:54:22,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23146/203307 [26:19:29<204:54:15,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23146/203307 [26:19:29<204:54:15,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23147/203307 [26:19:33<204:54:08,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23147/203307 [26:19:33<204:54:08,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23148/203307 [26:19:37<204:54:07,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23148/203307 [26:19:37<204:54:07,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23149/203307 [26:19:42<204:54:04,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23149/203307 [26:19:42<204:54:04,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23150/203307 [26:19:45<204:53:57,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23150/203307 [26:19:45<204:53:57,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23151/203307 [26:19:50<204:53:55,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23151/203307 [26:19:50<204:53:55,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23152/203307 [26:19:53<204:53:48,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23152/203307 [26:19:53<204:53:48,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23153/203307 [26:19:57<204:53:41,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23153/203307 [26:19:57<204:53:41,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23154/203307 [26:20:02<204:53:41,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23154/203307 [26:20:02<204:53:41,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23155/203307 [26:20:05<204:53:34,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23155/203307 [26:20:05<204:53:34,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23156/203307 [26:20:09<204:53:26,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23156/203307 [26:20:09<204:53:26,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23157/203307 [26:20:14<204:53:26,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23157/203307 [26:20:14<204:53:26,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23158/203307 [26:20:17<204:53:19,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23158/203307 [26:20:17<204:53:19,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23159/203307 [26:20:21<204:53:13,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23159/203307 [26:20:21<204:53:13,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23160/203307 [26:20:26<204:53:12,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23160/203307 [26:20:26<204:53:12,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23161/203307 [26:20:29<204:53:05,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  11%|█▏        | 23161/203307 [26:20:29<204:53:05,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23162/203307 [26:20:33<204:52:59,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23162/203307 [26:20:33<204:52:59,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23163/203307 [26:20:38<204:52:58,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23163/203307 [26:20:38<204:52:58,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23164/203307 [26:20:41<204:52:51,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23164/203307 [26:20:41<204:52:51,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23165/203307 [26:20:46<204:52:50,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23165/203307 [26:20:46<204:52:50,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23166/203307 [26:20:50<204:52:47,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23166/203307 [26:20:50<204:52:47,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23167/203307 [26:20:54<204:52:40,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23167/203307 [26:20:54<204:52:40,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23168/203307 [26:20:58<204:52:38,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23168/203307 [26:20:58<204:52:38,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23169/203307 [26:21:03<204:52:36,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23169/203307 [26:21:03<204:52:36,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23170/203307 [26:21:06<204:52:29,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23170/203307 [26:21:06<204:52:29,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23171/203307 [26:21:11<204:52:28,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23171/203307 [26:21:11<204:52:28,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23172/203307 [26:21:14<204:52:21,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23172/203307 [26:21:14<204:52:21,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23173/203307 [26:21:18<204:52:14,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23173/203307 [26:21:18<204:52:14,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23174/203307 [26:21:23<204:52:13,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23174/203307 [26:21:23<204:52:13,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23175/203307 [26:21:27<204:52:10,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23175/203307 [26:21:27<204:52:10,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23176/203307 [26:21:31<204:52:02,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23176/203307 [26:21:31<204:52:02,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23177/203307 [26:21:35<204:52:00,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23177/203307 [26:21:35<204:52:00,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23178/203307 [26:21:39<204:51:57,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23178/203307 [26:21:39<204:51:57,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23179/203307 [26:21:43<204:51:50,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23179/203307 [26:21:43<204:51:50,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23180/203307 [26:21:47<204:51:49,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23180/203307 [26:21:47<204:51:49,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23181/203307 [26:21:51<204:51:41,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  11%|█▏        | 23181/203307 [26:21:51<204:51:41,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23182/203307 [26:21:55<204:51:34,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23182/203307 [26:21:55<204:51:34,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23183/203307 [26:21:59<204:51:33,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23183/203307 [26:21:59<204:51:33,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23184/203307 [26:22:03<204:51:26,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23184/203307 [26:22:03<204:51:26,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23185/203307 [26:22:07<204:51:18,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23185/203307 [26:22:07<204:51:18,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23186/203307 [26:22:11<204:51:16,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23186/203307 [26:22:11<204:51:16,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23187/203307 [26:22:15<204:51:13,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23187/203307 [26:22:15<204:51:13,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23188/203307 [26:22:19<204:51:07,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23188/203307 [26:22:19<204:51:07,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23189/203307 [26:22:23<204:51:06,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23189/203307 [26:22:23<204:51:06,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23190/203307 [26:22:27<204:50:58,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23190/203307 [26:22:27<204:50:58,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23191/203307 [26:22:31<204:50:56,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23191/203307 [26:22:31<204:50:57,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23192/203307 [26:22:36<204:50:54,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23192/203307 [26:22:36<204:50:54,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23193/203307 [26:22:39<204:50:47,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23193/203307 [26:22:39<204:50:47,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23194/203307 [26:22:44<204:50:44,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23194/203307 [26:22:44<204:50:44,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23195/203307 [26:22:48<204:50:41,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23195/203307 [26:22:48<204:50:41,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23196/203307 [26:22:52<204:50:37,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23196/203307 [26:22:52<204:50:37,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23197/203307 [26:22:56<204:50:35,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23197/203307 [26:22:56<204:50:35,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23198/203307 [26:23:00<204:50:28,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23198/203307 [26:23:00<204:50:28,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23199/203307 [26:23:04<204:50:20,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23199/203307 [26:23:04<204:50:20,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23200/203307 [26:23:08<204:50:19,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23200/203307 [26:23:08<204:50:19,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23201/203307 [26:23:13<204:50:17,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  11%|█▏        | 23201/203307 [26:23:13<204:50:17,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23202/203307 [26:23:16<204:50:10,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23202/203307 [26:23:16<204:50:10,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23203/203307 [26:23:21<204:50:08,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23203/203307 [26:23:21<204:50:08,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23204/203307 [26:23:24<204:50:01,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23204/203307 [26:23:24<204:50:01,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23205/203307 [26:23:29<204:49:58,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23205/203307 [26:23:29<204:49:58,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23206/203307 [26:23:33<204:49:56,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23206/203307 [26:23:33<204:49:56,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23207/203307 [26:23:37<204:49:49,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23207/203307 [26:23:37<204:49:49,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23208/203307 [26:23:40<204:49:41,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23208/203307 [26:23:40<204:49:41,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23209/203307 [26:23:45<204:49:41,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23209/203307 [26:23:45<204:49:41,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23210/203307 [26:23:48<204:49:33,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23210/203307 [26:23:49<204:49:33,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23211/203307 [26:23:52<204:49:26,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23211/203307 [26:23:52<204:49:26,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23212/203307 [26:23:57<204:49:24,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23212/203307 [26:23:57<204:49:24,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23213/203307 [26:24:00<204:49:17,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23213/203307 [26:24:00<204:49:17,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23214/203307 [26:24:04<204:49:13,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23214/203307 [26:24:04<204:49:13,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23215/203307 [26:24:09<204:49:11,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23215/203307 [26:24:09<204:49:11,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23216/203307 [26:24:13<204:49:04,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23216/203307 [26:24:13<204:49:04,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23217/203307 [26:24:17<204:49:02,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23217/203307 [26:24:17<204:49:02,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23218/203307 [26:24:21<204:49:00,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23218/203307 [26:24:21<204:49:00,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23219/203307 [26:24:25<204:48:53,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23219/203307 [26:24:25<204:48:53,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23220/203307 [26:24:29<204:48:51,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23220/203307 [26:24:29<204:48:51,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23221/203307 [26:24:34<204:48:49,  0.24it/s, v_num=t5e6, training/loss=0.0963]Epoch 0:  11%|█▏        | 23221/203307 [26:24:34<204:48:49,  0.24it/s, v_num=t5e6, training/loss=0.088] Epoch 0:  11%|█▏        | 23222/203307 [26:24:37<204:48:42,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23222/203307 [26:24:37<204:48:42,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23223/203307 [26:24:42<204:48:40,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23223/203307 [26:24:42<204:48:40,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23224/203307 [26:24:45<204:48:33,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23224/203307 [26:24:45<204:48:33,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23225/203307 [26:24:49<204:48:26,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23225/203307 [26:24:49<204:48:26,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23226/203307 [26:24:54<204:48:25,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23226/203307 [26:24:54<204:48:25,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23227/203307 [26:24:58<204:48:22,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23227/203307 [26:24:58<204:48:22,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23228/203307 [26:25:02<204:48:14,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23228/203307 [26:25:02<204:48:14,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23229/203307 [26:25:06<204:48:12,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23229/203307 [26:25:06<204:48:12,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23230/203307 [26:25:10<204:48:06,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23230/203307 [26:25:10<204:48:06,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23231/203307 [26:25:13<204:47:58,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23231/203307 [26:25:13<204:47:59,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23232/203307 [26:25:18<204:47:58,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23232/203307 [26:25:18<204:47:58,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23233/203307 [26:25:22<204:47:50,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23233/203307 [26:25:22<204:47:50,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23234/203307 [26:25:25<204:47:43,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23234/203307 [26:25:25<204:47:43,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23235/203307 [26:25:30<204:47:42,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23235/203307 [26:25:30<204:47:42,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23236/203307 [26:25:33<204:47:35,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23236/203307 [26:25:33<204:47:35,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23237/203307 [26:25:37<204:47:28,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23237/203307 [26:25:37<204:47:28,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23238/203307 [26:25:42<204:47:26,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23238/203307 [26:25:42<204:47:26,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23239/203307 [26:25:45<204:47:19,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23239/203307 [26:25:45<204:47:19,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23240/203307 [26:25:49<204:47:12,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23240/203307 [26:25:49<204:47:12,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23241/203307 [26:25:53<204:47:10,  0.24it/s, v_num=t5e6, training/loss=0.088]Epoch 0:  11%|█▏        | 23241/203307 [26:25:53<204:47:10,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23242/203307 [26:25:57<204:47:03,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23242/203307 [26:25:57<204:47:03,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23243/203307 [26:26:01<204:47:01,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23243/203307 [26:26:01<204:47:01,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23244/203307 [26:26:06<204:46:58,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23244/203307 [26:26:06<204:46:58,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23245/203307 [26:26:09<204:46:51,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23245/203307 [26:26:09<204:46:51,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23246/203307 [26:26:14<204:46:49,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23246/203307 [26:26:14<204:46:49,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23247/203307 [26:26:18<204:46:46,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23247/203307 [26:26:18<204:46:46,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23248/203307 [26:26:22<204:46:39,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23248/203307 [26:26:22<204:46:39,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23249/203307 [26:26:26<204:46:37,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23249/203307 [26:26:26<204:46:37,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23250/203307 [26:26:30<204:46:33,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23250/203307 [26:26:30<204:46:33,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23251/203307 [26:26:34<204:46:28,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23251/203307 [26:26:34<204:46:28,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23252/203307 [26:26:39<204:46:26,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23252/203307 [26:26:39<204:46:26,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23253/203307 [26:26:43<204:46:23,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23253/203307 [26:26:43<204:46:23,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23254/203307 [26:26:46<204:46:15,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23254/203307 [26:26:46<204:46:15,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23255/203307 [26:26:51<204:46:12,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23255/203307 [26:26:51<204:46:12,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23256/203307 [26:26:54<204:46:06,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23256/203307 [26:26:54<204:46:06,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23257/203307 [26:26:58<204:45:58,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23257/203307 [26:26:58<204:45:58,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23258/203307 [26:27:02<204:45:57,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23258/203307 [26:27:02<204:45:57,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23259/203307 [26:27:07<204:45:54,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23259/203307 [26:27:07<204:45:54,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23260/203307 [26:27:10<204:45:46,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23260/203307 [26:27:10<204:45:46,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23261/203307 [26:27:15<204:45:45,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  11%|█▏        | 23261/203307 [26:27:15<204:45:45,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23262/203307 [26:27:19<204:45:38,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23262/203307 [26:27:19<204:45:38,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23263/203307 [26:27:22<204:45:30,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23263/203307 [26:27:22<204:45:30,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23264/203307 [26:27:26<204:45:28,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23264/203307 [26:27:27<204:45:28,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23265/203307 [26:27:30<204:45:21,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23265/203307 [26:27:30<204:45:21,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23266/203307 [26:27:34<204:45:13,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23266/203307 [26:27:34<204:45:13,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23267/203307 [26:27:38<204:45:12,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23267/203307 [26:27:38<204:45:12,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23268/203307 [26:27:42<204:45:09,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23268/203307 [26:27:42<204:45:09,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23269/203307 [26:27:47<204:45:06,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23269/203307 [26:27:47<204:45:06,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23270/203307 [26:27:51<204:45:03,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23270/203307 [26:27:51<204:45:03,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23271/203307 [26:27:55<204:44:56,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23271/203307 [26:27:55<204:44:56,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23272/203307 [26:27:59<204:44:54,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23272/203307 [26:27:59<204:44:54,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23273/203307 [26:28:04<204:44:53,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23273/203307 [26:28:04<204:44:53,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23274/203307 [26:28:07<204:44:45,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23274/203307 [26:28:07<204:44:45,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23275/203307 [26:28:12<204:44:43,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23275/203307 [26:28:12<204:44:43,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23276/203307 [26:28:15<204:44:36,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23276/203307 [26:28:15<204:44:36,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23277/203307 [26:28:19<204:44:32,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23277/203307 [26:28:19<204:44:33,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23278/203307 [26:28:24<204:44:31,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23278/203307 [26:28:24<204:44:31,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23279/203307 [26:28:28<204:44:28,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23279/203307 [26:28:28<204:44:29,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23280/203307 [26:28:32<204:44:21,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23280/203307 [26:28:32<204:44:22,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23281/203307 [26:28:36<204:44:20,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  11%|█▏        | 23281/203307 [26:28:36<204:44:20,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23282/203307 [26:28:40<204:44:13,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23282/203307 [26:28:40<204:44:13,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23283/203307 [26:28:44<204:44:06,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23283/203307 [26:28:44<204:44:06,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23284/203307 [26:28:48<204:44:05,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23284/203307 [26:28:48<204:44:05,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23285/203307 [26:28:52<204:43:58,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23285/203307 [26:28:52<204:43:58,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23286/203307 [26:28:56<204:43:54,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23286/203307 [26:28:56<204:43:54,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23287/203307 [26:29:01<204:43:54,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23287/203307 [26:29:01<204:43:54,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23288/203307 [26:29:04<204:43:47,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23288/203307 [26:29:04<204:43:47,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23289/203307 [26:29:08<204:43:40,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23289/203307 [26:29:08<204:43:40,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23290/203307 [26:29:13<204:43:38,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23290/203307 [26:29:13<204:43:38,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23291/203307 [26:29:16<204:43:31,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23291/203307 [26:29:16<204:43:31,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23292/203307 [26:29:20<204:43:23,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23292/203307 [26:29:20<204:43:23,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23293/203307 [26:29:24<204:43:22,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23293/203307 [26:29:24<204:43:22,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23294/203307 [26:29:28<204:43:14,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23294/203307 [26:29:28<204:43:14,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23295/203307 [26:29:32<204:43:12,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23295/203307 [26:29:32<204:43:12,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23296/203307 [26:29:36<204:43:08,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23296/203307 [26:29:36<204:43:08,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23297/203307 [26:29:40<204:43:00,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23297/203307 [26:29:40<204:43:00,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23298/203307 [26:29:44<204:42:57,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23298/203307 [26:29:44<204:42:57,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23299/203307 [26:29:48<204:42:54,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23299/203307 [26:29:48<204:42:54,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23300/203307 [26:29:52<204:42:46,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23300/203307 [26:29:52<204:42:46,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23301/203307 [26:29:56<204:42:44,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23301/203307 [26:29:56<204:42:44,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23302/203307 [26:30:00<204:42:36,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23302/203307 [26:30:00<204:42:36,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23303/203307 [26:30:04<204:42:28,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23303/203307 [26:30:04<204:42:28,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23304/203307 [26:30:08<204:42:26,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23304/203307 [26:30:08<204:42:26,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23305/203307 [26:30:12<204:42:23,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23305/203307 [26:30:12<204:42:23,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23306/203307 [26:30:16<204:42:15,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23306/203307 [26:30:16<204:42:15,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23307/203307 [26:30:20<204:42:14,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23307/203307 [26:30:20<204:42:14,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23308/203307 [26:30:24<204:42:07,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23308/203307 [26:30:24<204:42:07,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23309/203307 [26:30:28<204:41:59,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23309/203307 [26:30:28<204:41:59,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23310/203307 [26:30:32<204:41:58,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23310/203307 [26:30:32<204:41:58,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23311/203307 [26:30:36<204:41:51,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23311/203307 [26:30:36<204:41:51,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23312/203307 [26:30:39<204:41:43,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23312/203307 [26:30:39<204:41:43,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23313/203307 [26:30:44<204:41:42,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23313/203307 [26:30:44<204:41:42,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23314/203307 [26:30:48<204:41:35,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23314/203307 [26:30:48<204:41:35,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23315/203307 [26:30:51<204:41:28,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23315/203307 [26:30:51<204:41:28,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23316/203307 [26:30:56<204:41:25,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23316/203307 [26:30:56<204:41:25,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23317/203307 [26:30:59<204:41:18,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23317/203307 [26:30:59<204:41:18,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23318/203307 [26:31:03<204:41:10,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23318/203307 [26:31:03<204:41:10,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23319/203307 [26:31:07<204:41:09,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23319/203307 [26:31:07<204:41:09,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23320/203307 [26:31:11<204:41:02,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23320/203307 [26:31:11<204:41:02,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23321/203307 [26:31:15<204:41:00,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  11%|█▏        | 23321/203307 [26:31:15<204:41:00,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23322/203307 [26:31:20<204:40:57,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23322/203307 [26:31:20<204:40:57,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23323/203307 [26:31:23<204:40:50,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23323/203307 [26:31:23<204:40:50,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23324/203307 [26:31:28<204:40:48,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23324/203307 [26:31:28<204:40:48,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23325/203307 [26:31:32<204:40:45,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23325/203307 [26:31:32<204:40:45,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23326/203307 [26:31:36<204:40:38,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23326/203307 [26:31:36<204:40:38,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23327/203307 [26:31:40<204:40:36,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23327/203307 [26:31:40<204:40:36,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23328/203307 [26:31:44<204:40:29,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23328/203307 [26:31:44<204:40:29,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23329/203307 [26:31:47<204:40:21,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23329/203307 [26:31:47<204:40:21,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23330/203307 [26:31:52<204:40:20,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23330/203307 [26:31:52<204:40:20,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23331/203307 [26:31:56<204:40:17,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23331/203307 [26:31:56<204:40:17,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23332/203307 [26:32:00<204:40:10,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23332/203307 [26:32:00<204:40:10,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23333/203307 [26:32:04<204:40:07,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23333/203307 [26:32:04<204:40:07,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23334/203307 [26:32:08<204:40:00,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23334/203307 [26:32:08<204:40:00,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23335/203307 [26:32:11<204:39:53,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23335/203307 [26:32:11<204:39:53,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23336/203307 [26:32:16<204:39:51,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23336/203307 [26:32:16<204:39:52,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23337/203307 [26:32:20<204:39:44,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23337/203307 [26:32:20<204:39:44,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23338/203307 [26:32:23<204:39:37,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23338/203307 [26:32:23<204:39:37,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23339/203307 [26:32:28<204:39:36,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23339/203307 [26:32:28<204:39:36,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23340/203307 [26:32:32<204:39:33,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23340/203307 [26:32:32<204:39:33,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23341/203307 [26:32:36<204:39:26,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  11%|█▏        | 23341/203307 [26:32:36<204:39:26,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23342/203307 [26:32:40<204:39:24,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23342/203307 [26:32:40<204:39:24,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23343/203307 [26:32:44<204:39:17,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23343/203307 [26:32:44<204:39:17,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23344/203307 [26:32:47<204:39:10,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23344/203307 [26:32:47<204:39:10,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23345/203307 [26:32:52<204:39:10,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23345/203307 [26:32:52<204:39:10,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23346/203307 [26:32:56<204:39:02,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23346/203307 [26:32:56<204:39:02,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23347/203307 [26:33:00<204:39:00,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23347/203307 [26:33:00<204:39:00,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23348/203307 [26:33:04<204:38:58,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23348/203307 [26:33:04<204:38:58,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23349/203307 [26:33:09<204:38:55,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23349/203307 [26:33:09<204:38:55,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23350/203307 [26:33:13<204:38:52,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23350/203307 [26:33:13<204:38:52,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23351/203307 [26:33:17<204:38:50,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23351/203307 [26:33:17<204:38:50,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23352/203307 [26:33:21<204:38:42,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23352/203307 [26:33:21<204:38:42,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23353/203307 [26:33:25<204:38:41,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23353/203307 [26:33:25<204:38:41,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23354/203307 [26:33:29<204:38:34,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23354/203307 [26:33:29<204:38:34,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23355/203307 [26:33:33<204:38:26,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23355/203307 [26:33:33<204:38:26,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23356/203307 [26:33:37<204:38:25,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23356/203307 [26:33:37<204:38:25,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23357/203307 [26:33:41<204:38:22,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23357/203307 [26:33:41<204:38:22,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23358/203307 [26:33:45<204:38:18,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23358/203307 [26:33:45<204:38:18,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23359/203307 [26:33:50<204:38:15,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23359/203307 [26:33:50<204:38:15,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23360/203307 [26:33:53<204:38:07,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23360/203307 [26:33:53<204:38:07,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23361/203307 [26:33:57<204:38:00,  0.24it/s, v_num=t5e6, training/loss=0.0758]Epoch 0:  11%|█▏        | 23361/203307 [26:33:57<204:38:00,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23362/203307 [26:34:01<204:37:58,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23362/203307 [26:34:01<204:37:58,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23363/203307 [26:34:05<204:37:51,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23363/203307 [26:34:05<204:37:51,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23364/203307 [26:34:09<204:37:43,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23364/203307 [26:34:09<204:37:43,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23365/203307 [26:34:13<204:37:43,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23365/203307 [26:34:13<204:37:43,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23366/203307 [26:34:17<204:37:36,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23366/203307 [26:34:17<204:37:36,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23367/203307 [26:34:21<204:37:33,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23367/203307 [26:34:21<204:37:33,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23368/203307 [26:34:26<204:37:30,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23368/203307 [26:34:26<204:37:30,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23369/203307 [26:34:29<204:37:23,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23369/203307 [26:34:29<204:37:23,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23370/203307 [26:34:33<204:37:15,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23370/203307 [26:34:33<204:37:15,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23371/203307 [26:34:37<204:37:14,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23371/203307 [26:34:37<204:37:14,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23372/203307 [26:34:41<204:37:07,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23372/203307 [26:34:41<204:37:07,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23373/203307 [26:34:45<204:37:05,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23373/203307 [26:34:45<204:37:05,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23374/203307 [26:34:50<204:37:02,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23374/203307 [26:34:50<204:37:02,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23375/203307 [26:34:53<204:36:54,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23375/203307 [26:34:53<204:36:54,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23376/203307 [26:34:58<204:36:52,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23376/203307 [26:34:58<204:36:52,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23377/203307 [26:35:02<204:36:49,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23377/203307 [26:35:02<204:36:49,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23378/203307 [26:35:06<204:36:42,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23378/203307 [26:35:06<204:36:42,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23379/203307 [26:35:10<204:36:40,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23379/203307 [26:35:10<204:36:40,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23380/203307 [26:35:14<204:36:32,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  11%|█▏        | 23380/203307 [26:35:14<204:36:32,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23381/203307 [26:35:17<204:36:26,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23381/203307 [26:35:17<204:36:26,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23382/203307 [26:35:22<204:36:25,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23382/203307 [26:35:22<204:36:25,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23383/203307 [26:35:26<204:36:23,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23383/203307 [26:35:26<204:36:23,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23384/203307 [26:35:30<204:36:16,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23384/203307 [26:35:30<204:36:16,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23385/203307 [26:35:34<204:36:14,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23385/203307 [26:35:34<204:36:14,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23386/203307 [26:35:38<204:36:06,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23386/203307 [26:35:38<204:36:06,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23387/203307 [26:35:42<204:35:59,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23387/203307 [26:35:42<204:35:59,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23388/203307 [26:35:46<204:35:59,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23388/203307 [26:35:46<204:35:59,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23389/203307 [26:35:50<204:35:53,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23389/203307 [26:35:50<204:35:53,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23390/203307 [26:35:54<204:35:46,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23390/203307 [26:35:54<204:35:46,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23391/203307 [26:35:58<204:35:45,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23391/203307 [26:35:58<204:35:45,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23392/203307 [26:36:02<204:35:38,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23392/203307 [26:36:02<204:35:38,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23393/203307 [26:36:06<204:35:31,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23393/203307 [26:36:06<204:35:31,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23394/203307 [26:36:10<204:35:29,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23394/203307 [26:36:10<204:35:29,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23395/203307 [26:36:14<204:35:23,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23395/203307 [26:36:14<204:35:23,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23396/203307 [26:36:18<204:35:16,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23396/203307 [26:36:18<204:35:16,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23397/203307 [26:36:22<204:35:16,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23397/203307 [26:36:22<204:35:16,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23398/203307 [26:36:26<204:35:09,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23398/203307 [26:36:26<204:35:09,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23399/203307 [26:36:30<204:35:06,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23399/203307 [26:36:30<204:35:06,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23400/203307 [26:36:35<204:35:03,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23400/203307 [26:36:35<204:35:03,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23401/203307 [26:36:38<204:34:56,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 23401/203307 [26:36:38<204:34:56,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23402/203307 [26:36:42<204:34:54,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23402/203307 [26:36:42<204:34:54,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23403/203307 [26:36:47<204:34:50,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23403/203307 [26:36:47<204:34:50,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23404/203307 [26:36:50<204:34:43,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23404/203307 [26:36:50<204:34:43,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23405/203307 [26:36:55<204:34:41,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23405/203307 [26:36:55<204:34:41,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23406/203307 [26:36:58<204:34:34,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23406/203307 [26:36:58<204:34:34,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23407/203307 [26:37:02<204:34:26,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23407/203307 [26:37:02<204:34:26,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23408/203307 [26:37:07<204:34:25,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23408/203307 [26:37:07<204:34:25,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23409/203307 [26:37:11<204:34:22,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23409/203307 [26:37:11<204:34:22,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23410/203307 [26:37:14<204:34:15,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23410/203307 [26:37:14<204:34:15,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23411/203307 [26:37:19<204:34:12,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23411/203307 [26:37:19<204:34:12,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23412/203307 [26:37:23<204:34:09,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23412/203307 [26:37:23<204:34:09,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23413/203307 [26:37:27<204:34:02,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23413/203307 [26:37:27<204:34:02,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23414/203307 [26:37:31<204:34:01,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23414/203307 [26:37:31<204:34:01,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23415/203307 [26:37:35<204:33:54,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23415/203307 [26:37:35<204:33:54,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23416/203307 [26:37:39<204:33:46,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23416/203307 [26:37:39<204:33:46,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23417/203307 [26:37:43<204:33:45,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23417/203307 [26:37:43<204:33:46,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23418/203307 [26:37:47<204:33:39,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23418/203307 [26:37:47<204:33:39,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23419/203307 [26:37:50<204:33:32,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23419/203307 [26:37:51<204:33:32,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23420/203307 [26:37:55<204:33:30,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23420/203307 [26:37:55<204:33:30,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23421/203307 [26:37:59<204:33:27,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23421/203307 [26:37:59<204:33:27,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23422/203307 [26:38:03<204:33:20,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23422/203307 [26:38:03<204:33:20,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23423/203307 [26:38:07<204:33:19,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23423/203307 [26:38:07<204:33:19,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23424/203307 [26:38:11<204:33:11,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23424/203307 [26:38:11<204:33:11,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23425/203307 [26:38:15<204:33:09,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23425/203307 [26:38:15<204:33:09,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23426/203307 [26:38:20<204:33:07,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23426/203307 [26:38:20<204:33:07,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23427/203307 [26:38:23<204:33:00,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23427/203307 [26:38:23<204:33:00,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23428/203307 [26:38:28<204:32:57,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23428/203307 [26:38:28<204:32:57,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23429/203307 [26:38:32<204:32:54,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23429/203307 [26:38:32<204:32:54,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23430/203307 [26:38:36<204:32:50,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23430/203307 [26:38:36<204:32:50,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23431/203307 [26:38:40<204:32:48,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23431/203307 [26:38:40<204:32:48,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23432/203307 [26:38:44<204:32:41,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23432/203307 [26:38:44<204:32:41,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23433/203307 [26:38:48<204:32:33,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23433/203307 [26:38:48<204:32:33,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23434/203307 [26:38:52<204:32:32,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23434/203307 [26:38:52<204:32:32,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23435/203307 [26:38:56<204:32:29,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23435/203307 [26:38:56<204:32:29,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23436/203307 [26:39:00<204:32:21,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23436/203307 [26:39:00<204:32:21,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23437/203307 [26:39:04<204:32:19,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23437/203307 [26:39:04<204:32:19,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23438/203307 [26:39:08<204:32:11,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23438/203307 [26:39:08<204:32:11,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23439/203307 [26:39:12<204:32:07,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23439/203307 [26:39:12<204:32:07,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23440/203307 [26:39:16<204:32:06,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23440/203307 [26:39:16<204:32:06,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23441/203307 [26:39:20<204:31:59,  0.24it/s, v_num=t5e6, training/loss=0.0807]Epoch 0:  12%|█▏        | 23441/203307 [26:39:20<204:31:59,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23442/203307 [26:39:24<204:31:52,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23442/203307 [26:39:24<204:31:52,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23443/203307 [26:39:29<204:31:52,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23443/203307 [26:39:29<204:31:52,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23444/203307 [26:39:32<204:31:45,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23444/203307 [26:39:32<204:31:45,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23445/203307 [26:39:36<204:31:38,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23445/203307 [26:39:36<204:31:38,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23446/203307 [26:39:40<204:31:36,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23446/203307 [26:39:40<204:31:36,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23447/203307 [26:39:44<204:31:29,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23447/203307 [26:39:44<204:31:29,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23448/203307 [26:39:48<204:31:26,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23448/203307 [26:39:48<204:31:26,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23449/203307 [26:39:53<204:31:24,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23449/203307 [26:39:53<204:31:25,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23450/203307 [26:39:57<204:31:20,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23450/203307 [26:39:57<204:31:20,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23451/203307 [26:40:01<204:31:19,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23451/203307 [26:40:01<204:31:19,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23452/203307 [26:40:05<204:31:16,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23452/203307 [26:40:05<204:31:16,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23453/203307 [26:40:09<204:31:08,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23453/203307 [26:40:09<204:31:09,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23454/203307 [26:40:13<204:31:06,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23454/203307 [26:40:13<204:31:06,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23455/203307 [26:40:18<204:31:04,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23455/203307 [26:40:18<204:31:04,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23456/203307 [26:40:21<204:30:56,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23456/203307 [26:40:21<204:30:56,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23457/203307 [26:40:26<204:30:55,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23457/203307 [26:40:26<204:30:55,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23458/203307 [26:40:30<204:30:48,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23458/203307 [26:40:30<204:30:48,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23459/203307 [26:40:33<204:30:40,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23459/203307 [26:40:33<204:30:40,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23460/203307 [26:40:38<204:30:39,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23460/203307 [26:40:38<204:30:39,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23461/203307 [26:40:42<204:30:37,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  12%|█▏        | 23461/203307 [26:40:42<204:30:37,  0.24it/s, v_num=t5e6, training/loss=0.098] Epoch 0:  12%|█▏        | 23462/203307 [26:40:46<204:30:29,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23462/203307 [26:40:46<204:30:29,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23463/203307 [26:40:50<204:30:26,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23463/203307 [26:40:50<204:30:27,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23464/203307 [26:40:54<204:30:19,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23464/203307 [26:40:54<204:30:19,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23465/203307 [26:40:57<204:30:13,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23465/203307 [26:40:57<204:30:13,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23466/203307 [26:41:02<204:30:11,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23466/203307 [26:41:02<204:30:11,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23467/203307 [26:41:05<204:30:04,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23467/203307 [26:41:05<204:30:04,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23468/203307 [26:41:09<204:29:57,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23468/203307 [26:41:09<204:29:57,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23469/203307 [26:41:14<204:29:55,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23469/203307 [26:41:14<204:29:55,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23470/203307 [26:41:17<204:29:49,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23470/203307 [26:41:17<204:29:49,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23471/203307 [26:41:21<204:29:43,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23471/203307 [26:41:21<204:29:43,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23472/203307 [26:41:26<204:29:41,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23472/203307 [26:41:26<204:29:41,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23473/203307 [26:41:30<204:29:35,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23473/203307 [26:41:30<204:29:35,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23474/203307 [26:41:33<204:29:28,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23474/203307 [26:41:33<204:29:28,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23475/203307 [26:41:38<204:29:27,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23475/203307 [26:41:38<204:29:27,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23476/203307 [26:41:42<204:29:23,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23476/203307 [26:41:42<204:29:23,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23477/203307 [26:41:46<204:29:21,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23477/203307 [26:41:46<204:29:21,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23478/203307 [26:41:50<204:29:18,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23478/203307 [26:41:50<204:29:18,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23479/203307 [26:41:54<204:29:12,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23479/203307 [26:41:54<204:29:12,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23480/203307 [26:41:59<204:29:09,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23480/203307 [26:41:59<204:29:09,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23481/203307 [26:42:03<204:29:07,  0.24it/s, v_num=t5e6, training/loss=0.098]Epoch 0:  12%|█▏        | 23481/203307 [26:42:03<204:29:08,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23482/203307 [26:42:07<204:29:00,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23482/203307 [26:42:07<204:29:00,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23483/203307 [26:42:11<204:28:59,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23483/203307 [26:42:11<204:28:59,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23484/203307 [26:42:15<204:28:55,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23484/203307 [26:42:15<204:28:55,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23485/203307 [26:42:19<204:28:49,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23485/203307 [26:42:19<204:28:49,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23486/203307 [26:42:23<204:28:48,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23486/203307 [26:42:23<204:28:48,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23487/203307 [26:42:28<204:28:46,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23487/203307 [26:42:28<204:28:46,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23488/203307 [26:42:32<204:28:39,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23488/203307 [26:42:32<204:28:39,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23489/203307 [26:42:36<204:28:37,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23489/203307 [26:42:36<204:28:37,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23490/203307 [26:42:40<204:28:30,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23490/203307 [26:42:40<204:28:30,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23491/203307 [26:42:43<204:28:23,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23491/203307 [26:42:43<204:28:23,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23492/203307 [26:42:48<204:28:22,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23492/203307 [26:42:48<204:28:22,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23493/203307 [26:42:52<204:28:19,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23493/203307 [26:42:52<204:28:19,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23494/203307 [26:42:56<204:28:12,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23494/203307 [26:42:56<204:28:12,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23495/203307 [26:43:00<204:28:11,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23495/203307 [26:43:00<204:28:11,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23496/203307 [26:43:04<204:28:05,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23496/203307 [26:43:04<204:28:05,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23497/203307 [26:43:08<204:27:58,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23497/203307 [26:43:08<204:27:58,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23498/203307 [26:43:12<204:27:56,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23498/203307 [26:43:12<204:27:56,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23499/203307 [26:43:16<204:27:49,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23499/203307 [26:43:16<204:27:49,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23500/203307 [26:43:20<204:27:42,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23500/203307 [26:43:20<204:27:42,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23501/203307 [26:43:24<204:27:41,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 23501/203307 [26:43:24<204:27:41,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23502/203307 [26:43:28<204:27:37,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23502/203307 [26:43:28<204:27:38,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23503/203307 [26:43:33<204:27:35,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23503/203307 [26:43:33<204:27:35,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23504/203307 [26:43:37<204:27:33,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23504/203307 [26:43:37<204:27:33,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23505/203307 [26:43:41<204:27:25,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23505/203307 [26:43:41<204:27:25,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23506/203307 [26:43:45<204:27:23,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23506/203307 [26:43:45<204:27:23,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23507/203307 [26:43:49<204:27:21,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23507/203307 [26:43:49<204:27:21,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23508/203307 [26:43:53<204:27:13,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23508/203307 [26:43:53<204:27:13,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23509/203307 [26:43:57<204:27:11,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23509/203307 [26:43:57<204:27:12,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23510/203307 [26:44:01<204:27:05,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23510/203307 [26:44:01<204:27:05,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23511/203307 [26:44:05<204:27:01,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23511/203307 [26:44:05<204:27:01,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23512/203307 [26:44:10<204:26:59,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23512/203307 [26:44:10<204:26:59,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23513/203307 [26:44:14<204:26:57,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23513/203307 [26:44:14<204:26:57,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23514/203307 [26:44:18<204:26:50,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23514/203307 [26:44:18<204:26:50,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23515/203307 [26:44:22<204:26:48,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23515/203307 [26:44:22<204:26:48,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23516/203307 [26:44:26<204:26:41,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23516/203307 [26:44:26<204:26:41,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23517/203307 [26:44:30<204:26:36,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23517/203307 [26:44:30<204:26:36,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23518/203307 [26:44:34<204:26:34,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23518/203307 [26:44:34<204:26:35,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23519/203307 [26:44:38<204:26:27,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23519/203307 [26:44:38<204:26:27,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23520/203307 [26:44:42<204:26:25,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23520/203307 [26:44:42<204:26:25,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23521/203307 [26:44:47<204:26:23,  0.24it/s, v_num=t5e6, training/loss=0.083]Epoch 0:  12%|█▏        | 23521/203307 [26:44:47<204:26:23,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23522/203307 [26:44:50<204:26:16,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23522/203307 [26:44:50<204:26:16,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23523/203307 [26:44:54<204:26:10,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23523/203307 [26:44:54<204:26:10,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23524/203307 [26:44:58<204:26:08,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23524/203307 [26:44:58<204:26:08,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23525/203307 [26:45:02<204:26:01,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23525/203307 [26:45:02<204:26:01,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23526/203307 [26:45:06<204:25:54,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23526/203307 [26:45:06<204:25:54,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23527/203307 [26:45:10<204:25:53,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23527/203307 [26:45:10<204:25:53,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23528/203307 [26:45:14<204:25:46,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23528/203307 [26:45:14<204:25:46,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23529/203307 [26:45:19<204:25:45,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23529/203307 [26:45:19<204:25:45,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23530/203307 [26:45:23<204:25:42,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23530/203307 [26:45:23<204:25:42,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23531/203307 [26:45:27<204:25:35,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23531/203307 [26:45:27<204:25:35,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23532/203307 [26:45:31<204:25:33,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23532/203307 [26:45:31<204:25:33,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23533/203307 [26:45:35<204:25:31,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23533/203307 [26:45:35<204:25:31,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23534/203307 [26:45:39<204:25:24,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23534/203307 [26:45:39<204:25:24,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23535/203307 [26:45:43<204:25:23,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23535/203307 [26:45:43<204:25:23,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23536/203307 [26:45:47<204:25:17,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23536/203307 [26:45:47<204:25:17,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23537/203307 [26:45:51<204:25:10,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23537/203307 [26:45:51<204:25:10,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23538/203307 [26:45:56<204:25:09,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23538/203307 [26:45:56<204:25:09,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23539/203307 [26:46:00<204:25:07,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23539/203307 [26:46:00<204:25:07,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23540/203307 [26:46:04<204:24:59,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23540/203307 [26:46:04<204:24:59,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23541/203307 [26:46:08<204:24:57,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  12%|█▏        | 23541/203307 [26:46:08<204:24:57,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23542/203307 [26:46:12<204:24:50,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23542/203307 [26:46:12<204:24:50,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23543/203307 [26:46:15<204:24:44,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23543/203307 [26:46:15<204:24:44,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23544/203307 [26:46:20<204:24:43,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23544/203307 [26:46:20<204:24:43,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23545/203307 [26:46:24<204:24:36,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23545/203307 [26:46:24<204:24:36,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23546/203307 [26:46:27<204:24:29,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23546/203307 [26:46:27<204:24:29,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23547/203307 [26:46:32<204:24:27,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23547/203307 [26:46:32<204:24:27,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23548/203307 [26:46:36<204:24:21,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23548/203307 [26:46:36<204:24:21,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23549/203307 [26:46:39<204:24:13,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23549/203307 [26:46:39<204:24:13,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23550/203307 [26:46:44<204:24:11,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23550/203307 [26:46:44<204:24:11,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23551/203307 [26:46:47<204:24:05,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23551/203307 [26:46:47<204:24:05,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23552/203307 [26:46:51<204:23:59,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23552/203307 [26:46:51<204:23:59,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23553/203307 [26:46:56<204:23:57,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23553/203307 [26:46:56<204:23:57,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23554/203307 [26:46:59<204:23:50,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23554/203307 [26:46:59<204:23:50,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23555/203307 [26:47:04<204:23:48,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23555/203307 [26:47:04<204:23:48,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23556/203307 [26:47:08<204:23:45,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23556/203307 [26:47:08<204:23:45,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23557/203307 [26:47:12<204:23:38,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23557/203307 [26:47:12<204:23:38,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23558/203307 [26:47:16<204:23:36,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23558/203307 [26:47:16<204:23:36,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23559/203307 [26:47:20<204:23:34,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23559/203307 [26:47:20<204:23:34,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23560/203307 [26:47:24<204:23:27,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23560/203307 [26:47:24<204:23:27,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23561/203307 [26:47:28<204:23:25,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 23561/203307 [26:47:28<204:23:25,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23562/203307 [26:47:32<204:23:18,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23562/203307 [26:47:32<204:23:18,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23563/203307 [26:47:36<204:23:11,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23563/203307 [26:47:36<204:23:11,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23564/203307 [26:47:40<204:23:09,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23564/203307 [26:47:40<204:23:09,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23565/203307 [26:47:45<204:23:07,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23565/203307 [26:47:45<204:23:07,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23566/203307 [26:47:48<204:22:59,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23566/203307 [26:47:48<204:22:59,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23567/203307 [26:47:53<204:22:57,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23567/203307 [26:47:53<204:22:57,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23568/203307 [26:47:56<204:22:50,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23568/203307 [26:47:56<204:22:50,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23569/203307 [26:48:00<204:22:44,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23569/203307 [26:48:00<204:22:44,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23570/203307 [26:48:05<204:22:42,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23570/203307 [26:48:05<204:22:42,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23571/203307 [26:48:08<204:22:36,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23571/203307 [26:48:08<204:22:36,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23572/203307 [26:48:12<204:22:28,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23572/203307 [26:48:12<204:22:28,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23573/203307 [26:48:16<204:22:27,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23573/203307 [26:48:16<204:22:27,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23574/203307 [26:48:21<204:22:24,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23574/203307 [26:48:21<204:22:24,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23575/203307 [26:48:24<204:22:17,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23575/203307 [26:48:24<204:22:17,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23576/203307 [26:48:29<204:22:15,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23576/203307 [26:48:29<204:22:15,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23577/203307 [26:48:33<204:22:09,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23577/203307 [26:48:33<204:22:09,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23578/203307 [26:48:36<204:22:02,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23578/203307 [26:48:36<204:22:02,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23579/203307 [26:48:41<204:22:02,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23579/203307 [26:48:41<204:22:02,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23580/203307 [26:48:45<204:21:55,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23580/203307 [26:48:45<204:21:55,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23581/203307 [26:48:49<204:21:54,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  12%|█▏        | 23581/203307 [26:48:49<204:21:54,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23582/203307 [26:48:53<204:21:52,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23582/203307 [26:48:53<204:21:52,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23583/203307 [26:48:58<204:21:49,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23583/203307 [26:48:58<204:21:49,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23584/203307 [26:49:02<204:21:46,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23584/203307 [26:49:02<204:21:46,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23585/203307 [26:49:06<204:21:44,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23585/203307 [26:49:06<204:21:44,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23586/203307 [26:49:10<204:21:37,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23586/203307 [26:49:10<204:21:37,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23587/203307 [26:49:15<204:21:36,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23587/203307 [26:49:15<204:21:36,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23588/203307 [26:49:18<204:21:29,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23588/203307 [26:49:18<204:21:29,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23589/203307 [26:49:22<204:21:23,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23589/203307 [26:49:22<204:21:23,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23590/203307 [26:49:27<204:21:22,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23590/203307 [26:49:27<204:21:22,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23591/203307 [26:49:31<204:21:19,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23591/203307 [26:49:31<204:21:19,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23592/203307 [26:49:35<204:21:15,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23592/203307 [26:49:35<204:21:15,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23593/203307 [26:49:39<204:21:13,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23593/203307 [26:49:39<204:21:13,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23594/203307 [26:49:43<204:21:05,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23594/203307 [26:49:43<204:21:05,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23595/203307 [26:49:47<204:20:59,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23595/203307 [26:49:47<204:20:59,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23596/203307 [26:49:51<204:20:58,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23596/203307 [26:49:51<204:20:58,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23597/203307 [26:49:55<204:20:51,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23597/203307 [26:49:55<204:20:51,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23598/203307 [26:49:59<204:20:44,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23598/203307 [26:49:59<204:20:44,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23599/203307 [26:50:03<204:20:43,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23599/203307 [26:50:03<204:20:43,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23600/203307 [26:50:07<204:20:36,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23600/203307 [26:50:07<204:20:36,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23601/203307 [26:50:11<204:20:33,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  12%|█▏        | 23601/203307 [26:50:11<204:20:33,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23602/203307 [26:50:15<204:20:31,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23602/203307 [26:50:15<204:20:31,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23603/203307 [26:50:19<204:20:25,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23603/203307 [26:50:19<204:20:25,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23604/203307 [26:50:23<204:20:17,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23604/203307 [26:50:23<204:20:17,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23605/203307 [26:50:27<204:20:17,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23605/203307 [26:50:27<204:20:17,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23606/203307 [26:50:31<204:20:10,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23606/203307 [26:50:31<204:20:10,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23607/203307 [26:50:36<204:20:08,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23607/203307 [26:50:36<204:20:08,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23608/203307 [26:50:40<204:20:05,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23608/203307 [26:50:40<204:20:05,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23609/203307 [26:50:43<204:19:57,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23609/203307 [26:50:43<204:19:57,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23610/203307 [26:50:48<204:19:54,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23610/203307 [26:50:48<204:19:54,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23611/203307 [26:50:52<204:19:51,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23611/203307 [26:50:52<204:19:51,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23612/203307 [26:50:56<204:19:44,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23612/203307 [26:50:56<204:19:44,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23613/203307 [26:51:00<204:19:42,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23613/203307 [26:51:00<204:19:42,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23614/203307 [26:51:04<204:19:35,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23614/203307 [26:51:04<204:19:35,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23615/203307 [26:51:07<204:19:28,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23615/203307 [26:51:07<204:19:28,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23616/203307 [26:51:12<204:19:26,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23616/203307 [26:51:12<204:19:26,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23617/203307 [26:51:16<204:19:23,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23617/203307 [26:51:16<204:19:23,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23618/203307 [26:51:20<204:19:17,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23618/203307 [26:51:20<204:19:17,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23619/203307 [26:51:24<204:19:14,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23619/203307 [26:51:24<204:19:14,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23620/203307 [26:51:28<204:19:07,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23620/203307 [26:51:28<204:19:07,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23621/203307 [26:51:32<204:19:01,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 23621/203307 [26:51:32<204:19:01,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23622/203307 [26:51:36<204:18:59,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23622/203307 [26:51:36<204:18:59,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23623/203307 [26:51:40<204:18:53,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23623/203307 [26:51:40<204:18:53,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23624/203307 [26:51:44<204:18:46,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23624/203307 [26:51:44<204:18:46,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23625/203307 [26:51:48<204:18:44,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23625/203307 [26:51:48<204:18:44,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23626/203307 [26:51:52<204:18:37,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23626/203307 [26:51:52<204:18:37,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23627/203307 [26:51:55<204:18:30,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23627/203307 [26:51:55<204:18:30,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23628/203307 [26:52:00<204:18:28,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23628/203307 [26:52:00<204:18:28,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23629/203307 [26:52:03<204:18:21,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23629/203307 [26:52:03<204:18:21,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23630/203307 [26:52:07<204:18:13,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23630/203307 [26:52:07<204:18:13,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23631/203307 [26:52:12<204:18:12,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23631/203307 [26:52:12<204:18:12,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23632/203307 [26:52:15<204:18:06,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23632/203307 [26:52:15<204:18:06,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23633/203307 [26:52:20<204:18:05,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23633/203307 [26:52:20<204:18:05,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23634/203307 [26:52:24<204:18:03,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23634/203307 [26:52:24<204:18:03,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23635/203307 [26:52:28<204:17:56,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23635/203307 [26:52:28<204:17:56,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23636/203307 [26:52:32<204:17:54,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23636/203307 [26:52:32<204:17:54,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23637/203307 [26:52:37<204:17:53,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23637/203307 [26:52:37<204:17:53,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23638/203307 [26:52:41<204:17:46,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23638/203307 [26:52:41<204:17:46,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23639/203307 [26:52:45<204:17:44,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23639/203307 [26:52:45<204:17:44,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23640/203307 [26:52:49<204:17:37,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23640/203307 [26:52:49<204:17:37,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23641/203307 [26:52:52<204:17:30,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  12%|█▏        | 23641/203307 [26:52:52<204:17:30,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23642/203307 [26:52:57<204:17:29,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23642/203307 [26:52:57<204:17:29,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23643/203307 [26:53:01<204:17:29,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23643/203307 [26:53:01<204:17:29,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23644/203307 [26:53:05<204:17:21,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23644/203307 [26:53:05<204:17:21,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23645/203307 [26:53:09<204:17:19,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23645/203307 [26:53:09<204:17:20,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23646/203307 [26:53:14<204:17:16,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23646/203307 [26:53:14<204:17:16,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23647/203307 [26:53:17<204:17:09,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23647/203307 [26:53:17<204:17:09,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23648/203307 [26:53:22<204:17:08,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23648/203307 [26:53:22<204:17:08,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23649/203307 [26:53:26<204:17:01,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23649/203307 [26:53:26<204:17:01,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23650/203307 [26:53:29<204:16:55,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23650/203307 [26:53:29<204:16:55,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23651/203307 [26:53:34<204:16:54,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23651/203307 [26:53:34<204:16:54,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23652/203307 [26:53:38<204:16:47,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23652/203307 [26:53:38<204:16:47,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23653/203307 [26:53:41<204:16:40,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23653/203307 [26:53:41<204:16:40,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23654/203307 [26:53:46<204:16:38,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23654/203307 [26:53:46<204:16:38,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23655/203307 [26:53:50<204:16:35,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23655/203307 [26:53:50<204:16:35,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23656/203307 [26:53:54<204:16:28,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23656/203307 [26:53:54<204:16:28,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23657/203307 [26:53:58<204:16:26,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23657/203307 [26:53:58<204:16:26,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23658/203307 [26:54:02<204:16:19,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23658/203307 [26:54:02<204:16:19,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23659/203307 [26:54:06<204:16:19,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23659/203307 [26:54:06<204:16:19,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23660/203307 [26:54:11<204:16:16,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23660/203307 [26:54:11<204:16:16,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23661/203307 [26:54:14<204:16:09,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  12%|█▏        | 23661/203307 [26:54:14<204:16:09,  0.24it/s, v_num=t5e6, training/loss=0.090] Epoch 0:  12%|█▏        | 23662/203307 [26:54:19<204:16:07,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23662/203307 [26:54:19<204:16:07,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23663/203307 [26:54:23<204:16:05,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23663/203307 [26:54:23<204:16:05,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23664/203307 [26:54:27<204:16:02,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23664/203307 [26:54:27<204:16:02,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23665/203307 [26:54:32<204:16:01,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23665/203307 [26:54:32<204:16:01,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23666/203307 [26:54:36<204:15:54,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23666/203307 [26:54:36<204:15:54,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23667/203307 [26:54:39<204:15:48,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23667/203307 [26:54:39<204:15:48,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23668/203307 [26:54:44<204:15:46,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23668/203307 [26:54:44<204:15:46,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23669/203307 [26:54:48<204:15:43,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23669/203307 [26:54:48<204:15:43,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23670/203307 [26:54:52<204:15:36,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23670/203307 [26:54:52<204:15:36,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23671/203307 [26:54:56<204:15:35,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23671/203307 [26:54:56<204:15:35,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23672/203307 [26:55:00<204:15:29,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23672/203307 [26:55:00<204:15:29,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23673/203307 [26:55:04<204:15:26,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23673/203307 [26:55:04<204:15:26,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23674/203307 [26:55:09<204:15:25,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23674/203307 [26:55:09<204:15:25,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23675/203307 [26:55:13<204:15:19,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23675/203307 [26:55:13<204:15:19,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23676/203307 [26:55:16<204:15:12,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23676/203307 [26:55:16<204:15:12,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23677/203307 [26:55:21<204:15:11,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23677/203307 [26:55:21<204:15:11,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23678/203307 [26:55:25<204:15:04,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23678/203307 [26:55:25<204:15:04,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23679/203307 [26:55:28<204:14:57,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23679/203307 [26:55:28<204:14:57,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23680/203307 [26:55:33<204:14:55,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23680/203307 [26:55:33<204:14:55,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23681/203307 [26:55:36<204:14:48,  0.24it/s, v_num=t5e6, training/loss=0.090]Epoch 0:  12%|█▏        | 23681/203307 [26:55:36<204:14:48,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23682/203307 [26:55:41<204:14:45,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23682/203307 [26:55:41<204:14:45,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23683/203307 [26:55:45<204:14:45,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23683/203307 [26:55:45<204:14:45,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23684/203307 [26:55:49<204:14:40,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23684/203307 [26:55:49<204:14:40,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23685/203307 [26:55:54<204:14:38,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23685/203307 [26:55:54<204:14:38,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23686/203307 [26:55:58<204:14:35,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23686/203307 [26:55:58<204:14:35,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23687/203307 [26:56:02<204:14:30,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23687/203307 [26:56:02<204:14:30,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23688/203307 [26:56:06<204:14:28,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23688/203307 [26:56:06<204:14:28,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23689/203307 [26:56:10<204:14:26,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23689/203307 [26:56:10<204:14:26,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23690/203307 [26:56:14<204:14:19,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23690/203307 [26:56:14<204:14:19,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23691/203307 [26:56:19<204:14:17,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23691/203307 [26:56:19<204:14:18,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23692/203307 [26:56:22<204:14:11,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23692/203307 [26:56:22<204:14:11,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23693/203307 [26:56:26<204:14:05,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23693/203307 [26:56:26<204:14:05,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23694/203307 [26:56:31<204:14:04,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23694/203307 [26:56:31<204:14:04,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23695/203307 [26:56:35<204:14:01,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23695/203307 [26:56:35<204:14:01,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23696/203307 [26:56:39<204:13:54,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23696/203307 [26:56:39<204:13:54,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23697/203307 [26:56:43<204:13:53,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23697/203307 [26:56:43<204:13:53,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23698/203307 [26:56:47<204:13:46,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23698/203307 [26:56:47<204:13:46,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23699/203307 [26:56:51<204:13:41,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23699/203307 [26:56:51<204:13:41,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23700/203307 [26:56:55<204:13:41,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23700/203307 [26:56:55<204:13:41,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23701/203307 [26:56:59<204:13:34,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  12%|█▏        | 23701/203307 [26:56:59<204:13:34,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23702/203307 [26:57:03<204:13:27,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23702/203307 [26:57:03<204:13:27,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23703/203307 [26:57:07<204:13:26,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23703/203307 [26:57:07<204:13:26,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23704/203307 [26:57:11<204:13:19,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23704/203307 [26:57:11<204:13:20,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23705/203307 [26:57:15<204:13:13,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23705/203307 [26:57:15<204:13:13,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23706/203307 [26:57:19<204:13:12,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23706/203307 [26:57:19<204:13:12,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23707/203307 [26:57:23<204:13:06,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23707/203307 [26:57:23<204:13:06,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23708/203307 [26:57:27<204:12:59,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23708/203307 [26:57:27<204:12:59,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23709/203307 [26:57:32<204:12:58,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23709/203307 [26:57:32<204:12:58,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23710/203307 [26:57:35<204:12:52,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23710/203307 [26:57:35<204:12:52,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23711/203307 [26:57:40<204:12:49,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23711/203307 [26:57:40<204:12:49,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23712/203307 [26:57:44<204:12:47,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23712/203307 [26:57:44<204:12:47,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23713/203307 [26:57:48<204:12:39,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23713/203307 [26:57:48<204:12:39,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23714/203307 [26:57:52<204:12:36,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23714/203307 [26:57:52<204:12:36,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23715/203307 [26:57:56<204:12:33,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23715/203307 [26:57:56<204:12:33,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23716/203307 [26:58:00<204:12:26,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23716/203307 [26:58:00<204:12:26,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23717/203307 [26:58:04<204:12:24,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23717/203307 [26:58:04<204:12:24,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23718/203307 [26:58:08<204:12:21,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23718/203307 [26:58:08<204:12:21,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23719/203307 [26:58:12<204:12:14,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23719/203307 [26:58:12<204:12:14,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23720/203307 [26:58:16<204:12:12,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23720/203307 [26:58:16<204:12:12,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23721/203307 [26:58:21<204:12:10,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  12%|█▏        | 23721/203307 [26:58:21<204:12:10,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23722/203307 [26:58:25<204:12:04,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23722/203307 [26:58:25<204:12:04,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23723/203307 [26:58:29<204:12:02,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23723/203307 [26:58:29<204:12:02,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23724/203307 [26:58:33<204:11:55,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23724/203307 [26:58:33<204:11:55,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23725/203307 [26:58:37<204:11:49,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23725/203307 [26:58:37<204:11:49,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23726/203307 [26:58:41<204:11:48,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23726/203307 [26:58:41<204:11:49,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23727/203307 [26:58:45<204:11:46,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23727/203307 [26:58:45<204:11:46,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23728/203307 [26:58:49<204:11:39,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23728/203307 [26:58:49<204:11:39,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23729/203307 [26:58:54<204:11:37,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23729/203307 [26:58:54<204:11:37,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23730/203307 [26:58:57<204:11:31,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23730/203307 [26:58:57<204:11:31,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23731/203307 [26:59:01<204:11:24,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23731/203307 [26:59:01<204:11:24,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23732/203307 [26:59:06<204:11:23,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23732/203307 [26:59:06<204:11:23,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23733/203307 [26:59:09<204:11:16,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23733/203307 [26:59:09<204:11:17,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23734/203307 [26:59:13<204:11:10,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23734/203307 [26:59:13<204:11:10,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23735/203307 [26:59:18<204:11:09,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23735/203307 [26:59:18<204:11:09,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23736/203307 [26:59:22<204:11:05,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23736/203307 [26:59:22<204:11:05,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23737/203307 [26:59:26<204:11:03,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23737/203307 [26:59:26<204:11:03,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23738/203307 [26:59:30<204:11:00,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23738/203307 [26:59:30<204:11:00,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23739/203307 [26:59:34<204:10:53,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23739/203307 [26:59:34<204:10:53,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23740/203307 [26:59:38<204:10:50,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23740/203307 [26:59:38<204:10:50,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23741/203307 [26:59:43<204:10:48,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  12%|█▏        | 23741/203307 [26:59:43<204:10:48,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23742/203307 [26:59:46<204:10:41,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23742/203307 [26:59:46<204:10:41,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23743/203307 [26:59:51<204:10:38,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23743/203307 [26:59:51<204:10:38,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23744/203307 [26:59:54<204:10:32,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23744/203307 [26:59:54<204:10:32,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23745/203307 [26:59:59<204:10:28,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23745/203307 [26:59:59<204:10:29,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23746/203307 [27:00:03<204:10:26,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23746/203307 [27:00:03<204:10:26,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23747/203307 [27:00:07<204:10:23,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23747/203307 [27:00:07<204:10:23,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23748/203307 [27:00:11<204:10:16,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23748/203307 [27:00:11<204:10:16,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23749/203307 [27:00:15<204:10:13,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23749/203307 [27:00:15<204:10:13,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23750/203307 [27:00:19<204:10:06,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23750/203307 [27:00:19<204:10:06,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23751/203307 [27:00:22<204:09:59,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23751/203307 [27:00:22<204:09:59,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23752/203307 [27:00:27<204:09:59,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23752/203307 [27:00:27<204:09:59,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23753/203307 [27:00:31<204:09:52,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23753/203307 [27:00:31<204:09:52,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23754/203307 [27:00:35<204:09:49,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23754/203307 [27:00:35<204:09:49,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23755/203307 [27:00:39<204:09:47,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23755/203307 [27:00:39<204:09:47,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23756/203307 [27:00:43<204:09:40,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23756/203307 [27:00:43<204:09:40,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23757/203307 [27:00:47<204:09:32,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23757/203307 [27:00:47<204:09:32,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23758/203307 [27:00:51<204:09:31,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23758/203307 [27:00:51<204:09:31,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23759/203307 [27:00:55<204:09:23,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23759/203307 [27:00:55<204:09:23,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23760/203307 [27:00:59<204:09:16,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23760/203307 [27:00:59<204:09:16,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23761/203307 [27:01:03<204:09:14,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  12%|█▏        | 23761/203307 [27:01:03<204:09:14,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23762/203307 [27:01:07<204:09:07,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23762/203307 [27:01:07<204:09:07,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23763/203307 [27:01:11<204:09:05,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23763/203307 [27:01:11<204:09:05,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23764/203307 [27:01:15<204:09:02,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23764/203307 [27:01:15<204:09:02,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23765/203307 [27:01:19<204:08:55,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23765/203307 [27:01:19<204:08:55,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23766/203307 [27:01:23<204:08:53,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23766/203307 [27:01:23<204:08:53,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23767/203307 [27:01:28<204:08:51,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23767/203307 [27:01:28<204:08:51,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23768/203307 [27:01:31<204:08:44,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23768/203307 [27:01:31<204:08:44,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23769/203307 [27:01:36<204:08:42,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23769/203307 [27:01:36<204:08:42,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23770/203307 [27:01:40<204:08:36,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23770/203307 [27:01:40<204:08:36,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23771/203307 [27:01:43<204:08:29,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23771/203307 [27:01:43<204:08:29,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23772/203307 [27:01:48<204:08:27,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23772/203307 [27:01:48<204:08:27,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23773/203307 [27:01:52<204:08:24,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23773/203307 [27:01:52<204:08:24,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23774/203307 [27:01:56<204:08:17,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23774/203307 [27:01:56<204:08:17,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23775/203307 [27:02:00<204:08:14,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23775/203307 [27:02:00<204:08:14,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23776/203307 [27:02:04<204:08:08,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23776/203307 [27:02:04<204:08:08,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23777/203307 [27:02:07<204:08:01,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23777/203307 [27:02:07<204:08:01,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23778/203307 [27:02:12<204:08:00,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23778/203307 [27:02:12<204:08:00,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23779/203307 [27:02:16<204:07:53,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23779/203307 [27:02:16<204:07:53,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23780/203307 [27:02:19<204:07:46,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23780/203307 [27:02:19<204:07:46,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23781/203307 [27:02:24<204:07:45,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  12%|█▏        | 23781/203307 [27:02:24<204:07:45,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23782/203307 [27:02:27<204:07:38,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23782/203307 [27:02:27<204:07:38,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23783/203307 [27:02:31<204:07:31,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23783/203307 [27:02:31<204:07:31,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23784/203307 [27:02:36<204:07:29,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23784/203307 [27:02:36<204:07:29,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23785/203307 [27:02:39<204:07:22,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23785/203307 [27:02:39<204:07:22,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23786/203307 [27:02:43<204:07:16,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23786/203307 [27:02:43<204:07:16,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23787/203307 [27:02:48<204:07:15,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23787/203307 [27:02:48<204:07:15,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23788/203307 [27:02:51<204:07:08,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23788/203307 [27:02:51<204:07:08,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23789/203307 [27:02:56<204:07:06,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23789/203307 [27:02:56<204:07:06,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23790/203307 [27:03:00<204:07:03,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23790/203307 [27:03:00<204:07:03,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23791/203307 [27:03:04<204:06:56,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23791/203307 [27:03:04<204:06:56,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23792/203307 [27:03:08<204:06:54,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23792/203307 [27:03:08<204:06:54,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23793/203307 [27:03:12<204:06:51,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23793/203307 [27:03:12<204:06:51,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23794/203307 [27:03:16<204:06:45,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23794/203307 [27:03:16<204:06:45,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23795/203307 [27:03:21<204:06:44,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23795/203307 [27:03:21<204:06:44,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23796/203307 [27:03:24<204:06:37,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23796/203307 [27:03:24<204:06:37,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23797/203307 [27:03:28<204:06:30,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23797/203307 [27:03:28<204:06:30,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23798/203307 [27:03:33<204:06:29,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23798/203307 [27:03:33<204:06:29,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23799/203307 [27:03:37<204:06:26,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23799/203307 [27:03:37<204:06:26,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23800/203307 [27:03:40<204:06:19,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23800/203307 [27:03:40<204:06:19,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23801/203307 [27:03:45<204:06:16,  0.24it/s, v_num=t5e6, training/loss=0.0845]Epoch 0:  12%|█▏        | 23801/203307 [27:03:45<204:06:16,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23802/203307 [27:03:49<204:06:09,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23802/203307 [27:03:49<204:06:09,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23803/203307 [27:03:52<204:06:03,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23803/203307 [27:03:52<204:06:03,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23804/203307 [27:03:57<204:06:02,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23804/203307 [27:03:57<204:06:02,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23805/203307 [27:04:01<204:05:56,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23805/203307 [27:04:01<204:05:56,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23806/203307 [27:04:04<204:05:49,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23806/203307 [27:04:04<204:05:49,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23807/203307 [27:04:09<204:05:48,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23807/203307 [27:04:09<204:05:48,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23808/203307 [27:04:13<204:05:45,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23808/203307 [27:04:13<204:05:45,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23809/203307 [27:04:17<204:05:39,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23809/203307 [27:04:17<204:05:39,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23810/203307 [27:04:21<204:05:37,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23810/203307 [27:04:21<204:05:37,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23811/203307 [27:04:25<204:05:30,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23811/203307 [27:04:25<204:05:30,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23812/203307 [27:04:29<204:05:24,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23812/203307 [27:04:29<204:05:24,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23813/203307 [27:04:33<204:05:23,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23813/203307 [27:04:33<204:05:23,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23814/203307 [27:04:37<204:05:16,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23814/203307 [27:04:37<204:05:16,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23815/203307 [27:04:41<204:05:14,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23815/203307 [27:04:41<204:05:14,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23816/203307 [27:04:46<204:05:11,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23816/203307 [27:04:46<204:05:11,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23817/203307 [27:04:50<204:05:08,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23817/203307 [27:04:50<204:05:08,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23818/203307 [27:04:54<204:05:05,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23818/203307 [27:04:54<204:05:05,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23819/203307 [27:04:58<204:05:02,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23819/203307 [27:04:58<204:05:02,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23820/203307 [27:05:02<204:04:55,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23820/203307 [27:05:02<204:04:55,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23821/203307 [27:05:06<204:04:53,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 23821/203307 [27:05:06<204:04:53,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23822/203307 [27:05:10<204:04:46,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23822/203307 [27:05:10<204:04:46,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23823/203307 [27:05:14<204:04:38,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23823/203307 [27:05:14<204:04:38,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23824/203307 [27:05:18<204:04:38,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23824/203307 [27:05:18<204:04:38,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23825/203307 [27:05:23<204:04:35,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23825/203307 [27:05:23<204:04:35,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23826/203307 [27:05:27<204:04:31,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23826/203307 [27:05:27<204:04:31,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23827/203307 [27:05:31<204:04:28,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23827/203307 [27:05:31<204:04:28,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23828/203307 [27:05:35<204:04:21,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23828/203307 [27:05:35<204:04:21,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23829/203307 [27:05:38<204:04:14,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23829/203307 [27:05:38<204:04:14,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23830/203307 [27:05:43<204:04:13,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23830/203307 [27:05:43<204:04:13,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23831/203307 [27:05:47<204:04:06,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23831/203307 [27:05:47<204:04:06,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23832/203307 [27:05:50<204:03:58,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23832/203307 [27:05:50<204:03:58,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23833/203307 [27:05:55<204:03:57,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23833/203307 [27:05:55<204:03:57,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23834/203307 [27:05:58<204:03:50,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23834/203307 [27:05:58<204:03:50,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23835/203307 [27:06:03<204:03:46,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23835/203307 [27:06:03<204:03:46,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23836/203307 [27:06:07<204:03:44,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23836/203307 [27:06:07<204:03:44,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23837/203307 [27:06:10<204:03:36,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23837/203307 [27:06:10<204:03:36,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23838/203307 [27:06:14<204:03:29,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23838/203307 [27:06:14<204:03:29,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23839/203307 [27:06:19<204:03:28,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23839/203307 [27:06:19<204:03:28,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23840/203307 [27:06:22<204:03:21,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23840/203307 [27:06:22<204:03:21,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23841/203307 [27:06:27<204:03:20,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  12%|█▏        | 23841/203307 [27:06:27<204:03:20,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23842/203307 [27:06:31<204:03:18,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23842/203307 [27:06:31<204:03:18,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23843/203307 [27:06:35<204:03:11,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23843/203307 [27:06:35<204:03:11,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23844/203307 [27:06:39<204:03:09,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23844/203307 [27:06:39<204:03:09,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23845/203307 [27:06:44<204:03:07,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23845/203307 [27:06:44<204:03:07,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23846/203307 [27:06:47<204:02:59,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23846/203307 [27:06:47<204:02:59,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23847/203307 [27:06:52<204:02:58,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23847/203307 [27:06:52<204:02:58,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23848/203307 [27:06:55<204:02:50,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23848/203307 [27:06:55<204:02:51,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23849/203307 [27:06:59<204:02:44,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23849/203307 [27:06:59<204:02:44,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23850/203307 [27:07:04<204:02:42,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23850/203307 [27:07:04<204:02:42,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23851/203307 [27:07:08<204:02:40,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23851/203307 [27:07:08<204:02:40,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23852/203307 [27:07:12<204:02:32,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23852/203307 [27:07:12<204:02:32,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23853/203307 [27:07:16<204:02:31,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23853/203307 [27:07:16<204:02:31,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23854/203307 [27:07:20<204:02:23,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23854/203307 [27:07:20<204:02:23,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23855/203307 [27:07:23<204:02:17,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23855/203307 [27:07:23<204:02:17,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23856/203307 [27:07:28<204:02:16,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23856/203307 [27:07:28<204:02:16,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23857/203307 [27:07:32<204:02:09,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23857/203307 [27:07:32<204:02:09,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23858/203307 [27:07:35<204:02:01,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23858/203307 [27:07:35<204:02:02,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23859/203307 [27:07:40<204:02:00,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23859/203307 [27:07:40<204:02:00,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23860/203307 [27:07:43<204:01:54,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23860/203307 [27:07:43<204:01:54,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23861/203307 [27:07:47<204:01:47,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  12%|█▏        | 23861/203307 [27:07:47<204:01:47,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23862/203307 [27:07:52<204:01:45,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23862/203307 [27:07:52<204:01:45,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23863/203307 [27:07:55<204:01:37,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23863/203307 [27:07:55<204:01:37,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23864/203307 [27:07:59<204:01:30,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23864/203307 [27:07:59<204:01:30,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23865/203307 [27:08:03<204:01:29,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23865/203307 [27:08:03<204:01:29,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23866/203307 [27:08:07<204:01:22,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23866/203307 [27:08:07<204:01:22,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23867/203307 [27:08:11<204:01:20,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23867/203307 [27:08:11<204:01:20,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23868/203307 [27:08:16<204:01:17,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23868/203307 [27:08:16<204:01:17,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23869/203307 [27:08:20<204:01:11,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23869/203307 [27:08:20<204:01:11,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23870/203307 [27:08:24<204:01:09,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23870/203307 [27:08:24<204:01:09,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23871/203307 [27:08:28<204:01:06,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23871/203307 [27:08:28<204:01:06,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23872/203307 [27:08:32<204:00:59,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23872/203307 [27:08:32<204:00:59,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23873/203307 [27:08:36<204:00:57,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23873/203307 [27:08:36<204:00:57,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23874/203307 [27:08:40<204:00:51,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23874/203307 [27:08:40<204:00:51,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23875/203307 [27:08:44<204:00:43,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23875/203307 [27:08:44<204:00:43,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23876/203307 [27:08:48<204:00:42,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23876/203307 [27:08:48<204:00:42,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23877/203307 [27:08:52<204:00:39,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23877/203307 [27:08:52<204:00:39,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23878/203307 [27:08:56<204:00:31,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23878/203307 [27:08:56<204:00:31,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23879/203307 [27:09:00<204:00:29,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23879/203307 [27:09:00<204:00:29,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23880/203307 [27:09:04<204:00:25,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23880/203307 [27:09:04<204:00:25,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23881/203307 [27:09:08<204:00:18,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  12%|█▏        | 23881/203307 [27:09:08<204:00:18,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23882/203307 [27:09:13<204:00:18,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23882/203307 [27:09:13<204:00:18,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23883/203307 [27:09:16<204:00:11,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23883/203307 [27:09:16<204:00:11,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23884/203307 [27:09:20<204:00:04,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23884/203307 [27:09:20<204:00:04,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23885/203307 [27:09:25<204:00:03,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23885/203307 [27:09:25<204:00:03,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23886/203307 [27:09:29<203:59:57,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23886/203307 [27:09:29<203:59:57,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23887/203307 [27:09:32<203:59:50,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23887/203307 [27:09:32<203:59:50,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23888/203307 [27:09:37<203:59:49,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23888/203307 [27:09:37<203:59:49,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23889/203307 [27:09:41<203:59:46,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23889/203307 [27:09:41<203:59:46,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23890/203307 [27:09:45<203:59:39,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23890/203307 [27:09:45<203:59:39,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23891/203307 [27:09:49<203:59:38,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23891/203307 [27:09:49<203:59:39,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23892/203307 [27:09:53<203:59:31,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23892/203307 [27:09:53<203:59:31,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23893/203307 [27:09:57<203:59:29,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23893/203307 [27:09:57<203:59:29,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23894/203307 [27:10:02<203:59:27,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23894/203307 [27:10:02<203:59:27,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23895/203307 [27:10:05<203:59:20,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23895/203307 [27:10:05<203:59:20,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23896/203307 [27:10:10<203:59:17,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23896/203307 [27:10:10<203:59:17,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23897/203307 [27:10:14<203:59:15,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23897/203307 [27:10:14<203:59:15,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23898/203307 [27:10:18<203:59:12,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23898/203307 [27:10:18<203:59:13,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23899/203307 [27:10:23<203:59:11,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23899/203307 [27:10:23<203:59:11,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23900/203307 [27:10:26<203:59:04,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23900/203307 [27:10:26<203:59:04,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23901/203307 [27:10:30<203:58:57,  0.24it/s, v_num=t5e6, training/loss=0.0766]Epoch 0:  12%|█▏        | 23901/203307 [27:10:30<203:58:57,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23902/203307 [27:10:35<203:58:56,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23902/203307 [27:10:35<203:58:56,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23903/203307 [27:10:39<203:58:53,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23903/203307 [27:10:39<203:58:53,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23904/203307 [27:10:42<203:58:45,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23904/203307 [27:10:42<203:58:45,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23905/203307 [27:10:47<203:58:43,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23905/203307 [27:10:47<203:58:43,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23906/203307 [27:10:50<203:58:36,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23906/203307 [27:10:50<203:58:36,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23907/203307 [27:10:55<203:58:33,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23907/203307 [27:10:55<203:58:33,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23908/203307 [27:10:59<203:58:32,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23908/203307 [27:10:59<203:58:32,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23909/203307 [27:11:03<203:58:25,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23909/203307 [27:11:03<203:58:25,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23910/203307 [27:11:07<203:58:18,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23910/203307 [27:11:07<203:58:18,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23911/203307 [27:11:11<203:58:17,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23911/203307 [27:11:11<203:58:17,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23912/203307 [27:11:15<203:58:10,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23912/203307 [27:11:15<203:58:10,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23913/203307 [27:11:19<203:58:03,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23913/203307 [27:11:19<203:58:03,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23914/203307 [27:11:23<203:58:01,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23914/203307 [27:11:23<203:58:01,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23915/203307 [27:11:27<203:57:54,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23915/203307 [27:11:27<203:57:54,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23916/203307 [27:11:31<203:57:50,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23916/203307 [27:11:31<203:57:50,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23917/203307 [27:11:35<203:57:49,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23917/203307 [27:11:35<203:57:49,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23918/203307 [27:11:39<203:57:42,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23918/203307 [27:11:39<203:57:42,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23919/203307 [27:11:43<203:57:41,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23919/203307 [27:11:43<203:57:41,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23920/203307 [27:11:48<203:57:39,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23920/203307 [27:11:48<203:57:39,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23921/203307 [27:11:51<203:57:31,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  12%|█▏        | 23921/203307 [27:11:51<203:57:31,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23922/203307 [27:11:56<203:57:29,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23922/203307 [27:11:56<203:57:29,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23923/203307 [27:12:00<203:57:26,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23923/203307 [27:12:00<203:57:26,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23924/203307 [27:12:04<203:57:19,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23924/203307 [27:12:04<203:57:19,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23925/203307 [27:12:08<203:57:18,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23925/203307 [27:12:08<203:57:18,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23926/203307 [27:12:12<203:57:11,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23926/203307 [27:12:12<203:57:11,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23927/203307 [27:12:16<203:57:03,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23927/203307 [27:12:16<203:57:03,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23928/203307 [27:12:20<203:57:02,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23928/203307 [27:12:20<203:57:02,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23929/203307 [27:12:24<203:56:59,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23929/203307 [27:12:24<203:56:59,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23930/203307 [27:12:28<203:56:53,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23930/203307 [27:12:28<203:56:53,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23931/203307 [27:12:32<203:56:50,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23931/203307 [27:12:32<203:56:50,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23932/203307 [27:12:36<203:56:43,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23932/203307 [27:12:36<203:56:43,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23933/203307 [27:12:40<203:56:36,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23933/203307 [27:12:40<203:56:36,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23934/203307 [27:12:44<203:56:35,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23934/203307 [27:12:44<203:56:35,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23935/203307 [27:12:48<203:56:28,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23935/203307 [27:12:48<203:56:28,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23936/203307 [27:12:52<203:56:20,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23936/203307 [27:12:52<203:56:20,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23937/203307 [27:12:56<203:56:19,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23937/203307 [27:12:56<203:56:19,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23938/203307 [27:13:00<203:56:12,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23938/203307 [27:13:00<203:56:12,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23939/203307 [27:13:03<203:56:04,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23939/203307 [27:13:03<203:56:04,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23940/203307 [27:13:08<203:56:02,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23940/203307 [27:13:08<203:56:02,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23941/203307 [27:13:12<203:55:56,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  12%|█▏        | 23941/203307 [27:13:12<203:55:56,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23942/203307 [27:13:15<203:55:50,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23942/203307 [27:13:15<203:55:50,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23943/203307 [27:13:20<203:55:48,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23943/203307 [27:13:20<203:55:48,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23944/203307 [27:13:24<203:55:41,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23944/203307 [27:13:24<203:55:41,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23945/203307 [27:13:28<203:55:39,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23945/203307 [27:13:28<203:55:39,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23946/203307 [27:13:32<203:55:36,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23946/203307 [27:13:32<203:55:36,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23947/203307 [27:13:36<203:55:30,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23947/203307 [27:13:36<203:55:30,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23948/203307 [27:13:40<203:55:29,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23948/203307 [27:13:40<203:55:29,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23949/203307 [27:13:45<203:55:27,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23949/203307 [27:13:45<203:55:27,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23950/203307 [27:13:48<203:55:20,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23950/203307 [27:13:48<203:55:20,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23951/203307 [27:13:53<203:55:18,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23951/203307 [27:13:53<203:55:18,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23952/203307 [27:13:57<203:55:15,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23952/203307 [27:13:57<203:55:15,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23953/203307 [27:14:01<203:55:08,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23953/203307 [27:14:01<203:55:08,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23954/203307 [27:14:05<203:55:07,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23954/203307 [27:14:05<203:55:07,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23955/203307 [27:14:10<203:55:04,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23955/203307 [27:14:10<203:55:04,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23956/203307 [27:14:13<203:54:57,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23956/203307 [27:14:13<203:54:57,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23957/203307 [27:14:18<203:54:55,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23957/203307 [27:14:18<203:54:55,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23958/203307 [27:14:21<203:54:49,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23958/203307 [27:14:21<203:54:49,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23959/203307 [27:14:25<203:54:42,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23959/203307 [27:14:25<203:54:42,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23960/203307 [27:14:30<203:54:41,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23960/203307 [27:14:30<203:54:41,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23961/203307 [27:14:34<203:54:38,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  12%|█▏        | 23961/203307 [27:14:34<203:54:38,  0.24it/s, v_num=t5e6, training/loss=0.082] Epoch 0:  12%|█▏        | 23962/203307 [27:14:38<203:54:33,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23962/203307 [27:14:38<203:54:33,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23963/203307 [27:14:42<203:54:32,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23963/203307 [27:14:42<203:54:32,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23964/203307 [27:14:46<203:54:27,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23964/203307 [27:14:46<203:54:27,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23965/203307 [27:14:50<203:54:21,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23965/203307 [27:14:50<203:54:21,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23966/203307 [27:14:55<203:54:19,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23966/203307 [27:14:55<203:54:19,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23967/203307 [27:14:58<203:54:12,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23967/203307 [27:14:58<203:54:12,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23968/203307 [27:15:02<203:54:06,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23968/203307 [27:15:02<203:54:06,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23969/203307 [27:15:07<203:54:06,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23969/203307 [27:15:07<203:54:06,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23970/203307 [27:15:11<203:54:02,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23970/203307 [27:15:11<203:54:02,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23971/203307 [27:15:15<203:54:00,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23971/203307 [27:15:15<203:54:00,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23972/203307 [27:15:20<203:53:58,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23972/203307 [27:15:20<203:53:58,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23973/203307 [27:15:23<203:53:51,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23973/203307 [27:15:23<203:53:51,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23974/203307 [27:15:28<203:53:51,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23974/203307 [27:15:28<203:53:51,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23975/203307 [27:15:32<203:53:48,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23975/203307 [27:15:32<203:53:48,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23976/203307 [27:15:36<203:53:41,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23976/203307 [27:15:36<203:53:41,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23977/203307 [27:15:40<203:53:40,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23977/203307 [27:15:40<203:53:40,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23978/203307 [27:15:44<203:53:33,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23978/203307 [27:15:44<203:53:33,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23979/203307 [27:15:48<203:53:30,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23979/203307 [27:15:48<203:53:30,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23980/203307 [27:15:53<203:53:29,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23980/203307 [27:15:53<203:53:29,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23981/203307 [27:15:57<203:53:26,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 23981/203307 [27:15:57<203:53:26,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23982/203307 [27:16:01<203:53:19,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23982/203307 [27:16:01<203:53:19,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23983/203307 [27:16:05<203:53:16,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23983/203307 [27:16:05<203:53:16,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23984/203307 [27:16:09<203:53:10,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23984/203307 [27:16:09<203:53:10,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23985/203307 [27:16:13<203:53:03,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23985/203307 [27:16:13<203:53:03,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23986/203307 [27:16:17<203:53:02,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23986/203307 [27:16:17<203:53:02,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23987/203307 [27:16:21<203:52:55,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23987/203307 [27:16:21<203:52:55,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23988/203307 [27:16:25<203:52:52,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23988/203307 [27:16:25<203:52:52,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23989/203307 [27:16:29<203:52:51,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23989/203307 [27:16:29<203:52:51,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23990/203307 [27:16:33<203:52:43,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23990/203307 [27:16:33<203:52:43,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23991/203307 [27:16:37<203:52:36,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23991/203307 [27:16:37<203:52:36,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23992/203307 [27:16:41<203:52:35,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23992/203307 [27:16:41<203:52:35,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23993/203307 [27:16:45<203:52:28,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23993/203307 [27:16:45<203:52:28,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23994/203307 [27:16:49<203:52:21,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23994/203307 [27:16:49<203:52:21,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23995/203307 [27:16:53<203:52:19,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23995/203307 [27:16:53<203:52:19,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23996/203307 [27:16:57<203:52:12,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23996/203307 [27:16:57<203:52:12,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23997/203307 [27:17:01<203:52:10,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23997/203307 [27:17:01<203:52:10,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23998/203307 [27:17:05<203:52:07,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23998/203307 [27:17:05<203:52:07,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23999/203307 [27:17:09<203:52:00,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 23999/203307 [27:17:09<203:52:00,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 24000/203307 [27:17:13<203:51:57,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 24000/203307 [27:17:13<203:51:57,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 24001/203307 [27:17:18<203:51:55,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  12%|█▏        | 24001/203307 [27:17:18<203:51:55,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24002/203307 [27:17:21<203:51:48,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24002/203307 [27:17:21<203:51:48,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24003/203307 [27:17:26<203:51:47,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24003/203307 [27:17:26<203:51:47,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24004/203307 [27:17:30<203:51:40,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24004/203307 [27:17:30<203:51:40,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24005/203307 [27:17:33<203:51:33,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24005/203307 [27:17:33<203:51:33,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24006/203307 [27:17:38<203:51:32,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24006/203307 [27:17:38<203:51:32,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24007/203307 [27:17:42<203:51:29,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24007/203307 [27:17:42<203:51:29,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24008/203307 [27:17:46<203:51:23,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24008/203307 [27:17:46<203:51:23,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24009/203307 [27:17:50<203:51:21,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24009/203307 [27:17:50<203:51:21,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24010/203307 [27:17:54<203:51:14,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24010/203307 [27:17:54<203:51:14,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24011/203307 [27:17:58<203:51:07,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24011/203307 [27:17:58<203:51:07,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24012/203307 [27:18:02<203:51:07,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24012/203307 [27:18:02<203:51:07,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24013/203307 [27:18:06<203:51:00,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24013/203307 [27:18:06<203:51:00,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24014/203307 [27:18:10<203:50:53,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24014/203307 [27:18:10<203:50:53,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24015/203307 [27:18:14<203:50:52,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24015/203307 [27:18:14<203:50:52,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24016/203307 [27:18:18<203:50:46,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24016/203307 [27:18:18<203:50:46,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24017/203307 [27:18:22<203:50:39,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24017/203307 [27:18:22<203:50:39,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24018/203307 [27:18:26<203:50:38,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24018/203307 [27:18:26<203:50:38,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24019/203307 [27:18:30<203:50:31,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24019/203307 [27:18:30<203:50:31,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24020/203307 [27:18:34<203:50:25,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24020/203307 [27:18:34<203:50:25,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24021/203307 [27:18:38<203:50:24,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24021/203307 [27:18:38<203:50:24,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24022/203307 [27:18:42<203:50:17,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24022/203307 [27:18:42<203:50:17,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24023/203307 [27:18:46<203:50:15,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24023/203307 [27:18:46<203:50:15,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24024/203307 [27:18:51<203:50:13,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24024/203307 [27:18:51<203:50:13,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24025/203307 [27:18:55<203:50:06,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24025/203307 [27:18:55<203:50:06,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24026/203307 [27:18:59<203:50:04,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24026/203307 [27:18:59<203:50:04,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24027/203307 [27:19:03<203:50:01,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24027/203307 [27:19:03<203:50:01,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24028/203307 [27:19:07<203:49:54,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24028/203307 [27:19:07<203:49:54,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24029/203307 [27:19:11<203:49:52,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24029/203307 [27:19:11<203:49:53,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24030/203307 [27:19:15<203:49:45,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24030/203307 [27:19:15<203:49:45,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24031/203307 [27:19:19<203:49:38,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24031/203307 [27:19:19<203:49:38,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24032/203307 [27:19:23<203:49:37,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24032/203307 [27:19:23<203:49:37,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24033/203307 [27:19:28<203:49:35,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24033/203307 [27:19:28<203:49:35,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24034/203307 [27:19:31<203:49:28,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24034/203307 [27:19:31<203:49:28,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24035/203307 [27:19:36<203:49:26,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24035/203307 [27:19:36<203:49:26,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24036/203307 [27:19:39<203:49:19,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24036/203307 [27:19:39<203:49:19,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24037/203307 [27:19:43<203:49:13,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24037/203307 [27:19:43<203:49:13,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24038/203307 [27:19:48<203:49:12,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24038/203307 [27:19:48<203:49:12,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24039/203307 [27:19:51<203:49:05,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24039/203307 [27:19:51<203:49:05,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24040/203307 [27:19:55<203:48:57,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24040/203307 [27:19:55<203:48:57,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24041/203307 [27:20:00<203:48:57,  0.24it/s, v_num=t5e6, training/loss=0.0886]Epoch 0:  12%|█▏        | 24041/203307 [27:20:00<203:48:57,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24042/203307 [27:20:04<203:48:53,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24042/203307 [27:20:04<203:48:54,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24043/203307 [27:20:07<203:48:46,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24043/203307 [27:20:07<203:48:46,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24044/203307 [27:20:12<203:48:44,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24044/203307 [27:20:12<203:48:44,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24045/203307 [27:20:16<203:48:38,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24045/203307 [27:20:16<203:48:38,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24046/203307 [27:20:19<203:48:31,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24046/203307 [27:20:19<203:48:32,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24047/203307 [27:20:24<203:48:31,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24047/203307 [27:20:24<203:48:31,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24048/203307 [27:20:28<203:48:24,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24048/203307 [27:20:28<203:48:24,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24049/203307 [27:20:32<203:48:22,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24049/203307 [27:20:32<203:48:22,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24050/203307 [27:20:36<203:48:20,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24050/203307 [27:20:36<203:48:20,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24051/203307 [27:20:41<203:48:17,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24051/203307 [27:20:41<203:48:17,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24052/203307 [27:20:45<203:48:14,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24052/203307 [27:20:45<203:48:14,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24053/203307 [27:20:49<203:48:12,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24053/203307 [27:20:49<203:48:12,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24054/203307 [27:20:53<203:48:04,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24054/203307 [27:20:53<203:48:04,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24055/203307 [27:20:57<203:48:03,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24055/203307 [27:20:57<203:48:03,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24056/203307 [27:21:01<203:47:57,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24056/203307 [27:21:01<203:47:57,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24057/203307 [27:21:05<203:47:50,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24057/203307 [27:21:05<203:47:50,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24058/203307 [27:21:09<203:47:49,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24058/203307 [27:21:09<203:47:49,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24059/203307 [27:21:14<203:47:47,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24059/203307 [27:21:14<203:47:47,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24060/203307 [27:21:18<203:47:43,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24060/203307 [27:21:18<203:47:43,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24061/203307 [27:21:22<203:47:41,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  12%|█▏        | 24061/203307 [27:21:22<203:47:41,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24062/203307 [27:21:26<203:47:34,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24062/203307 [27:21:26<203:47:34,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24063/203307 [27:21:30<203:47:27,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24063/203307 [27:21:30<203:47:27,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24064/203307 [27:21:34<203:47:27,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24064/203307 [27:21:34<203:47:27,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24065/203307 [27:21:38<203:47:19,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24065/203307 [27:21:38<203:47:19,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24066/203307 [27:21:42<203:47:12,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24066/203307 [27:21:42<203:47:12,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24067/203307 [27:21:46<203:47:11,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24067/203307 [27:21:46<203:47:11,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24068/203307 [27:21:50<203:47:03,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24068/203307 [27:21:50<203:47:03,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24069/203307 [27:21:54<203:47:00,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24069/203307 [27:21:54<203:47:00,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24070/203307 [27:21:58<203:46:58,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24070/203307 [27:21:58<203:46:58,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24071/203307 [27:22:02<203:46:50,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24071/203307 [27:22:02<203:46:50,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24072/203307 [27:22:05<203:46:43,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24072/203307 [27:22:05<203:46:43,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24073/203307 [27:22:10<203:46:41,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24073/203307 [27:22:10<203:46:41,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24074/203307 [27:22:14<203:46:34,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24074/203307 [27:22:14<203:46:34,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24075/203307 [27:22:18<203:46:33,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24075/203307 [27:22:18<203:46:33,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24076/203307 [27:22:22<203:46:31,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24076/203307 [27:22:22<203:46:31,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24077/203307 [27:22:26<203:46:24,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24077/203307 [27:22:26<203:46:24,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24078/203307 [27:22:31<203:46:22,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24078/203307 [27:22:31<203:46:22,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24079/203307 [27:22:35<203:46:20,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24079/203307 [27:22:35<203:46:20,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24080/203307 [27:22:39<203:46:13,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24080/203307 [27:22:39<203:46:13,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24081/203307 [27:22:43<203:46:12,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  12%|█▏        | 24081/203307 [27:22:43<203:46:12,  0.24it/s, v_num=t5e6, training/loss=0.092] Epoch 0:  12%|█▏        | 24082/203307 [27:22:47<203:46:05,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24082/203307 [27:22:47<203:46:05,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24083/203307 [27:22:51<203:45:59,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24083/203307 [27:22:51<203:45:59,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24084/203307 [27:22:55<203:45:58,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24084/203307 [27:22:55<203:45:58,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24085/203307 [27:22:59<203:45:55,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24085/203307 [27:22:59<203:45:55,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24086/203307 [27:23:03<203:45:48,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24086/203307 [27:23:03<203:45:48,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24087/203307 [27:23:07<203:45:46,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24087/203307 [27:23:07<203:45:46,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24088/203307 [27:23:11<203:45:39,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24088/203307 [27:23:11<203:45:39,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24089/203307 [27:23:15<203:45:33,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24089/203307 [27:23:15<203:45:33,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24090/203307 [27:23:20<203:45:32,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24090/203307 [27:23:20<203:45:32,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24091/203307 [27:23:23<203:45:25,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24091/203307 [27:23:23<203:45:25,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24092/203307 [27:23:27<203:45:18,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24092/203307 [27:23:27<203:45:18,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24093/203307 [27:23:31<203:45:16,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24093/203307 [27:23:31<203:45:16,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24094/203307 [27:23:35<203:45:09,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24094/203307 [27:23:35<203:45:09,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24095/203307 [27:23:39<203:45:02,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24095/203307 [27:23:39<203:45:02,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24096/203307 [27:23:43<203:45:01,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24096/203307 [27:23:43<203:45:01,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24097/203307 [27:23:47<203:44:54,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24097/203307 [27:23:47<203:44:54,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24098/203307 [27:23:51<203:44:47,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24098/203307 [27:23:51<203:44:47,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24099/203307 [27:23:55<203:44:46,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24099/203307 [27:23:55<203:44:46,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24100/203307 [27:23:59<203:44:39,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24100/203307 [27:23:59<203:44:39,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24101/203307 [27:24:03<203:44:38,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  12%|█▏        | 24101/203307 [27:24:03<203:44:38,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24102/203307 [27:24:08<203:44:35,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24102/203307 [27:24:08<203:44:35,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24103/203307 [27:24:11<203:44:28,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24103/203307 [27:24:11<203:44:28,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24104/203307 [27:24:16<203:44:26,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24104/203307 [27:24:16<203:44:26,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24105/203307 [27:24:20<203:44:24,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24105/203307 [27:24:20<203:44:24,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24106/203307 [27:24:24<203:44:17,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24106/203307 [27:24:24<203:44:17,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24107/203307 [27:24:28<203:44:15,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24107/203307 [27:24:28<203:44:15,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24108/203307 [27:24:32<203:44:09,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24108/203307 [27:24:32<203:44:09,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24109/203307 [27:24:36<203:44:02,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24109/203307 [27:24:36<203:44:02,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24110/203307 [27:24:40<203:44:00,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24110/203307 [27:24:40<203:44:00,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24111/203307 [27:24:44<203:43:58,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24111/203307 [27:24:44<203:43:58,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24112/203307 [27:24:48<203:43:50,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24112/203307 [27:24:48<203:43:50,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24113/203307 [27:24:52<203:43:48,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24113/203307 [27:24:52<203:43:48,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24114/203307 [27:24:57<203:43:46,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24114/203307 [27:24:57<203:43:46,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24115/203307 [27:25:00<203:43:38,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24115/203307 [27:25:00<203:43:38,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24116/203307 [27:25:05<203:43:37,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24116/203307 [27:25:05<203:43:37,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24117/203307 [27:25:08<203:43:30,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24117/203307 [27:25:08<203:43:30,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24118/203307 [27:25:12<203:43:23,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24118/203307 [27:25:12<203:43:23,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24119/203307 [27:25:17<203:43:21,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24119/203307 [27:25:17<203:43:22,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24120/203307 [27:25:20<203:43:16,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24120/203307 [27:25:20<203:43:16,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24121/203307 [27:25:24<203:43:09,  0.24it/s, v_num=t5e6, training/loss=0.077]Epoch 0:  12%|█▏        | 24121/203307 [27:25:24<203:43:09,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24122/203307 [27:25:29<203:43:07,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24122/203307 [27:25:29<203:43:07,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24123/203307 [27:25:33<203:43:04,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24123/203307 [27:25:33<203:43:04,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24124/203307 [27:25:37<203:42:57,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24124/203307 [27:25:37<203:42:57,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24125/203307 [27:25:41<203:42:56,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24125/203307 [27:25:41<203:42:56,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24126/203307 [27:25:45<203:42:50,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24126/203307 [27:25:45<203:42:50,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24127/203307 [27:25:49<203:42:48,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24127/203307 [27:25:49<203:42:48,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24128/203307 [27:25:54<203:42:45,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24128/203307 [27:25:54<203:42:45,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24129/203307 [27:25:57<203:42:38,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24129/203307 [27:25:57<203:42:38,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24130/203307 [27:26:02<203:42:36,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24130/203307 [27:26:02<203:42:36,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24131/203307 [27:26:06<203:42:33,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24131/203307 [27:26:06<203:42:33,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24132/203307 [27:26:10<203:42:29,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24132/203307 [27:26:10<203:42:29,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24133/203307 [27:26:14<203:42:27,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24133/203307 [27:26:14<203:42:27,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24134/203307 [27:26:18<203:42:21,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24134/203307 [27:26:18<203:42:21,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24135/203307 [27:26:22<203:42:14,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24135/203307 [27:26:22<203:42:14,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24136/203307 [27:26:26<203:42:13,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24136/203307 [27:26:26<203:42:13,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24137/203307 [27:26:31<203:42:10,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24137/203307 [27:26:31<203:42:10,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24138/203307 [27:26:34<203:42:03,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24138/203307 [27:26:34<203:42:03,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24139/203307 [27:26:39<203:42:01,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24139/203307 [27:26:39<203:42:01,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24140/203307 [27:26:42<203:41:54,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24140/203307 [27:26:42<203:41:54,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24141/203307 [27:26:47<203:41:51,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24141/203307 [27:26:47<203:41:51,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24142/203307 [27:26:51<203:41:49,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24142/203307 [27:26:51<203:41:49,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24143/203307 [27:26:55<203:41:42,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24143/203307 [27:26:55<203:41:42,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24144/203307 [27:26:58<203:41:34,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24144/203307 [27:26:58<203:41:34,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24145/203307 [27:27:03<203:41:33,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24145/203307 [27:27:03<203:41:33,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24146/203307 [27:27:06<203:41:26,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24146/203307 [27:27:06<203:41:26,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24147/203307 [27:27:10<203:41:18,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24147/203307 [27:27:10<203:41:18,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24148/203307 [27:27:14<203:41:16,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24148/203307 [27:27:14<203:41:16,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24149/203307 [27:27:18<203:41:09,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24149/203307 [27:27:18<203:41:09,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24150/203307 [27:27:22<203:41:06,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24150/203307 [27:27:22<203:41:06,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24151/203307 [27:27:27<203:41:05,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24151/203307 [27:27:27<203:41:05,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24152/203307 [27:27:31<203:40:58,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24152/203307 [27:27:31<203:40:58,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24153/203307 [27:27:35<203:40:57,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24153/203307 [27:27:35<203:40:57,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24154/203307 [27:27:39<203:40:54,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24154/203307 [27:27:39<203:40:54,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24155/203307 [27:27:43<203:40:47,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24155/203307 [27:27:43<203:40:47,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24156/203307 [27:27:47<203:40:44,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24156/203307 [27:27:47<203:40:44,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24157/203307 [27:27:52<203:40:42,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24157/203307 [27:27:52<203:40:42,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24158/203307 [27:27:55<203:40:35,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24158/203307 [27:27:55<203:40:35,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24159/203307 [27:28:00<203:40:32,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24159/203307 [27:28:00<203:40:32,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24160/203307 [27:28:03<203:40:25,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24160/203307 [27:28:03<203:40:25,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24161/203307 [27:28:07<203:40:17,  0.24it/s, v_num=t5e6, training/loss=0.0732]Epoch 0:  12%|█▏        | 24161/203307 [27:28:07<203:40:17,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24162/203307 [27:28:11<203:40:16,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24162/203307 [27:28:11<203:40:16,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24163/203307 [27:28:16<203:40:13,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24163/203307 [27:28:16<203:40:13,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24164/203307 [27:28:19<203:40:05,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24164/203307 [27:28:19<203:40:06,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24165/203307 [27:28:24<203:40:03,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24165/203307 [27:28:24<203:40:03,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24166/203307 [27:28:27<203:39:56,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24166/203307 [27:28:27<203:39:57,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24167/203307 [27:28:31<203:39:49,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24167/203307 [27:28:31<203:39:50,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24168/203307 [27:28:35<203:39:48,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24168/203307 [27:28:35<203:39:49,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24169/203307 [27:28:39<203:39:41,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24169/203307 [27:28:39<203:39:41,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24170/203307 [27:28:43<203:39:34,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24170/203307 [27:28:43<203:39:34,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24171/203307 [27:28:47<203:39:32,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24171/203307 [27:28:47<203:39:32,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24172/203307 [27:28:51<203:39:25,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24172/203307 [27:28:51<203:39:25,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24173/203307 [27:28:55<203:39:18,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24173/203307 [27:28:55<203:39:18,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24174/203307 [27:28:59<203:39:17,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24174/203307 [27:28:59<203:39:17,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24175/203307 [27:29:03<203:39:10,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24175/203307 [27:29:03<203:39:10,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24176/203307 [27:29:06<203:39:02,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24176/203307 [27:29:06<203:39:02,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24177/203307 [27:29:11<203:39:01,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24177/203307 [27:29:11<203:39:01,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24178/203307 [27:29:15<203:38:54,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24178/203307 [27:29:15<203:38:54,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24179/203307 [27:29:19<203:38:52,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24179/203307 [27:29:19<203:38:52,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24180/203307 [27:29:23<203:38:50,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24180/203307 [27:29:23<203:38:50,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24181/203307 [27:29:27<203:38:43,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 24181/203307 [27:29:27<203:38:43,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24182/203307 [27:29:31<203:38:41,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24182/203307 [27:29:31<203:38:41,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24183/203307 [27:29:36<203:38:39,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24183/203307 [27:29:36<203:38:39,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24184/203307 [27:29:40<203:38:33,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24184/203307 [27:29:40<203:38:33,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24185/203307 [27:29:44<203:38:32,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24185/203307 [27:29:44<203:38:32,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24186/203307 [27:29:48<203:38:28,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24186/203307 [27:29:48<203:38:29,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24187/203307 [27:29:52<203:38:22,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24187/203307 [27:29:52<203:38:22,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24188/203307 [27:29:57<203:38:21,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24188/203307 [27:29:57<203:38:21,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24189/203307 [27:30:01<203:38:18,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24189/203307 [27:30:01<203:38:18,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24190/203307 [27:30:05<203:38:12,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24190/203307 [27:30:05<203:38:12,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24191/203307 [27:30:09<203:38:10,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24191/203307 [27:30:09<203:38:10,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24192/203307 [27:30:13<203:38:04,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24192/203307 [27:30:13<203:38:04,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24193/203307 [27:30:17<203:37:57,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24193/203307 [27:30:17<203:37:57,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24194/203307 [27:30:21<203:37:57,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24194/203307 [27:30:21<203:37:57,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24195/203307 [27:30:25<203:37:53,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24195/203307 [27:30:25<203:37:53,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24196/203307 [27:30:29<203:37:46,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24196/203307 [27:30:29<203:37:46,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24197/203307 [27:30:34<203:37:45,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24197/203307 [27:30:34<203:37:45,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24198/203307 [27:30:37<203:37:38,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24198/203307 [27:30:37<203:37:38,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24199/203307 [27:30:41<203:37:31,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24199/203307 [27:30:41<203:37:31,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24200/203307 [27:30:45<203:37:28,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24200/203307 [27:30:45<203:37:28,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24201/203307 [27:30:49<203:37:21,  0.24it/s, v_num=t5e6, training/loss=0.0706]Epoch 0:  12%|█▏        | 24201/203307 [27:30:49<203:37:21,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24202/203307 [27:30:53<203:37:14,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24202/203307 [27:30:53<203:37:14,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24203/203307 [27:30:57<203:37:12,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24203/203307 [27:30:57<203:37:12,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24204/203307 [27:31:01<203:37:09,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24204/203307 [27:31:01<203:37:09,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24205/203307 [27:31:06<203:37:07,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24205/203307 [27:31:06<203:37:07,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24206/203307 [27:31:10<203:37:05,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24206/203307 [27:31:10<203:37:05,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24207/203307 [27:31:14<203:36:58,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24207/203307 [27:31:14<203:36:58,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24208/203307 [27:31:18<203:36:55,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24208/203307 [27:31:18<203:36:55,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24209/203307 [27:31:22<203:36:53,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24209/203307 [27:31:22<203:36:53,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24210/203307 [27:31:26<203:36:46,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24210/203307 [27:31:26<203:36:46,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24211/203307 [27:31:30<203:36:45,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24211/203307 [27:31:30<203:36:45,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24212/203307 [27:31:34<203:36:38,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24212/203307 [27:31:34<203:36:38,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24213/203307 [27:31:38<203:36:34,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24213/203307 [27:31:38<203:36:35,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24214/203307 [27:31:43<203:36:32,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24214/203307 [27:31:43<203:36:33,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24215/203307 [27:31:47<203:36:29,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24215/203307 [27:31:47<203:36:29,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24216/203307 [27:31:51<203:36:22,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24216/203307 [27:31:51<203:36:22,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24217/203307 [27:31:55<203:36:20,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24217/203307 [27:31:55<203:36:20,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24218/203307 [27:31:59<203:36:12,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24218/203307 [27:31:59<203:36:12,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24219/203307 [27:32:02<203:36:05,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24219/203307 [27:32:02<203:36:05,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24220/203307 [27:32:07<203:36:04,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24220/203307 [27:32:07<203:36:04,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24221/203307 [27:32:10<203:35:57,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24221/203307 [27:32:10<203:35:57,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24222/203307 [27:32:15<203:35:54,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24222/203307 [27:32:15<203:35:54,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24223/203307 [27:32:19<203:35:53,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24223/203307 [27:32:19<203:35:53,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24224/203307 [27:32:23<203:35:46,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24224/203307 [27:32:23<203:35:46,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24225/203307 [27:32:27<203:35:39,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24225/203307 [27:32:27<203:35:39,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24226/203307 [27:32:31<203:35:37,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24226/203307 [27:32:31<203:35:37,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24227/203307 [27:32:35<203:35:30,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24227/203307 [27:32:35<203:35:30,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24228/203307 [27:32:38<203:35:23,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24228/203307 [27:32:38<203:35:23,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24229/203307 [27:32:43<203:35:22,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24229/203307 [27:32:43<203:35:22,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24230/203307 [27:32:46<203:35:14,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24230/203307 [27:32:46<203:35:14,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24231/203307 [27:32:51<203:35:12,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24231/203307 [27:32:51<203:35:12,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24232/203307 [27:32:55<203:35:10,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24232/203307 [27:32:55<203:35:10,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24233/203307 [27:32:59<203:35:03,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24233/203307 [27:32:59<203:35:03,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24234/203307 [27:33:03<203:35:00,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24234/203307 [27:33:03<203:35:00,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24235/203307 [27:33:07<203:34:57,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24235/203307 [27:33:07<203:34:57,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24236/203307 [27:33:11<203:34:49,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24236/203307 [27:33:11<203:34:49,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24237/203307 [27:33:15<203:34:47,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24237/203307 [27:33:15<203:34:47,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24238/203307 [27:33:19<203:34:41,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24238/203307 [27:33:19<203:34:41,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24239/203307 [27:33:23<203:34:34,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24239/203307 [27:33:23<203:34:34,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24240/203307 [27:33:27<203:34:33,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24240/203307 [27:33:27<203:34:33,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24241/203307 [27:33:32<203:34:31,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 24241/203307 [27:33:32<203:34:31,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24242/203307 [27:33:35<203:34:24,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24242/203307 [27:33:35<203:34:24,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24243/203307 [27:33:40<203:34:21,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24243/203307 [27:33:40<203:34:21,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24244/203307 [27:33:43<203:34:14,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24244/203307 [27:33:43<203:34:15,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24245/203307 [27:33:47<203:34:08,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24245/203307 [27:33:47<203:34:08,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24246/203307 [27:33:52<203:34:06,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24246/203307 [27:33:52<203:34:06,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24247/203307 [27:33:55<203:33:59,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24247/203307 [27:33:55<203:33:59,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24248/203307 [27:33:59<203:33:51,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24248/203307 [27:33:59<203:33:51,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24249/203307 [27:34:03<203:33:50,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24249/203307 [27:34:03<203:33:50,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24250/203307 [27:34:07<203:33:43,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24250/203307 [27:34:07<203:33:43,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24251/203307 [27:34:11<203:33:36,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24251/203307 [27:34:11<203:33:36,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24252/203307 [27:34:15<203:33:34,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24252/203307 [27:34:15<203:33:34,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24253/203307 [27:34:19<203:33:27,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24253/203307 [27:34:19<203:33:27,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24254/203307 [27:34:22<203:33:20,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24254/203307 [27:34:22<203:33:20,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24255/203307 [27:34:27<203:33:18,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24255/203307 [27:34:27<203:33:18,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24256/203307 [27:34:31<203:33:11,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24256/203307 [27:34:31<203:33:11,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24257/203307 [27:34:35<203:33:09,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24257/203307 [27:34:35<203:33:09,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24258/203307 [27:34:39<203:33:06,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24258/203307 [27:34:39<203:33:06,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24259/203307 [27:34:43<203:32:59,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24259/203307 [27:34:43<203:32:59,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24260/203307 [27:34:47<203:32:56,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24260/203307 [27:34:47<203:32:56,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24261/203307 [27:34:51<203:32:53,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  12%|█▏        | 24261/203307 [27:34:51<203:32:53,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24262/203307 [27:34:55<203:32:45,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24262/203307 [27:34:55<203:32:45,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24263/203307 [27:34:59<203:32:43,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24263/203307 [27:34:59<203:32:43,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24264/203307 [27:35:03<203:32:36,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24264/203307 [27:35:03<203:32:36,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24265/203307 [27:35:07<203:32:28,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24265/203307 [27:35:07<203:32:28,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24266/203307 [27:35:11<203:32:27,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24266/203307 [27:35:11<203:32:27,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24267/203307 [27:35:15<203:32:23,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24267/203307 [27:35:15<203:32:23,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24268/203307 [27:35:19<203:32:16,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24268/203307 [27:35:19<203:32:16,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24269/203307 [27:35:23<203:32:14,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24269/203307 [27:35:23<203:32:14,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24270/203307 [27:35:27<203:32:08,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24270/203307 [27:35:27<203:32:08,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24271/203307 [27:35:31<203:32:01,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24271/203307 [27:35:31<203:32:01,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24272/203307 [27:35:35<203:32:00,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24272/203307 [27:35:35<203:32:00,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24273/203307 [27:35:39<203:31:53,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24273/203307 [27:35:39<203:31:53,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24274/203307 [27:35:43<203:31:46,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24274/203307 [27:35:43<203:31:46,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24275/203307 [27:35:47<203:31:45,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24275/203307 [27:35:47<203:31:45,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24276/203307 [27:35:51<203:31:41,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24276/203307 [27:35:51<203:31:41,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24277/203307 [27:35:55<203:31:34,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24277/203307 [27:35:55<203:31:34,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24278/203307 [27:36:00<203:31:33,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24278/203307 [27:36:00<203:31:33,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24279/203307 [27:36:03<203:31:26,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24279/203307 [27:36:03<203:31:26,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24280/203307 [27:36:07<203:31:19,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24280/203307 [27:36:07<203:31:19,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24281/203307 [27:36:12<203:31:19,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  12%|█▏        | 24281/203307 [27:36:12<203:31:19,  0.24it/s, v_num=t5e6, training/loss=0.082] Epoch 0:  12%|█▏        | 24282/203307 [27:36:15<203:31:12,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24282/203307 [27:36:15<203:31:12,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24283/203307 [27:36:20<203:31:10,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24283/203307 [27:36:20<203:31:10,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24284/203307 [27:36:24<203:31:07,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24284/203307 [27:36:24<203:31:07,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24285/203307 [27:36:28<203:31:03,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24285/203307 [27:36:28<203:31:03,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24286/203307 [27:36:33<203:31:04,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24286/203307 [27:36:33<203:31:04,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24287/203307 [27:36:37<203:31:02,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24287/203307 [27:36:37<203:31:02,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24288/203307 [27:36:41<203:30:55,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24288/203307 [27:36:41<203:30:55,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24289/203307 [27:36:45<203:30:54,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24289/203307 [27:36:45<203:30:54,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24290/203307 [27:36:49<203:30:48,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24290/203307 [27:36:49<203:30:48,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24291/203307 [27:36:53<203:30:41,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24291/203307 [27:36:53<203:30:41,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24292/203307 [27:36:57<203:30:39,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24292/203307 [27:36:57<203:30:39,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24293/203307 [27:37:02<203:30:36,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24293/203307 [27:37:02<203:30:36,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24294/203307 [27:37:06<203:30:32,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24294/203307 [27:37:06<203:30:32,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24295/203307 [27:37:10<203:30:30,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24295/203307 [27:37:10<203:30:30,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24296/203307 [27:37:14<203:30:24,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24296/203307 [27:37:14<203:30:24,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24297/203307 [27:37:18<203:30:17,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24297/203307 [27:37:18<203:30:17,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24298/203307 [27:37:22<203:30:17,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24298/203307 [27:37:22<203:30:17,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24299/203307 [27:37:26<203:30:10,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24299/203307 [27:37:26<203:30:10,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24300/203307 [27:37:30<203:30:03,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24300/203307 [27:37:30<203:30:03,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24301/203307 [27:37:34<203:30:02,  0.24it/s, v_num=t5e6, training/loss=0.082]Epoch 0:  12%|█▏        | 24301/203307 [27:37:34<203:30:02,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24302/203307 [27:37:38<203:29:57,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24302/203307 [27:37:38<203:29:57,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24303/203307 [27:37:42<203:29:54,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24303/203307 [27:37:42<203:29:54,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24304/203307 [27:37:47<203:29:52,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24304/203307 [27:37:47<203:29:52,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24305/203307 [27:37:50<203:29:45,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24305/203307 [27:37:50<203:29:45,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24306/203307 [27:37:54<203:29:38,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24306/203307 [27:37:54<203:29:38,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24307/203307 [27:37:59<203:29:38,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24307/203307 [27:37:59<203:29:38,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24308/203307 [27:38:03<203:29:31,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24308/203307 [27:38:03<203:29:31,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24309/203307 [27:38:07<203:29:30,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24309/203307 [27:38:07<203:29:30,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24310/203307 [27:38:11<203:29:28,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24310/203307 [27:38:11<203:29:28,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24311/203307 [27:38:15<203:29:21,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24311/203307 [27:38:15<203:29:21,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24312/203307 [27:38:19<203:29:18,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24312/203307 [27:38:19<203:29:18,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24313/203307 [27:38:24<203:29:16,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24313/203307 [27:38:24<203:29:16,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24314/203307 [27:38:27<203:29:09,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24314/203307 [27:38:27<203:29:09,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24315/203307 [27:38:32<203:29:08,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24315/203307 [27:38:32<203:29:08,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24316/203307 [27:38:36<203:29:01,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24316/203307 [27:38:36<203:29:01,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24317/203307 [27:38:39<203:28:53,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24317/203307 [27:38:39<203:28:53,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24318/203307 [27:38:44<203:28:52,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24318/203307 [27:38:44<203:28:52,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24319/203307 [27:38:48<203:28:49,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24319/203307 [27:38:48<203:28:49,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24320/203307 [27:38:51<203:28:41,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24320/203307 [27:38:51<203:28:41,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24321/203307 [27:38:56<203:28:39,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24321/203307 [27:38:56<203:28:39,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24322/203307 [27:38:59<203:28:31,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24322/203307 [27:38:59<203:28:31,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24323/203307 [27:39:03<203:28:24,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24323/203307 [27:39:03<203:28:24,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24324/203307 [27:39:07<203:28:22,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24324/203307 [27:39:08<203:28:22,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24325/203307 [27:39:11<203:28:15,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24325/203307 [27:39:11<203:28:15,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24326/203307 [27:39:15<203:28:08,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24326/203307 [27:39:15<203:28:08,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24327/203307 [27:39:19<203:28:07,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24327/203307 [27:39:19<203:28:07,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24328/203307 [27:39:23<203:28:01,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24328/203307 [27:39:23<203:28:01,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24329/203307 [27:39:27<203:27:56,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24329/203307 [27:39:27<203:27:56,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24330/203307 [27:39:32<203:27:54,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24330/203307 [27:39:32<203:27:54,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24331/203307 [27:39:35<203:27:47,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24331/203307 [27:39:35<203:27:47,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24332/203307 [27:39:39<203:27:40,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24332/203307 [27:39:39<203:27:41,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24333/203307 [27:39:44<203:27:40,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24333/203307 [27:39:44<203:27:40,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24334/203307 [27:39:47<203:27:33,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24334/203307 [27:39:47<203:27:33,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24335/203307 [27:39:52<203:27:31,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24335/203307 [27:39:52<203:27:31,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24336/203307 [27:39:56<203:27:29,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24336/203307 [27:39:56<203:27:29,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24337/203307 [27:40:00<203:27:22,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24337/203307 [27:40:00<203:27:22,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24338/203307 [27:40:04<203:27:20,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24338/203307 [27:40:04<203:27:20,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24339/203307 [27:40:08<203:27:17,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24339/203307 [27:40:08<203:27:17,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24340/203307 [27:40:12<203:27:11,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24340/203307 [27:40:12<203:27:11,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24341/203307 [27:40:17<203:27:09,  0.24it/s, v_num=t5e6, training/loss=0.0954]Epoch 0:  12%|█▏        | 24341/203307 [27:40:17<203:27:09,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24342/203307 [27:40:20<203:27:04,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24342/203307 [27:40:20<203:27:04,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24343/203307 [27:40:24<203:26:57,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24343/203307 [27:40:24<203:26:57,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24344/203307 [27:40:29<203:26:56,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24344/203307 [27:40:29<203:26:56,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24345/203307 [27:40:33<203:26:54,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24345/203307 [27:40:33<203:26:54,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24346/203307 [27:40:37<203:26:47,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24346/203307 [27:40:37<203:26:47,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24347/203307 [27:40:41<203:26:45,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24347/203307 [27:40:41<203:26:45,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24348/203307 [27:40:45<203:26:42,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24348/203307 [27:40:45<203:26:42,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24349/203307 [27:40:49<203:26:35,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24349/203307 [27:40:49<203:26:35,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24350/203307 [27:40:54<203:26:34,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24350/203307 [27:40:54<203:26:34,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24351/203307 [27:40:57<203:26:27,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24351/203307 [27:40:57<203:26:27,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24352/203307 [27:41:01<203:26:21,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24352/203307 [27:41:01<203:26:21,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24353/203307 [27:41:06<203:26:20,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24353/203307 [27:41:06<203:26:20,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24354/203307 [27:41:09<203:26:14,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24354/203307 [27:41:09<203:26:14,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24355/203307 [27:41:13<203:26:07,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24355/203307 [27:41:13<203:26:07,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24356/203307 [27:41:18<203:26:06,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24356/203307 [27:41:18<203:26:06,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24357/203307 [27:41:22<203:26:03,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24357/203307 [27:41:22<203:26:03,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24358/203307 [27:41:26<203:25:56,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24358/203307 [27:41:26<203:25:56,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24359/203307 [27:41:30<203:25:55,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24359/203307 [27:41:30<203:25:55,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24360/203307 [27:41:34<203:25:48,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24360/203307 [27:41:34<203:25:48,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24361/203307 [27:41:38<203:25:47,  0.24it/s, v_num=t5e6, training/loss=0.0823]Epoch 0:  12%|█▏        | 24361/203307 [27:41:38<203:25:47,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24362/203307 [27:41:43<203:25:44,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24362/203307 [27:41:43<203:25:44,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24363/203307 [27:41:46<203:25:37,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24363/203307 [27:41:46<203:25:37,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24364/203307 [27:41:51<203:25:35,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24364/203307 [27:41:51<203:25:35,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24365/203307 [27:41:55<203:25:33,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24365/203307 [27:41:55<203:25:33,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24366/203307 [27:41:59<203:25:30,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24366/203307 [27:41:59<203:25:30,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24367/203307 [27:42:04<203:25:28,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24367/203307 [27:42:04<203:25:28,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24368/203307 [27:42:07<203:25:22,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24368/203307 [27:42:07<203:25:22,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24369/203307 [27:42:11<203:25:15,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24369/203307 [27:42:11<203:25:15,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24370/203307 [27:42:16<203:25:14,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24370/203307 [27:42:16<203:25:14,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24371/203307 [27:42:20<203:25:11,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24371/203307 [27:42:20<203:25:11,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24372/203307 [27:42:24<203:25:05,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24372/203307 [27:42:24<203:25:05,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24373/203307 [27:42:28<203:25:03,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24373/203307 [27:42:28<203:25:03,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24374/203307 [27:42:32<203:24:56,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24374/203307 [27:42:32<203:24:56,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24375/203307 [27:42:36<203:24:54,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24375/203307 [27:42:36<203:24:54,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24376/203307 [27:42:41<203:24:53,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24376/203307 [27:42:41<203:24:53,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24377/203307 [27:42:45<203:24:46,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24377/203307 [27:42:45<203:24:46,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24378/203307 [27:42:48<203:24:39,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24378/203307 [27:42:48<203:24:39,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24379/203307 [27:42:53<203:24:39,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24379/203307 [27:42:53<203:24:39,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24380/203307 [27:42:57<203:24:32,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24380/203307 [27:42:57<203:24:32,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24381/203307 [27:43:00<203:24:26,  0.24it/s, v_num=t5e6, training/loss=0.0842]Epoch 0:  12%|█▏        | 24381/203307 [27:43:00<203:24:26,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24382/203307 [27:43:05<203:24:24,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24382/203307 [27:43:05<203:24:24,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24383/203307 [27:43:08<203:24:17,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24383/203307 [27:43:08<203:24:17,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24384/203307 [27:43:13<203:24:14,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24384/203307 [27:43:13<203:24:14,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24385/203307 [27:43:17<203:24:13,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24385/203307 [27:43:17<203:24:13,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24386/203307 [27:43:21<203:24:06,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24386/203307 [27:43:21<203:24:06,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24387/203307 [27:43:25<203:24:04,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24387/203307 [27:43:25<203:24:04,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24388/203307 [27:43:30<203:24:02,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24388/203307 [27:43:30<203:24:02,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24389/203307 [27:43:33<203:23:55,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24389/203307 [27:43:33<203:23:55,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24390/203307 [27:43:38<203:23:53,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24390/203307 [27:43:38<203:23:53,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24391/203307 [27:43:42<203:23:50,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24391/203307 [27:43:42<203:23:50,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24392/203307 [27:43:46<203:23:43,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24392/203307 [27:43:46<203:23:43,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24393/203307 [27:43:50<203:23:42,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24393/203307 [27:43:50<203:23:42,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24394/203307 [27:43:54<203:23:36,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24394/203307 [27:43:54<203:23:36,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24395/203307 [27:43:58<203:23:29,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24395/203307 [27:43:58<203:23:29,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24396/203307 [27:44:02<203:23:28,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24396/203307 [27:44:02<203:23:28,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24397/203307 [27:44:06<203:23:25,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24397/203307 [27:44:06<203:23:25,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24398/203307 [27:44:10<203:23:19,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24398/203307 [27:44:10<203:23:19,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24399/203307 [27:44:15<203:23:17,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24399/203307 [27:44:15<203:23:17,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24400/203307 [27:44:18<203:23:10,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24400/203307 [27:44:18<203:23:10,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24401/203307 [27:44:22<203:23:04,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  12%|█▏        | 24401/203307 [27:44:22<203:23:04,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24402/203307 [27:44:27<203:23:03,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24402/203307 [27:44:27<203:23:03,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24403/203307 [27:44:30<203:22:56,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24403/203307 [27:44:30<203:22:56,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24404/203307 [27:44:34<203:22:50,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24404/203307 [27:44:34<203:22:50,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24405/203307 [27:44:39<203:22:49,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24405/203307 [27:44:39<203:22:49,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24406/203307 [27:44:43<203:22:43,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24406/203307 [27:44:43<203:22:43,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24407/203307 [27:44:46<203:22:36,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24407/203307 [27:44:46<203:22:36,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24408/203307 [27:44:51<203:22:35,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24408/203307 [27:44:51<203:22:35,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24409/203307 [27:44:55<203:22:29,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24409/203307 [27:44:55<203:22:29,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24410/203307 [27:44:58<203:22:22,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24410/203307 [27:44:58<203:22:22,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24411/203307 [27:45:03<203:22:22,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24411/203307 [27:45:03<203:22:22,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24412/203307 [27:45:07<203:22:15,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24412/203307 [27:45:07<203:22:15,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24413/203307 [27:45:11<203:22:13,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24413/203307 [27:45:11<203:22:13,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24414/203307 [27:45:15<203:22:11,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24414/203307 [27:45:15<203:22:11,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24415/203307 [27:45:19<203:22:04,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24415/203307 [27:45:19<203:22:04,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24416/203307 [27:45:23<203:22:02,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24416/203307 [27:45:23<203:22:02,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24417/203307 [27:45:28<203:22:00,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24417/203307 [27:45:28<203:22:00,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24418/203307 [27:45:32<203:21:53,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24418/203307 [27:45:32<203:21:53,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24419/203307 [27:45:36<203:21:52,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24419/203307 [27:45:36<203:21:52,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24420/203307 [27:45:40<203:21:49,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24420/203307 [27:45:40<203:21:49,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24421/203307 [27:45:44<203:21:43,  0.24it/s, v_num=t5e6, training/loss=0.0722]Epoch 0:  12%|█▏        | 24421/203307 [27:45:44<203:21:43,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24422/203307 [27:45:49<203:21:41,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24422/203307 [27:45:49<203:21:41,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24423/203307 [27:45:53<203:21:39,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24423/203307 [27:45:53<203:21:39,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24424/203307 [27:45:57<203:21:32,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24424/203307 [27:45:57<203:21:32,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24425/203307 [27:46:01<203:21:31,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24425/203307 [27:46:01<203:21:31,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24426/203307 [27:46:05<203:21:24,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24426/203307 [27:46:05<203:21:24,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24427/203307 [27:46:09<203:21:17,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24427/203307 [27:46:09<203:21:17,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24428/203307 [27:46:13<203:21:16,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24428/203307 [27:46:13<203:21:16,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24429/203307 [27:46:17<203:21:14,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24429/203307 [27:46:17<203:21:14,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24430/203307 [27:46:21<203:21:07,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24430/203307 [27:46:21<203:21:07,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24431/203307 [27:46:26<203:21:07,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24431/203307 [27:46:26<203:21:07,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24432/203307 [27:46:29<203:21:00,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24432/203307 [27:46:29<203:21:00,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24433/203307 [27:46:33<203:20:53,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24433/203307 [27:46:33<203:20:53,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24434/203307 [27:46:38<203:20:53,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24434/203307 [27:46:38<203:20:53,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24435/203307 [27:46:42<203:20:47,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24435/203307 [27:46:42<203:20:47,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24436/203307 [27:46:45<203:20:40,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24436/203307 [27:46:45<203:20:40,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24437/203307 [27:46:50<203:20:39,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24437/203307 [27:46:50<203:20:39,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24438/203307 [27:46:54<203:20:36,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24438/203307 [27:46:54<203:20:36,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24439/203307 [27:46:59<203:20:34,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24439/203307 [27:46:59<203:20:34,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24440/203307 [27:47:03<203:20:31,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24440/203307 [27:47:03<203:20:31,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24441/203307 [27:47:06<203:20:24,  0.24it/s, v_num=t5e6, training/loss=0.0805]Epoch 0:  12%|█▏        | 24441/203307 [27:47:06<203:20:24,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24442/203307 [27:47:11<203:20:22,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24442/203307 [27:47:11<203:20:22,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24443/203307 [27:47:15<203:20:20,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24443/203307 [27:47:15<203:20:20,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24444/203307 [27:47:19<203:20:13,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24444/203307 [27:47:19<203:20:13,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24445/203307 [27:47:23<203:20:11,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24445/203307 [27:47:23<203:20:11,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24446/203307 [27:47:27<203:20:04,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24446/203307 [27:47:27<203:20:04,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24447/203307 [27:47:31<203:20:00,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24447/203307 [27:47:31<203:20:01,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24448/203307 [27:47:36<203:19:59,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24448/203307 [27:47:36<203:19:59,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24449/203307 [27:47:40<203:19:55,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24449/203307 [27:47:40<203:19:55,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24450/203307 [27:47:43<203:19:48,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24450/203307 [27:47:43<203:19:48,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24451/203307 [27:47:48<203:19:45,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24451/203307 [27:47:48<203:19:45,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24452/203307 [27:47:51<203:19:37,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24452/203307 [27:47:51<203:19:37,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24453/203307 [27:47:55<203:19:30,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24453/203307 [27:47:55<203:19:30,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24454/203307 [27:47:59<203:19:29,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24454/203307 [27:47:59<203:19:29,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24455/203307 [27:48:03<203:19:21,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24455/203307 [27:48:03<203:19:21,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24456/203307 [27:48:07<203:19:17,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24456/203307 [27:48:07<203:19:17,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24457/203307 [27:48:11<203:19:15,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24457/203307 [27:48:11<203:19:15,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24458/203307 [27:48:15<203:19:08,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24458/203307 [27:48:15<203:19:08,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24459/203307 [27:48:19<203:19:00,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24459/203307 [27:48:19<203:19:00,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24460/203307 [27:48:23<203:18:58,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24460/203307 [27:48:23<203:18:58,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24461/203307 [27:48:27<203:18:52,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24461/203307 [27:48:27<203:18:52,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24462/203307 [27:48:31<203:18:45,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24462/203307 [27:48:31<203:18:45,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24463/203307 [27:48:35<203:18:44,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24463/203307 [27:48:35<203:18:44,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24464/203307 [27:48:39<203:18:38,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24464/203307 [27:48:39<203:18:38,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24465/203307 [27:48:43<203:18:37,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24465/203307 [27:48:43<203:18:37,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24466/203307 [27:48:48<203:18:34,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24466/203307 [27:48:48<203:18:34,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24467/203307 [27:48:51<203:18:27,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24467/203307 [27:48:51<203:18:27,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24468/203307 [27:48:56<203:18:25,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24468/203307 [27:48:56<203:18:25,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24469/203307 [27:49:00<203:18:23,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24469/203307 [27:49:00<203:18:23,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24470/203307 [27:49:04<203:18:16,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24470/203307 [27:49:04<203:18:16,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24471/203307 [27:49:08<203:18:14,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24471/203307 [27:49:08<203:18:14,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24472/203307 [27:49:12<203:18:08,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24472/203307 [27:49:12<203:18:08,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24473/203307 [27:49:16<203:18:02,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24473/203307 [27:49:16<203:18:02,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24474/203307 [27:49:20<203:18:01,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24474/203307 [27:49:20<203:18:01,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24475/203307 [27:49:25<203:17:59,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24475/203307 [27:49:25<203:17:59,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24476/203307 [27:49:29<203:17:53,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24476/203307 [27:49:29<203:17:53,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24477/203307 [27:49:33<203:17:50,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24477/203307 [27:49:33<203:17:50,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24478/203307 [27:49:37<203:17:44,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24478/203307 [27:49:37<203:17:44,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24479/203307 [27:49:40<203:17:38,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24479/203307 [27:49:40<203:17:38,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24480/203307 [27:49:45<203:17:36,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24480/203307 [27:49:45<203:17:36,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24481/203307 [27:49:49<203:17:29,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24481/203307 [27:49:49<203:17:29,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24482/203307 [27:49:52<203:17:22,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24482/203307 [27:49:52<203:17:22,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24483/203307 [27:49:57<203:17:21,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24483/203307 [27:49:57<203:17:21,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24484/203307 [27:50:01<203:17:14,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24484/203307 [27:50:01<203:17:14,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24485/203307 [27:50:04<203:17:08,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24485/203307 [27:50:04<203:17:08,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24486/203307 [27:50:09<203:17:06,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24486/203307 [27:50:09<203:17:06,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24487/203307 [27:50:12<203:16:59,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24487/203307 [27:50:12<203:16:59,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24488/203307 [27:50:16<203:16:52,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24488/203307 [27:50:16<203:16:52,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24489/203307 [27:50:21<203:16:51,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24489/203307 [27:50:21<203:16:51,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24490/203307 [27:50:24<203:16:44,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24490/203307 [27:50:24<203:16:44,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24491/203307 [27:50:29<203:16:42,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24491/203307 [27:50:29<203:16:42,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24492/203307 [27:50:33<203:16:40,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24492/203307 [27:50:33<203:16:40,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24493/203307 [27:50:37<203:16:33,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24493/203307 [27:50:37<203:16:33,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24494/203307 [27:50:41<203:16:30,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24494/203307 [27:50:41<203:16:30,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24495/203307 [27:50:45<203:16:27,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24495/203307 [27:50:45<203:16:27,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24496/203307 [27:50:49<203:16:20,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24496/203307 [27:50:49<203:16:20,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24497/203307 [27:50:53<203:16:18,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24497/203307 [27:50:53<203:16:18,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24498/203307 [27:50:57<203:16:12,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24498/203307 [27:50:57<203:16:12,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24499/203307 [27:51:01<203:16:05,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24499/203307 [27:51:01<203:16:05,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24500/203307 [27:51:05<203:16:03,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24500/203307 [27:51:05<203:16:03,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24501/203307 [27:51:09<203:16:00,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  12%|█▏        | 24501/203307 [27:51:09<203:16:00,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24502/203307 [27:51:13<203:15:54,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24502/203307 [27:51:13<203:15:54,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24503/203307 [27:51:18<203:15:52,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24503/203307 [27:51:18<203:15:52,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24504/203307 [27:51:21<203:15:46,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24504/203307 [27:51:21<203:15:46,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24505/203307 [27:51:25<203:15:39,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24505/203307 [27:51:25<203:15:39,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24506/203307 [27:51:30<203:15:39,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24506/203307 [27:51:30<203:15:39,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24507/203307 [27:51:34<203:15:32,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24507/203307 [27:51:34<203:15:32,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24508/203307 [27:51:37<203:15:26,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24508/203307 [27:51:37<203:15:26,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24509/203307 [27:51:42<203:15:25,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24509/203307 [27:51:42<203:15:25,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24510/203307 [27:51:46<203:15:22,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24510/203307 [27:51:46<203:15:22,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24511/203307 [27:51:50<203:15:15,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24511/203307 [27:51:50<203:15:15,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24512/203307 [27:51:54<203:15:13,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24512/203307 [27:51:54<203:15:13,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24513/203307 [27:51:58<203:15:07,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24513/203307 [27:51:58<203:15:07,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24514/203307 [27:52:02<203:15:00,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24514/203307 [27:52:02<203:15:00,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24515/203307 [27:52:06<203:14:59,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24515/203307 [27:52:06<203:14:59,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24516/203307 [27:52:10<203:14:52,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24516/203307 [27:52:10<203:14:52,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24517/203307 [27:52:14<203:14:50,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24517/203307 [27:52:14<203:14:50,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24518/203307 [27:52:19<203:14:49,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24518/203307 [27:52:19<203:14:49,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24519/203307 [27:52:23<203:14:46,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24519/203307 [27:52:23<203:14:46,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24520/203307 [27:52:27<203:14:44,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24520/203307 [27:52:27<203:14:44,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24521/203307 [27:52:32<203:14:42,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  12%|█▏        | 24521/203307 [27:52:32<203:14:42,  0.24it/s, v_num=t5e6, training/loss=0.086] Epoch 0:  12%|█▏        | 24522/203307 [27:52:36<203:14:35,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24522/203307 [27:52:36<203:14:35,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24523/203307 [27:52:40<203:14:34,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24523/203307 [27:52:40<203:14:34,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24524/203307 [27:52:44<203:14:27,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24524/203307 [27:52:44<203:14:27,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24525/203307 [27:52:47<203:14:20,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24525/203307 [27:52:47<203:14:20,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24526/203307 [27:52:52<203:14:19,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24526/203307 [27:52:52<203:14:19,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24527/203307 [27:52:56<203:14:16,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24527/203307 [27:52:56<203:14:16,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24528/203307 [27:53:00<203:14:13,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24528/203307 [27:53:00<203:14:13,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24529/203307 [27:53:05<203:14:11,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24529/203307 [27:53:05<203:14:11,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24530/203307 [27:53:09<203:14:05,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24530/203307 [27:53:09<203:14:05,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24531/203307 [27:53:12<203:13:59,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24531/203307 [27:53:12<203:13:59,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24532/203307 [27:53:17<203:13:58,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24532/203307 [27:53:17<203:13:58,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24533/203307 [27:53:21<203:13:51,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24533/203307 [27:53:21<203:13:51,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24534/203307 [27:53:24<203:13:44,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24534/203307 [27:53:24<203:13:44,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24535/203307 [27:53:29<203:13:42,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24535/203307 [27:53:29<203:13:42,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24536/203307 [27:53:32<203:13:35,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24536/203307 [27:53:32<203:13:35,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24537/203307 [27:53:37<203:13:32,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24537/203307 [27:53:37<203:13:32,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24538/203307 [27:53:41<203:13:29,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24538/203307 [27:53:41<203:13:29,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24539/203307 [27:53:45<203:13:22,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24539/203307 [27:53:45<203:13:22,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24540/203307 [27:53:48<203:13:14,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24540/203307 [27:53:48<203:13:14,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24541/203307 [27:53:53<203:13:13,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  12%|█▏        | 24541/203307 [27:53:53<203:13:13,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24542/203307 [27:53:56<203:13:06,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24542/203307 [27:53:56<203:13:06,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24543/203307 [27:54:01<203:13:03,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24543/203307 [27:54:01<203:13:03,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24544/203307 [27:54:05<203:13:00,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24544/203307 [27:54:05<203:13:00,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24545/203307 [27:54:09<203:12:53,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24545/203307 [27:54:09<203:12:53,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24546/203307 [27:54:13<203:12:50,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24546/203307 [27:54:13<203:12:50,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24547/203307 [27:54:17<203:12:48,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24547/203307 [27:54:17<203:12:48,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24548/203307 [27:54:21<203:12:42,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24548/203307 [27:54:21<203:12:42,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24549/203307 [27:54:25<203:12:40,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24549/203307 [27:54:25<203:12:40,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24550/203307 [27:54:29<203:12:34,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24550/203307 [27:54:29<203:12:34,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24551/203307 [27:54:33<203:12:27,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24551/203307 [27:54:33<203:12:27,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24552/203307 [27:54:37<203:12:26,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24552/203307 [27:54:37<203:12:26,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24553/203307 [27:54:42<203:12:23,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24553/203307 [27:54:42<203:12:23,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24554/203307 [27:54:45<203:12:16,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24554/203307 [27:54:45<203:12:16,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24555/203307 [27:54:50<203:12:14,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24555/203307 [27:54:50<203:12:15,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24556/203307 [27:54:54<203:12:08,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24556/203307 [27:54:54<203:12:08,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24557/203307 [27:54:57<203:12:02,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24557/203307 [27:54:57<203:12:02,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24558/203307 [27:55:02<203:12:01,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24558/203307 [27:55:02<203:12:01,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24559/203307 [27:55:06<203:11:54,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24559/203307 [27:55:06<203:11:54,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24560/203307 [27:55:09<203:11:47,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24560/203307 [27:55:09<203:11:47,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24561/203307 [27:55:14<203:11:45,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24561/203307 [27:55:14<203:11:46,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24562/203307 [27:55:18<203:11:39,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24562/203307 [27:55:18<203:11:39,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24563/203307 [27:55:21<203:11:33,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24563/203307 [27:55:21<203:11:33,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24564/203307 [27:55:26<203:11:31,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24564/203307 [27:55:26<203:11:31,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24565/203307 [27:55:29<203:11:24,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24565/203307 [27:55:29<203:11:24,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24566/203307 [27:55:33<203:11:18,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24566/203307 [27:55:33<203:11:18,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24567/203307 [27:55:38<203:11:18,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24567/203307 [27:55:38<203:11:18,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24568/203307 [27:55:42<203:11:11,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24568/203307 [27:55:42<203:11:11,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24569/203307 [27:55:46<203:11:10,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24569/203307 [27:55:46<203:11:10,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24570/203307 [27:55:50<203:11:07,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24570/203307 [27:55:50<203:11:07,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24571/203307 [27:55:54<203:11:00,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24571/203307 [27:55:54<203:11:00,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24572/203307 [27:55:58<203:10:58,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24572/203307 [27:55:58<203:10:58,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24573/203307 [27:56:03<203:10:56,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24573/203307 [27:56:03<203:10:56,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24574/203307 [27:56:07<203:10:49,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24574/203307 [27:56:07<203:10:49,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24575/203307 [27:56:11<203:10:48,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24575/203307 [27:56:11<203:10:48,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24576/203307 [27:56:15<203:10:41,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24576/203307 [27:56:15<203:10:41,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24577/203307 [27:56:18<203:10:34,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24577/203307 [27:56:18<203:10:34,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24578/203307 [27:56:23<203:10:32,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24578/203307 [27:56:23<203:10:32,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24579/203307 [27:56:27<203:10:29,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24579/203307 [27:56:27<203:10:29,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24580/203307 [27:56:31<203:10:22,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24580/203307 [27:56:31<203:10:22,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24581/203307 [27:56:35<203:10:19,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24581/203307 [27:56:35<203:10:19,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24582/203307 [27:56:39<203:10:16,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24582/203307 [27:56:39<203:10:16,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24583/203307 [27:56:43<203:10:09,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24583/203307 [27:56:43<203:10:09,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24584/203307 [27:56:47<203:10:07,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24584/203307 [27:56:47<203:10:07,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24585/203307 [27:56:51<203:10:00,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24585/203307 [27:56:51<203:10:00,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24586/203307 [27:56:55<203:09:53,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24586/203307 [27:56:55<203:09:53,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24587/203307 [27:56:59<203:09:51,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24587/203307 [27:56:59<203:09:51,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24588/203307 [27:57:03<203:09:44,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24588/203307 [27:57:03<203:09:44,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24589/203307 [27:57:06<203:09:37,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24589/203307 [27:57:06<203:09:37,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24590/203307 [27:57:11<203:09:34,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24590/203307 [27:57:11<203:09:34,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24591/203307 [27:57:15<203:09:31,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24591/203307 [27:57:15<203:09:31,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24592/203307 [27:57:19<203:09:24,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24592/203307 [27:57:19<203:09:24,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24593/203307 [27:57:23<203:09:24,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24593/203307 [27:57:23<203:09:24,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24594/203307 [27:57:27<203:09:17,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24594/203307 [27:57:27<203:09:17,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24595/203307 [27:57:31<203:09:15,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24595/203307 [27:57:31<203:09:15,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24596/203307 [27:57:36<203:09:12,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24596/203307 [27:57:36<203:09:12,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24597/203307 [27:57:39<203:09:05,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24597/203307 [27:57:39<203:09:05,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24598/203307 [27:57:44<203:09:03,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24598/203307 [27:57:44<203:09:03,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24599/203307 [27:57:48<203:09:00,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24599/203307 [27:57:48<203:09:00,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24600/203307 [27:57:52<203:08:57,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24600/203307 [27:57:52<203:08:57,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24601/203307 [27:57:56<203:08:54,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  12%|█▏        | 24601/203307 [27:57:56<203:08:54,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24602/203307 [27:58:00<203:08:47,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24602/203307 [27:58:00<203:08:48,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24603/203307 [27:58:04<203:08:40,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24603/203307 [27:58:04<203:08:41,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24604/203307 [27:58:08<203:08:39,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24604/203307 [27:58:08<203:08:39,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24605/203307 [27:58:12<203:08:36,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24605/203307 [27:58:12<203:08:36,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24606/203307 [27:58:16<203:08:29,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24606/203307 [27:58:16<203:08:29,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24607/203307 [27:58:21<203:08:27,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24607/203307 [27:58:21<203:08:27,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24608/203307 [27:58:24<203:08:21,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24608/203307 [27:58:24<203:08:21,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24609/203307 [27:58:29<203:08:17,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24609/203307 [27:58:29<203:08:17,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24610/203307 [27:58:33<203:08:15,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24610/203307 [27:58:33<203:08:15,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24611/203307 [27:58:37<203:08:08,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24611/203307 [27:58:37<203:08:08,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24612/203307 [27:58:40<203:08:00,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24612/203307 [27:58:40<203:08:01,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24613/203307 [27:58:45<203:07:59,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24613/203307 [27:58:45<203:07:59,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24614/203307 [27:58:48<203:07:52,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24614/203307 [27:58:48<203:07:52,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24615/203307 [27:58:52<203:07:46,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24615/203307 [27:58:52<203:07:46,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24616/203307 [27:58:56<203:07:43,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24616/203307 [27:58:56<203:07:43,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24617/203307 [27:59:00<203:07:36,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24617/203307 [27:59:00<203:07:36,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24618/203307 [27:59:04<203:07:33,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24618/203307 [27:59:04<203:07:33,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24619/203307 [27:59:09<203:07:31,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24619/203307 [27:59:09<203:07:31,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24620/203307 [27:59:12<203:07:24,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24620/203307 [27:59:12<203:07:24,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24621/203307 [27:59:17<203:07:22,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  12%|█▏        | 24621/203307 [27:59:17<203:07:22,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24622/203307 [27:59:21<203:07:20,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24622/203307 [27:59:21<203:07:20,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24623/203307 [27:59:25<203:07:14,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24623/203307 [27:59:25<203:07:14,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24624/203307 [27:59:29<203:07:13,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24624/203307 [27:59:29<203:07:13,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24625/203307 [27:59:34<203:07:11,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24625/203307 [27:59:34<203:07:11,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24626/203307 [27:59:38<203:07:04,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24626/203307 [27:59:38<203:07:04,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24627/203307 [27:59:42<203:07:03,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24627/203307 [27:59:42<203:07:03,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24628/203307 [27:59:46<203:06:56,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24628/203307 [27:59:46<203:06:56,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24629/203307 [27:59:49<203:06:49,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24629/203307 [27:59:49<203:06:49,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24630/203307 [27:59:54<203:06:48,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24630/203307 [27:59:54<203:06:48,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24631/203307 [27:59:58<203:06:45,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24631/203307 [27:59:58<203:06:45,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24632/203307 [28:00:02<203:06:39,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24632/203307 [28:00:02<203:06:39,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24633/203307 [28:00:06<203:06:37,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24633/203307 [28:00:06<203:06:37,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24634/203307 [28:00:10<203:06:30,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24634/203307 [28:00:10<203:06:30,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24635/203307 [28:00:14<203:06:24,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24635/203307 [28:00:14<203:06:24,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24636/203307 [28:00:19<203:06:23,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24636/203307 [28:00:19<203:06:23,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24637/203307 [28:00:22<203:06:17,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24637/203307 [28:00:22<203:06:17,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24638/203307 [28:00:26<203:06:10,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24638/203307 [28:00:26<203:06:10,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24639/203307 [28:00:31<203:06:09,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24639/203307 [28:00:31<203:06:09,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24640/203307 [28:00:34<203:06:02,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24640/203307 [28:00:34<203:06:02,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24641/203307 [28:00:38<203:05:56,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24641/203307 [28:00:38<203:05:56,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24642/203307 [28:00:42<203:05:54,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24642/203307 [28:00:42<203:05:54,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24643/203307 [28:00:46<203:05:47,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24643/203307 [28:00:46<203:05:47,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24644/203307 [28:00:50<203:05:40,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24644/203307 [28:00:50<203:05:40,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24645/203307 [28:00:55<203:05:40,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24645/203307 [28:00:55<203:05:40,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24646/203307 [28:00:58<203:05:33,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24646/203307 [28:00:58<203:05:34,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24647/203307 [28:01:03<203:05:32,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24647/203307 [28:01:03<203:05:32,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24648/203307 [28:01:07<203:05:30,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24648/203307 [28:01:07<203:05:30,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24649/203307 [28:01:11<203:05:23,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24649/203307 [28:01:11<203:05:23,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24650/203307 [28:01:15<203:05:21,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24650/203307 [28:01:15<203:05:21,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24651/203307 [28:01:19<203:05:18,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24651/203307 [28:01:19<203:05:18,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24652/203307 [28:01:23<203:05:11,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24652/203307 [28:01:23<203:05:11,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24653/203307 [28:01:28<203:05:09,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24653/203307 [28:01:28<203:05:09,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24654/203307 [28:01:32<203:05:06,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24654/203307 [28:01:32<203:05:06,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24655/203307 [28:01:35<203:04:59,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24655/203307 [28:01:35<203:04:59,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24656/203307 [28:01:40<203:04:57,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24656/203307 [28:01:40<203:04:57,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24657/203307 [28:01:44<203:04:54,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24657/203307 [28:01:44<203:04:54,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24658/203307 [28:01:48<203:04:47,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24658/203307 [28:01:48<203:04:47,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24659/203307 [28:01:52<203:04:44,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24659/203307 [28:01:52<203:04:44,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24660/203307 [28:01:56<203:04:36,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24660/203307 [28:01:56<203:04:36,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24661/203307 [28:01:59<203:04:29,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24661/203307 [28:01:59<203:04:29,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24662/203307 [28:02:04<203:04:28,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24662/203307 [28:02:04<203:04:28,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24663/203307 [28:02:08<203:04:25,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24663/203307 [28:02:08<203:04:25,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24664/203307 [28:02:12<203:04:18,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24664/203307 [28:02:12<203:04:18,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24665/203307 [28:02:16<203:04:16,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24665/203307 [28:02:16<203:04:16,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24666/203307 [28:02:20<203:04:10,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24666/203307 [28:02:20<203:04:10,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24667/203307 [28:02:24<203:04:03,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24667/203307 [28:02:24<203:04:03,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24668/203307 [28:02:28<203:04:02,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24668/203307 [28:02:28<203:04:02,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24669/203307 [28:02:32<203:03:55,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24669/203307 [28:02:32<203:03:55,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24670/203307 [28:02:35<203:03:48,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24670/203307 [28:02:35<203:03:48,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24671/203307 [28:02:40<203:03:48,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24671/203307 [28:02:40<203:03:48,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24672/203307 [28:02:44<203:03:44,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24672/203307 [28:02:44<203:03:44,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24673/203307 [28:02:49<203:03:42,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24673/203307 [28:02:49<203:03:42,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24674/203307 [28:02:53<203:03:39,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24674/203307 [28:02:53<203:03:39,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24675/203307 [28:02:57<203:03:32,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24675/203307 [28:02:57<203:03:32,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24676/203307 [28:03:01<203:03:30,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24676/203307 [28:03:01<203:03:30,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24677/203307 [28:03:05<203:03:28,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24677/203307 [28:03:05<203:03:28,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24678/203307 [28:03:09<203:03:22,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24678/203307 [28:03:09<203:03:22,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24679/203307 [28:03:14<203:03:20,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24679/203307 [28:03:14<203:03:20,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24680/203307 [28:03:17<203:03:13,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24680/203307 [28:03:17<203:03:13,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24681/203307 [28:03:21<203:03:10,  0.24it/s, v_num=t5e6, training/loss=0.0917]Epoch 0:  12%|█▏        | 24681/203307 [28:03:21<203:03:10,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24682/203307 [28:03:26<203:03:09,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24682/203307 [28:03:26<203:03:09,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24683/203307 [28:03:30<203:03:05,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24683/203307 [28:03:30<203:03:05,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24684/203307 [28:03:34<203:02:59,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24684/203307 [28:03:34<203:02:59,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24685/203307 [28:03:38<203:02:57,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24685/203307 [28:03:38<203:02:57,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24686/203307 [28:03:42<203:02:51,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24686/203307 [28:03:42<203:02:51,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24687/203307 [28:03:46<203:02:44,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24687/203307 [28:03:46<203:02:44,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24688/203307 [28:03:50<203:02:43,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24688/203307 [28:03:50<203:02:43,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24689/203307 [28:03:54<203:02:37,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24689/203307 [28:03:54<203:02:37,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24690/203307 [28:03:58<203:02:33,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24690/203307 [28:03:58<203:02:33,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24691/203307 [28:04:03<203:02:32,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24691/203307 [28:04:03<203:02:32,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24692/203307 [28:04:07<203:02:26,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24692/203307 [28:04:07<203:02:26,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24693/203307 [28:04:10<203:02:19,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24693/203307 [28:04:10<203:02:19,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24694/203307 [28:04:15<203:02:17,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24694/203307 [28:04:15<203:02:17,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24695/203307 [28:04:19<203:02:11,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24695/203307 [28:04:19<203:02:11,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24696/203307 [28:04:22<203:02:05,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24696/203307 [28:04:22<203:02:05,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24697/203307 [28:04:27<203:02:04,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24697/203307 [28:04:27<203:02:04,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24698/203307 [28:04:31<203:01:57,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24698/203307 [28:04:31<203:01:57,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24699/203307 [28:04:35<203:01:55,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24699/203307 [28:04:35<203:01:55,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24700/203307 [28:04:39<203:01:54,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24700/203307 [28:04:39<203:01:54,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24701/203307 [28:04:43<203:01:46,  0.24it/s, v_num=t5e6, training/loss=0.0849]Epoch 0:  12%|█▏        | 24701/203307 [28:04:43<203:01:46,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24702/203307 [28:04:47<203:01:44,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24702/203307 [28:04:47<203:01:44,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24703/203307 [28:04:52<203:01:41,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24703/203307 [28:04:52<203:01:41,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24704/203307 [28:04:55<203:01:34,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24704/203307 [28:04:55<203:01:34,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24705/203307 [28:05:00<203:01:32,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24705/203307 [28:05:00<203:01:32,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24706/203307 [28:05:03<203:01:25,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24706/203307 [28:05:03<203:01:25,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24707/203307 [28:05:07<203:01:18,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24707/203307 [28:05:07<203:01:18,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24708/203307 [28:05:12<203:01:16,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24708/203307 [28:05:12<203:01:16,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24709/203307 [28:05:16<203:01:13,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24709/203307 [28:05:16<203:01:13,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24710/203307 [28:05:19<203:01:06,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24710/203307 [28:05:19<203:01:06,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24711/203307 [28:05:24<203:01:04,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24711/203307 [28:05:24<203:01:04,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24712/203307 [28:05:27<203:00:57,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24712/203307 [28:05:27<203:00:57,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24713/203307 [28:05:31<203:00:50,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24713/203307 [28:05:31<203:00:50,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24714/203307 [28:05:36<203:00:49,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24714/203307 [28:05:36<203:00:49,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24715/203307 [28:05:39<203:00:42,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24715/203307 [28:05:39<203:00:42,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24716/203307 [28:05:43<203:00:34,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24716/203307 [28:05:43<203:00:34,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24717/203307 [28:05:48<203:00:33,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24717/203307 [28:05:48<203:00:33,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24718/203307 [28:05:51<203:00:27,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24718/203307 [28:05:51<203:00:27,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24719/203307 [28:05:55<203:00:19,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24719/203307 [28:05:55<203:00:19,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24720/203307 [28:05:59<203:00:17,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24720/203307 [28:05:59<203:00:17,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24721/203307 [28:06:03<203:00:10,  0.24it/s, v_num=t5e6, training/loss=0.0921]Epoch 0:  12%|█▏        | 24721/203307 [28:06:03<203:00:10,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24722/203307 [28:06:07<203:00:03,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24722/203307 [28:06:07<203:00:03,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24723/203307 [28:06:11<203:00:02,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24723/203307 [28:06:11<203:00:02,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24724/203307 [28:06:15<202:59:54,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24724/203307 [28:06:15<202:59:54,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24725/203307 [28:06:19<202:59:53,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24725/203307 [28:06:19<202:59:53,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24726/203307 [28:06:24<202:59:51,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24726/203307 [28:06:24<202:59:51,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24727/203307 [28:06:27<202:59:44,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24727/203307 [28:06:27<202:59:44,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24728/203307 [28:06:32<202:59:42,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24728/203307 [28:06:32<202:59:42,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24729/203307 [28:06:36<202:59:39,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24729/203307 [28:06:36<202:59:39,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24730/203307 [28:06:40<202:59:32,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24730/203307 [28:06:40<202:59:32,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24731/203307 [28:06:44<202:59:30,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24731/203307 [28:06:44<202:59:31,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24732/203307 [28:06:48<202:59:26,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24732/203307 [28:06:48<202:59:26,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24733/203307 [28:06:52<202:59:19,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24733/203307 [28:06:52<202:59:19,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24734/203307 [28:06:56<202:59:18,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24734/203307 [28:06:56<202:59:18,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24735/203307 [28:07:00<202:59:15,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24735/203307 [28:07:01<202:59:15,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24736/203307 [28:07:04<202:59:08,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24736/203307 [28:07:04<202:59:08,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24737/203307 [28:07:08<202:59:05,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24737/203307 [28:07:08<202:59:05,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24738/203307 [28:07:12<202:58:58,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24738/203307 [28:07:12<202:58:58,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24739/203307 [28:07:16<202:58:51,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24739/203307 [28:07:16<202:58:51,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24740/203307 [28:07:20<202:58:50,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24740/203307 [28:07:20<202:58:50,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24741/203307 [28:07:24<202:58:43,  0.24it/s, v_num=t5e6, training/loss=0.0874]Epoch 0:  12%|█▏        | 24741/203307 [28:07:24<202:58:43,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24742/203307 [28:07:28<202:58:35,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24742/203307 [28:07:28<202:58:35,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24743/203307 [28:07:32<202:58:34,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24743/203307 [28:07:32<202:58:34,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24744/203307 [28:07:36<202:58:31,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24744/203307 [28:07:36<202:58:31,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24745/203307 [28:07:40<202:58:24,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24745/203307 [28:07:40<202:58:24,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24746/203307 [28:07:44<202:58:22,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24746/203307 [28:07:44<202:58:22,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24747/203307 [28:07:48<202:58:15,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24747/203307 [28:07:48<202:58:15,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24748/203307 [28:07:52<202:58:08,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24748/203307 [28:07:52<202:58:08,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24749/203307 [28:07:56<202:58:07,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24749/203307 [28:07:56<202:58:07,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24750/203307 [28:08:00<202:57:59,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24750/203307 [28:08:00<202:57:59,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24751/203307 [28:08:04<202:57:57,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24751/203307 [28:08:04<202:57:57,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24752/203307 [28:08:09<202:57:55,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24752/203307 [28:08:09<202:57:55,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24753/203307 [28:08:13<202:57:52,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24753/203307 [28:08:13<202:57:52,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24754/203307 [28:08:17<202:57:49,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24754/203307 [28:08:17<202:57:49,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24755/203307 [28:08:21<202:57:46,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24755/203307 [28:08:21<202:57:46,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24756/203307 [28:08:25<202:57:39,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24756/203307 [28:08:25<202:57:39,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24757/203307 [28:08:29<202:57:37,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24757/203307 [28:08:29<202:57:37,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24758/203307 [28:08:33<202:57:31,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24758/203307 [28:08:33<202:57:31,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24759/203307 [28:08:37<202:57:24,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24759/203307 [28:08:37<202:57:24,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24760/203307 [28:08:41<202:57:22,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24760/203307 [28:08:41<202:57:22,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24761/203307 [28:08:46<202:57:20,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  12%|█▏        | 24761/203307 [28:08:46<202:57:20,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24762/203307 [28:08:50<202:57:17,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24762/203307 [28:08:50<202:57:17,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24763/203307 [28:08:54<202:57:14,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24763/203307 [28:08:54<202:57:14,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24764/203307 [28:08:58<202:57:08,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24764/203307 [28:08:58<202:57:08,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24765/203307 [28:09:02<202:57:01,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24765/203307 [28:09:02<202:57:01,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24766/203307 [28:09:06<202:57:00,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24766/203307 [28:09:06<202:57:00,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24767/203307 [28:09:10<202:56:54,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24767/203307 [28:09:10<202:56:54,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24768/203307 [28:09:14<202:56:47,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24768/203307 [28:09:14<202:56:47,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24769/203307 [28:09:18<202:56:46,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24769/203307 [28:09:18<202:56:46,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24770/203307 [28:09:22<202:56:39,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24770/203307 [28:09:22<202:56:39,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24771/203307 [28:09:26<202:56:37,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24771/203307 [28:09:26<202:56:37,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24772/203307 [28:09:31<202:56:34,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24772/203307 [28:09:31<202:56:34,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24773/203307 [28:09:34<202:56:27,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24773/203307 [28:09:34<202:56:27,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24774/203307 [28:09:38<202:56:20,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24774/203307 [28:09:38<202:56:20,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24775/203307 [28:09:43<202:56:20,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24775/203307 [28:09:43<202:56:20,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24776/203307 [28:09:46<202:56:13,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24776/203307 [28:09:46<202:56:13,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24777/203307 [28:09:51<202:56:11,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24777/203307 [28:09:51<202:56:11,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24778/203307 [28:09:55<202:56:08,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24778/203307 [28:09:55<202:56:08,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24779/203307 [28:09:59<202:56:02,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24779/203307 [28:09:59<202:56:02,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24780/203307 [28:10:03<202:55:59,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24780/203307 [28:10:03<202:55:59,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24781/203307 [28:10:07<202:55:57,  0.24it/s, v_num=t5e6, training/loss=0.0796]Epoch 0:  12%|█▏        | 24781/203307 [28:10:07<202:55:57,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24782/203307 [28:10:11<202:55:50,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24782/203307 [28:10:11<202:55:50,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24783/203307 [28:10:15<202:55:48,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24783/203307 [28:10:15<202:55:48,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24784/203307 [28:10:19<202:55:41,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24784/203307 [28:10:19<202:55:41,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24785/203307 [28:10:23<202:55:35,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24785/203307 [28:10:23<202:55:35,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24786/203307 [28:10:27<202:55:33,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24786/203307 [28:10:27<202:55:34,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24787/203307 [28:10:32<202:55:31,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24787/203307 [28:10:32<202:55:31,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24788/203307 [28:10:35<202:55:24,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24788/203307 [28:10:35<202:55:24,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24789/203307 [28:10:40<202:55:22,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24789/203307 [28:10:40<202:55:22,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24790/203307 [28:10:44<202:55:15,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24790/203307 [28:10:44<202:55:15,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24791/203307 [28:10:47<202:55:08,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24791/203307 [28:10:47<202:55:08,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24792/203307 [28:10:52<202:55:08,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24792/203307 [28:10:52<202:55:08,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24793/203307 [28:10:55<202:55:01,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24793/203307 [28:10:55<202:55:01,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24794/203307 [28:10:59<202:54:54,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24794/203307 [28:10:59<202:54:54,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24795/203307 [28:11:04<202:54:53,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24795/203307 [28:11:04<202:54:53,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24796/203307 [28:11:07<202:54:46,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24796/203307 [28:11:07<202:54:46,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24797/203307 [28:11:11<202:54:39,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24797/203307 [28:11:11<202:54:39,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24798/203307 [28:11:16<202:54:37,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24798/203307 [28:11:16<202:54:37,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24799/203307 [28:11:19<202:54:30,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24799/203307 [28:11:19<202:54:30,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24800/203307 [28:11:23<202:54:23,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24800/203307 [28:11:23<202:54:23,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24801/203307 [28:11:27<202:54:22,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  12%|█▏        | 24801/203307 [28:11:27<202:54:22,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24802/203307 [28:11:31<202:54:15,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24802/203307 [28:11:31<202:54:15,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24803/203307 [28:11:35<202:54:12,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24803/203307 [28:11:35<202:54:13,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24804/203307 [28:11:40<202:54:10,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24804/203307 [28:11:40<202:54:10,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24805/203307 [28:11:43<202:54:03,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24805/203307 [28:11:43<202:54:03,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24806/203307 [28:11:48<202:54:00,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24806/203307 [28:11:48<202:54:00,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24807/203307 [28:11:52<202:53:57,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24807/203307 [28:11:52<202:53:57,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24808/203307 [28:11:56<202:53:50,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24808/203307 [28:11:56<202:53:50,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24809/203307 [28:12:00<202:53:48,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24809/203307 [28:12:00<202:53:48,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24810/203307 [28:12:04<202:53:40,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24810/203307 [28:12:04<202:53:40,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24811/203307 [28:12:07<202:53:33,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24811/203307 [28:12:07<202:53:33,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24812/203307 [28:12:12<202:53:31,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24812/203307 [28:12:12<202:53:31,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24813/203307 [28:12:16<202:53:28,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24813/203307 [28:12:16<202:53:28,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24814/203307 [28:12:20<202:53:22,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24814/203307 [28:12:20<202:53:22,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24815/203307 [28:12:24<202:53:20,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24815/203307 [28:12:24<202:53:20,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24816/203307 [28:12:28<202:53:17,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24816/203307 [28:12:28<202:53:17,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24817/203307 [28:12:32<202:53:10,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24817/203307 [28:12:32<202:53:10,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24818/203307 [28:12:36<202:53:08,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24818/203307 [28:12:36<202:53:08,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24819/203307 [28:12:40<202:53:02,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24819/203307 [28:12:40<202:53:02,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24820/203307 [28:12:44<202:52:55,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24820/203307 [28:12:44<202:52:55,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24821/203307 [28:12:48<202:52:54,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  12%|█▏        | 24821/203307 [28:12:48<202:52:54,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24822/203307 [28:12:52<202:52:47,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24822/203307 [28:12:52<202:52:47,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24823/203307 [28:12:56<202:52:40,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24823/203307 [28:12:56<202:52:40,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24824/203307 [28:13:00<202:52:37,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24824/203307 [28:13:00<202:52:37,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24825/203307 [28:13:04<202:52:34,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24825/203307 [28:13:04<202:52:34,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24826/203307 [28:13:08<202:52:27,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24826/203307 [28:13:08<202:52:27,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24827/203307 [28:13:12<202:52:25,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24827/203307 [28:13:12<202:52:25,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24828/203307 [28:13:16<202:52:19,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24828/203307 [28:13:16<202:52:19,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24829/203307 [28:13:21<202:52:17,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24829/203307 [28:13:21<202:52:17,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24830/203307 [28:13:25<202:52:14,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24830/203307 [28:13:25<202:52:14,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24831/203307 [28:13:29<202:52:08,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24831/203307 [28:13:29<202:52:08,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24832/203307 [28:13:33<202:52:05,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24832/203307 [28:13:33<202:52:06,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24833/203307 [28:13:37<202:52:03,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24833/203307 [28:13:37<202:52:03,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24834/203307 [28:13:41<202:51:59,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24834/203307 [28:13:41<202:51:59,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24835/203307 [28:13:46<202:51:57,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24835/203307 [28:13:46<202:51:57,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24836/203307 [28:13:49<202:51:51,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24836/203307 [28:13:49<202:51:51,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24837/203307 [28:13:53<202:51:44,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24837/203307 [28:13:53<202:51:44,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24838/203307 [28:13:58<202:51:43,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24838/203307 [28:13:58<202:51:43,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24839/203307 [28:14:02<202:51:41,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24839/203307 [28:14:02<202:51:41,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24840/203307 [28:14:06<202:51:34,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24840/203307 [28:14:06<202:51:34,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24841/203307 [28:14:10<202:51:32,  0.24it/s, v_num=t5e6, training/loss=0.0862]Epoch 0:  12%|█▏        | 24841/203307 [28:14:10<202:51:32,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24842/203307 [28:14:14<202:51:26,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24842/203307 [28:14:14<202:51:26,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24843/203307 [28:14:18<202:51:22,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24843/203307 [28:14:18<202:51:23,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24844/203307 [28:14:23<202:51:21,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24844/203307 [28:14:23<202:51:21,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24845/203307 [28:14:27<202:51:15,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24845/203307 [28:14:27<202:51:15,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24846/203307 [28:14:30<202:51:08,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24846/203307 [28:14:30<202:51:08,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24847/203307 [28:14:35<202:51:07,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24847/203307 [28:14:35<202:51:07,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24848/203307 [28:14:38<202:51:01,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24848/203307 [28:14:38<202:51:01,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24849/203307 [28:14:42<202:50:54,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24849/203307 [28:14:42<202:50:54,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24850/203307 [28:14:47<202:50:52,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24850/203307 [28:14:47<202:50:52,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24851/203307 [28:14:50<202:50:45,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24851/203307 [28:14:50<202:50:45,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24852/203307 [28:14:55<202:50:42,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24852/203307 [28:14:55<202:50:42,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24853/203307 [28:14:59<202:50:41,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24853/203307 [28:14:59<202:50:41,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24854/203307 [28:15:03<202:50:34,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24854/203307 [28:15:03<202:50:34,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24855/203307 [28:15:07<202:50:32,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24855/203307 [28:15:07<202:50:32,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24856/203307 [28:15:11<202:50:29,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24856/203307 [28:15:11<202:50:29,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24857/203307 [28:15:15<202:50:22,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24857/203307 [28:15:15<202:50:22,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24858/203307 [28:15:19<202:50:20,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24858/203307 [28:15:19<202:50:20,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24859/203307 [28:15:24<202:50:18,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24859/203307 [28:15:24<202:50:18,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24860/203307 [28:15:28<202:50:12,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24860/203307 [28:15:28<202:50:12,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24861/203307 [28:15:32<202:50:10,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  12%|█▏        | 24861/203307 [28:15:32<202:50:10,  0.24it/s, v_num=t5e6, training/loss=0.079] Epoch 0:  12%|█▏        | 24862/203307 [28:15:36<202:50:03,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24862/203307 [28:15:36<202:50:03,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24863/203307 [28:15:39<202:49:56,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24863/203307 [28:15:39<202:49:56,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24864/203307 [28:15:44<202:49:55,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24864/203307 [28:15:44<202:49:55,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24865/203307 [28:15:48<202:49:52,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24865/203307 [28:15:48<202:49:52,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24866/203307 [28:15:52<202:49:45,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24866/203307 [28:15:52<202:49:45,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24867/203307 [28:15:56<202:49:42,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24867/203307 [28:15:56<202:49:42,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24868/203307 [28:16:00<202:49:36,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24868/203307 [28:16:00<202:49:36,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24869/203307 [28:16:04<202:49:29,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24869/203307 [28:16:04<202:49:29,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24870/203307 [28:16:08<202:49:28,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24870/203307 [28:16:08<202:49:28,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24871/203307 [28:16:12<202:49:21,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24871/203307 [28:16:12<202:49:21,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24872/203307 [28:16:16<202:49:14,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24872/203307 [28:16:16<202:49:14,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24873/203307 [28:16:20<202:49:13,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24873/203307 [28:16:20<202:49:13,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24874/203307 [28:16:24<202:49:06,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24874/203307 [28:16:24<202:49:06,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24875/203307 [28:16:27<202:48:59,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24875/203307 [28:16:27<202:48:59,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24876/203307 [28:16:32<202:48:57,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24876/203307 [28:16:32<202:48:57,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24877/203307 [28:16:35<202:48:49,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24877/203307 [28:16:35<202:48:50,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24878/203307 [28:16:39<202:48:42,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24878/203307 [28:16:39<202:48:42,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24879/203307 [28:16:44<202:48:41,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24879/203307 [28:16:44<202:48:41,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24880/203307 [28:16:47<202:48:34,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24880/203307 [28:16:47<202:48:34,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24881/203307 [28:16:52<202:48:33,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  12%|█▏        | 24881/203307 [28:16:52<202:48:33,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24882/203307 [28:16:56<202:48:30,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24882/203307 [28:16:56<202:48:30,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24883/203307 [28:17:00<202:48:23,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24883/203307 [28:17:00<202:48:23,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24884/203307 [28:17:04<202:48:21,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24884/203307 [28:17:04<202:48:21,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24885/203307 [28:17:08<202:48:18,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24885/203307 [28:17:08<202:48:18,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24886/203307 [28:17:12<202:48:11,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24886/203307 [28:17:12<202:48:11,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24887/203307 [28:17:16<202:48:09,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24887/203307 [28:17:16<202:48:09,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24888/203307 [28:17:21<202:48:07,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24888/203307 [28:17:21<202:48:07,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24889/203307 [28:17:24<202:48:00,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24889/203307 [28:17:24<202:48:00,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24890/203307 [28:17:29<202:47:58,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24890/203307 [28:17:29<202:47:58,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24891/203307 [28:17:33<202:47:55,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24891/203307 [28:17:33<202:47:55,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24892/203307 [28:17:37<202:47:48,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24892/203307 [28:17:37<202:47:48,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24893/203307 [28:17:41<202:47:45,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24893/203307 [28:17:41<202:47:45,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24894/203307 [28:17:45<202:47:38,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24894/203307 [28:17:45<202:47:38,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24895/203307 [28:17:48<202:47:31,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24895/203307 [28:17:48<202:47:31,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24896/203307 [28:17:53<202:47:30,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24896/203307 [28:17:53<202:47:30,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24897/203307 [28:17:57<202:47:27,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24897/203307 [28:17:57<202:47:27,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24898/203307 [28:18:01<202:47:20,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24898/203307 [28:18:01<202:47:20,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24899/203307 [28:18:05<202:47:19,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24899/203307 [28:18:05<202:47:19,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24900/203307 [28:18:09<202:47:12,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24900/203307 [28:18:09<202:47:12,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24901/203307 [28:18:13<202:47:05,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 24901/203307 [28:18:13<202:47:05,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24902/203307 [28:18:17<202:47:04,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24902/203307 [28:18:17<202:47:04,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24903/203307 [28:18:21<202:46:57,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24903/203307 [28:18:21<202:46:57,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24904/203307 [28:18:25<202:46:50,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24904/203307 [28:18:25<202:46:50,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24905/203307 [28:18:29<202:46:50,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24905/203307 [28:18:29<202:46:50,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24906/203307 [28:18:33<202:46:47,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24906/203307 [28:18:33<202:46:47,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24907/203307 [28:18:38<202:46:44,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24907/203307 [28:18:38<202:46:44,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24908/203307 [28:18:42<202:46:41,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24908/203307 [28:18:42<202:46:41,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24909/203307 [28:18:46<202:46:35,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24909/203307 [28:18:46<202:46:35,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24910/203307 [28:18:50<202:46:32,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24910/203307 [28:18:50<202:46:32,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24911/203307 [28:18:54<202:46:29,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24911/203307 [28:18:54<202:46:29,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24912/203307 [28:18:58<202:46:22,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24912/203307 [28:18:58<202:46:22,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24913/203307 [28:19:02<202:46:20,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24913/203307 [28:19:02<202:46:20,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24914/203307 [28:19:06<202:46:13,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24914/203307 [28:19:06<202:46:13,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24915/203307 [28:19:10<202:46:10,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24915/203307 [28:19:10<202:46:10,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24916/203307 [28:19:15<202:46:08,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24916/203307 [28:19:15<202:46:08,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24917/203307 [28:19:19<202:46:06,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24917/203307 [28:19:19<202:46:06,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24918/203307 [28:19:23<202:45:59,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24918/203307 [28:19:23<202:45:59,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24919/203307 [28:19:27<202:45:57,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24919/203307 [28:19:27<202:45:57,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24920/203307 [28:19:31<202:45:50,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24920/203307 [28:19:31<202:45:50,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24921/203307 [28:19:35<202:45:44,  0.24it/s, v_num=t5e6, training/loss=0.0795]Epoch 0:  12%|█▏        | 24921/203307 [28:19:35<202:45:44,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24922/203307 [28:19:39<202:45:43,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24922/203307 [28:19:39<202:45:43,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24923/203307 [28:19:43<202:45:35,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24923/203307 [28:19:43<202:45:35,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24924/203307 [28:19:47<202:45:32,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24924/203307 [28:19:47<202:45:32,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24925/203307 [28:19:51<202:45:31,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24925/203307 [28:19:51<202:45:31,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24926/203307 [28:19:55<202:45:24,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24926/203307 [28:19:55<202:45:24,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24927/203307 [28:19:59<202:45:17,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24927/203307 [28:19:59<202:45:17,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24928/203307 [28:20:03<202:45:15,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24928/203307 [28:20:03<202:45:15,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24929/203307 [28:20:07<202:45:08,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24929/203307 [28:20:07<202:45:08,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24930/203307 [28:20:11<202:45:01,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24930/203307 [28:20:11<202:45:01,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24931/203307 [28:20:15<202:45:00,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24931/203307 [28:20:15<202:45:00,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24932/203307 [28:20:19<202:44:53,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24932/203307 [28:20:19<202:44:53,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24933/203307 [28:20:23<202:44:52,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24933/203307 [28:20:23<202:44:52,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24934/203307 [28:20:28<202:44:49,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24934/203307 [28:20:28<202:44:49,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24935/203307 [28:20:31<202:44:42,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24935/203307 [28:20:31<202:44:42,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24936/203307 [28:20:36<202:44:40,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24936/203307 [28:20:36<202:44:40,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24937/203307 [28:20:40<202:44:38,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24937/203307 [28:20:40<202:44:38,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24938/203307 [28:20:44<202:44:31,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24938/203307 [28:20:44<202:44:31,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24939/203307 [28:20:48<202:44:30,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24939/203307 [28:20:48<202:44:30,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24940/203307 [28:20:52<202:44:23,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24940/203307 [28:20:52<202:44:23,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24941/203307 [28:20:56<202:44:16,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  12%|█▏        | 24941/203307 [28:20:56<202:44:16,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24942/203307 [28:21:00<202:44:15,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24942/203307 [28:21:00<202:44:15,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24943/203307 [28:21:04<202:44:12,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24943/203307 [28:21:04<202:44:12,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24944/203307 [28:21:08<202:44:06,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24944/203307 [28:21:08<202:44:06,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24945/203307 [28:21:13<202:44:03,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24945/203307 [28:21:13<202:44:03,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24946/203307 [28:21:16<202:43:58,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24946/203307 [28:21:16<202:43:58,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24947/203307 [28:21:20<202:43:52,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24947/203307 [28:21:20<202:43:52,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24948/203307 [28:21:25<202:43:51,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24948/203307 [28:21:25<202:43:51,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24949/203307 [28:21:29<202:43:45,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24949/203307 [28:21:29<202:43:45,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24950/203307 [28:21:32<202:43:39,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24950/203307 [28:21:32<202:43:39,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24951/203307 [28:21:37<202:43:38,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24951/203307 [28:21:37<202:43:38,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24952/203307 [28:21:41<202:43:32,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24952/203307 [28:21:41<202:43:32,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24953/203307 [28:21:45<202:43:26,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24953/203307 [28:21:45<202:43:26,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24954/203307 [28:21:49<202:43:24,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24954/203307 [28:21:49<202:43:24,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24955/203307 [28:21:53<202:43:18,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24955/203307 [28:21:53<202:43:18,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24956/203307 [28:21:57<202:43:11,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24956/203307 [28:21:57<202:43:11,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24957/203307 [28:22:01<202:43:10,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24957/203307 [28:22:01<202:43:10,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24958/203307 [28:22:05<202:43:04,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24958/203307 [28:22:05<202:43:04,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24959/203307 [28:22:09<202:43:02,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24959/203307 [28:22:09<202:43:02,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24960/203307 [28:22:14<202:42:59,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24960/203307 [28:22:14<202:42:59,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24961/203307 [28:22:17<202:42:53,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  12%|█▏        | 24961/203307 [28:22:17<202:42:53,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24962/203307 [28:22:22<202:42:51,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24962/203307 [28:22:22<202:42:51,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24963/203307 [28:22:26<202:42:48,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24963/203307 [28:22:26<202:42:48,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24964/203307 [28:22:30<202:42:41,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24964/203307 [28:22:30<202:42:41,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24965/203307 [28:22:34<202:42:40,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24965/203307 [28:22:34<202:42:40,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24966/203307 [28:22:38<202:42:33,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24966/203307 [28:22:38<202:42:33,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24967/203307 [28:22:42<202:42:26,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24967/203307 [28:22:42<202:42:26,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24968/203307 [28:22:46<202:42:25,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24968/203307 [28:22:46<202:42:25,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24969/203307 [28:22:50<202:42:22,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24969/203307 [28:22:50<202:42:22,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24970/203307 [28:22:54<202:42:15,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24970/203307 [28:22:54<202:42:15,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24971/203307 [28:22:58<202:42:13,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24971/203307 [28:22:58<202:42:13,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24972/203307 [28:23:02<202:42:06,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24972/203307 [28:23:02<202:42:06,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24973/203307 [28:23:06<202:41:59,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24973/203307 [28:23:06<202:41:59,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24974/203307 [28:23:10<202:41:58,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24974/203307 [28:23:10<202:41:58,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24975/203307 [28:23:14<202:41:51,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24975/203307 [28:23:14<202:41:51,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24976/203307 [28:23:18<202:41:45,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24976/203307 [28:23:18<202:41:45,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24977/203307 [28:23:22<202:41:45,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24977/203307 [28:23:22<202:41:45,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24978/203307 [28:23:27<202:41:42,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24978/203307 [28:23:27<202:41:42,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24979/203307 [28:23:30<202:41:35,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24979/203307 [28:23:30<202:41:35,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24980/203307 [28:23:35<202:41:33,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24980/203307 [28:23:35<202:41:33,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24981/203307 [28:23:39<202:41:27,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  12%|█▏        | 24981/203307 [28:23:39<202:41:27,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24982/203307 [28:23:42<202:41:20,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24982/203307 [28:23:42<202:41:20,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24983/203307 [28:23:47<202:41:19,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24983/203307 [28:23:47<202:41:19,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24984/203307 [28:23:51<202:41:12,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24984/203307 [28:23:51<202:41:12,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24985/203307 [28:23:55<202:41:10,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24985/203307 [28:23:55<202:41:10,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24986/203307 [28:23:59<202:41:08,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24986/203307 [28:23:59<202:41:08,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24987/203307 [28:24:03<202:41:05,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24987/203307 [28:24:03<202:41:05,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24988/203307 [28:24:08<202:41:02,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24988/203307 [28:24:08<202:41:02,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24989/203307 [28:24:12<202:40:59,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24989/203307 [28:24:12<202:40:59,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24990/203307 [28:24:16<202:40:52,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24990/203307 [28:24:16<202:40:52,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24991/203307 [28:24:20<202:40:50,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24991/203307 [28:24:20<202:40:50,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24992/203307 [28:24:24<202:40:44,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24992/203307 [28:24:24<202:40:44,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24993/203307 [28:24:28<202:40:37,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24993/203307 [28:24:28<202:40:38,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24994/203307 [28:24:32<202:40:36,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24994/203307 [28:24:32<202:40:36,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24995/203307 [28:24:36<202:40:33,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24995/203307 [28:24:36<202:40:33,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24996/203307 [28:24:41<202:40:29,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24996/203307 [28:24:41<202:40:29,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24997/203307 [28:24:45<202:40:27,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24997/203307 [28:24:45<202:40:27,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24998/203307 [28:24:49<202:40:21,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24998/203307 [28:24:49<202:40:21,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24999/203307 [28:24:52<202:40:15,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 24999/203307 [28:24:52<202:40:15,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 25000/203307 [28:24:57<202:40:14,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 25000/203307 [28:24:57<202:40:14,  0.24it/s, v_num=t5e6, training/loss=0.0892]
Validation: |          | 0/? [00:00<?, ?it/s][A
Validation:   0%|          | 0/1 [00:00<?, ?it/s][A


Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s][A[A

Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:26,  1.15it/s][A[A

Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:24,  1.16it/s][A[A

Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:23,  1.16it/s][A[A

Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:22,  1.16it/s][A[A

Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:22,  1.15it/s][A[A

Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:21,  1.15it/s][A[A

Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:20,  1.15it/s][A[A

Sampling (mamba memory):  54%|█████▍    | 108/200 [00:06<01:19,  1.16it/s][A[A

Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:18,  1.16it/s][A[A

Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:17,  1.16it/s][A[A

Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:26,  1.14it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:24,  1.15it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:24,  1.15it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:23,  1.15it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:22,  1.16it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:20,  1.16it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:20,  1.16it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:06<01:19,  1.16it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:18,  1.15it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:18,  1.15it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:17,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:27,  1.13it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:25,  1.14it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:25,  1.14it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:24,  1.14it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:23,  1.14it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:22,  1.15it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:21,  1.14it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:20,  1.14it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:19,  1.14it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:19,  1.14it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:18,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:28,  1.11it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:27,  1.13it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:26,  1.13it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:25,  1.13it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:23,  1.13it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:22,  1.13it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:22,  1.13it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:21,  1.13it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:20,  1.13it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:19,  1.13it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:19,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:28,  1.12it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:27,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:26,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:25,  1.12it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:24,  1.12it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:23,  1.12it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:23,  1.12it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:22,  1.11it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:21,  1.11it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:20,  1.11it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:19,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:28,  1.12it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:27,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:26,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:25,  1.12it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:24,  1.12it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:23,  1.12it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:23,  1.12it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:22,  1.12it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:21,  1.12it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:20,  1.12it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:19,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:27,  1.13it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:28,  1.10it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:27,  1.10it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:26,  1.11it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:25,  1.12it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:23,  1.12it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:23,  1.12it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:22,  1.11it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:22,  1.11it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:09<01:21,  1.10it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:21,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:31,  1.08it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:29,  1.10it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:28,  1.09it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:28,  1.08it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:27,  1.08it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:26,  1.08it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:26,  1.08it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:25,  1.08it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:24,  1.08it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:09<01:23,  1.08it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:10<01:22,  1.0Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:16,  1.16it/s][A[A

Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:15,  1.16it/s][A[A

Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:15,  1.16it/s][A[A

Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:14,  1.16it/s][A[A

Sampling (mamba memory):  57%|█████▊    | 115/200 [00:12<01:13,  1.16it/s][A[A

Sampling (mamba memory):  58%|█████▊    | 116/200 [00:13<01:12,  1.16it/s][A[A

Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:11,  1.16it/s][A[A

Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:11,  1.15it/s][A[A

Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:10,  1.15it/s][A[A

Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:09,  1.15it/s][A[A

Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:08,  1.15it/s][A[A

Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:07,  1.15it/s][A[A

4it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:17,  1.14it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:16,  1.14it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:15,  1.14it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:14,  1.13it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:13<01:14,  1.13it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:13,  1.13it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:12,  1.13it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:11,  1.13it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:10,  1.13it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:10,  1.13it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:09,  1.12it/s]Sampling (mamba memory):  62%|██████▏   | 123/3it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:17,  1.13it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:17,  1.13it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:16,  1.12it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:15,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:14,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:14,  1.12it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:13,  1.11it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:12,  1.11it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:11,  1.11it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:11,  1.11it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:10,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 123/2it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:19,  1.11it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:18,  1.11it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:17,  1.11it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:16,  1.10it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:16,  1.10it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:15,  1.10it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:14,  1.10it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:13,  1.11it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:12,  1.11it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:11,  1.11it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:10,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 123/2it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:18,  1.12it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:18,  1.11it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:17,  1.11it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:16,  1.11it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:15,  1.11it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:15,  1.10it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:14,  1.10it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:13,  1.10it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:12,  1.10it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:12,  1.09it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:11,  1.09it/s]Sampling (mamba memory):  62%|██████▏   | 123/Sampling (mamba memory):  62%|██████▏   | 123/200 [00:19<01:07,  1.15it/s][A[A

1it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:19,  1.11it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:18,  1.11it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:17,  1.11it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:16,  1.11it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:15,  1.11it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:15,  1.10it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:14,  1.10it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:13,  1.10it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:13,  1.09it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:12,  1.08it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:12,  1.08it/s]Sampling (mamba memory):  62%|██████▏   | 123/0it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:20,  1.09it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:19,  1.09it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:19,  1.09it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:18,  1.08it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:17,  1.08it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:16,  1.08it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:16,  1.08it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:15,  1.08it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:14,  1.07it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:19<01:14,  1.07it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:20<01:13,  1.06it/s]Sampling (mamba memory):  62%|██████▏   | 123/8it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:11<01:21,  1.07it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:12<01:21,  1.07it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:20,  1.07it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:19,  1.07it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:18,  1.07it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:17,  1.07it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:16,  1.07it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:16,  1.06it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:14,  1.07it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:19<01:14,  1.07it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:20<01:13,  1.07it/s]Sampling (mamba memory):  62%|██████▏   | 123/Sampling (mamba memory):  62%|██████▏   | 124/200 [00:20<01:06,  1.15it/s][A[A

Sampling (mamba memory):  62%|██████▎   | 125/200 [00:21<01:05,  1.14it/s][A[A

Sampling (mamba memory):  63%|██████▎   | 126/200 [00:22<01:05,  1.14it/s][A[A

Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:04,  1.13it/s][A[A

Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:03,  1.13it/s][A[A

Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:03,  1.13it/s][A[A

Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:02,  1.13it/s][A[A

Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:01,  1.12it/s][A[A

Sampling (mamba memory):  66%|██████▌   | 132/200 [00:27<01:00,  1.12it/s][A[A

Sampling (mamba memory):  66%|██████▋   | 133/200 [00:28<01:00,  1.11it/s][A[A

Sampling (mamba memory):  67%|██████▋   | 134/200 [00:29<00:59,  1.11it/s][A[A

200 [00:20<01:08,  1.12it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:07,  1.12it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:21<01:06,  1.12it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:22<01:06,  1.12it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:05,  1.12it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:04,  1.12it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:03,  1.12it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:02,  1.11it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:02,  1.11it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:01,  1.10it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:01,  1.10it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:00,  1.09it/s]Sampling (mamba 200 [00:20<01:09,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:08,  1.10it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:07,  1.10it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:06,  1.11it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:06,  1.10it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:05,  1.10it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:04,  1.10it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:03,  1.10it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:02,  1.10it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:02,  1.09it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:01,  1.09it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:00,  1.09it/s]Sampling (mamba Sampling (mamba memory):  68%|██████▊   | 135/200 [00:30<00:58,  1.11it/s][A[A

200 [00:20<01:09,  1.10it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:08,  1.10it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:08,  1.10it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:07,  1.10it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:06,  1.10it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:05,  1.10it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:04,  1.10it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:03,  1.10it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:03,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:02,  1.09it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:01,  1.08it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:01,  1.08it/s]Sampling (mamba 200 [00:20<01:11,  1.08it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:10,  1.08it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:09,  1.08it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:08,  1.08it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:07,  1.08it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:06,  1.08it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:06,  1.08it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:05,  1.07it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:04,  1.07it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:03,  1.07it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:02,  1.07it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:01,  1.07it/s]Sampling (mamba 200 [00:20<01:11,  1.08it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:10,  1.08it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:09,  1.08it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:08,  1.08it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:07,  1.07it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:07,  1.07it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:06,  1.07it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:05,  1.07it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:04,  1.07it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:03,  1.06it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:02,  1.06it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<01:02,  1.06it/s]Sampling (mamba 200 [00:21<01:12,  1.06it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:22<01:11,  1.06it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:23<01:10,  1.06it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:09,  1.06it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:08,  1.06it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:07,  1.07it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:06,  1.07it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:05,  1.07it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:04,  1.07it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:03,  1.07it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:02,  1.07it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<01:01,  1.07it/s]Sampling (mamba Sampling (mamba memory):  68%|██████▊   | 136/200 [00:31<00:57,  1.11it/s][A[A

200 [00:21<01:12,  1.07it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:22<01:11,  1.07it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:23<01:10,  1.07it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:24<01:09,  1.06it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:25<01:08,  1.06it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:26<01:07,  1.06it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:27<01:07,  1.06it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:28<01:06,  1.06it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:05,  1.05it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:04,  1.05it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:03,  1.05it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<01:03,  1.05it/s]Sampling (mamba Sampling (mamba memory):  68%|██████▊   | 137/200 [00:32<00:56,  1.11it/s][A[A

Sampling (mamba memory):  69%|██████▉   | 138/200 [00:33<00:55,  1.11it/s][A[A

Sampling (mamba memory):  70%|██████▉   | 139/200 [00:34<00:55,  1.11it/s][A[A

Sampling (mamba memory):  70%|███████   | 140/200 [00:35<00:54,  1.10it/s][A[A

Sampling (mamba memory):  70%|███████   | 141/200 [00:36<00:53,  1.10it/s][A[A

Sampling (mamba memory):  71%|███████   | 142/200 [00:36<00:52,  1.10it/s][A[A

Sampling (mamba memory):  72%|███████▏  | 143/200 [00:37<00:51,  1.10it/s][A[A

Sampling (mamba memory):  72%|███████▏  | 144/200 [00:38<00:51,  1.09it/s][A[A

Sampling (mamba memory):  72%|███████▎  | 145/200 [00:39<00:50,  1.09it/s][A[A

memory):  68%|██████▊   | 135/200 [00:31<00:59,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:31<00:58,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:32<00:58,  1.08it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:33<00:57,  1.08it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:34<00:56,  1.08it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:35<00:55,  1.08it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:36<00:54,  1.08it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:37<00:53,  1.08it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:38<00:53,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:51,  1.08it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:50,  1.09it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  73%|███████▎  | 146/200 [00:40<00:49,  1.09it/s][A[A

memory):  68%|██████▊   | 135/200 [00:31<00:59,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:58,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:58,  1.08it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:57,  1.08it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:56,  1.08it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:55,  1.08it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:36<00:54,  1.08it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:37<00:53,  1.08it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:38<00:52,  1.08it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:52,  1.08it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:51,  1.07it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:31<01:00,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:59,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:58,  1.07it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:58,  1.07it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:57,  1.06it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:56,  1.06it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:55,  1.06it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:54,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:53,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:52,  1.06it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:52,  1.06it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:31<01:00,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<01:00,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:59,  1.06it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:58,  1.06it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:57,  1.06it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:56,  1.06it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:55,  1.06it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:55,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:54,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:53,  1.05it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:52,  1.05it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▎  | 147/200 [00:41<00:48,  1.09it/s][A[A

memory):  68%|██████▊   | 135/200 [00:32<01:01,  1.06it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:33<01:00,  1.06it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:59,  1.06it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:58,  1.06it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:57,  1.05it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:56,  1.05it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:56,  1.05it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:55,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:54,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:53,  1.05it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:52,  1.05it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:32<01:00,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:33<01:00,  1.06it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:34<00:59,  1.06it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:35<00:58,  1.06it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:36<00:57,  1.06it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:37<00:56,  1.06it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:38<00:55,  1.06it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:39<00:54,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:54,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:53,  1.05it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:52,  1.05it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▍  | 148/200 [00:42<00:47,  1.08it/s][A[A

memory):  68%|██████▊   | 135/200 [00:32<01:02,  1.05it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:33<01:01,  1.04it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:34<01:00,  1.04it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:35<00:59,  1.04it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:36<00:58,  1.04it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:37<00:57,  1.04it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:38<00:57,  1.03it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:39<00:56,  1.03it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:40<00:55,  1.03it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:41<00:54,  1.03it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:42<00:53,  1.03it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▍  | 149/200 [00:43<00:46,  1.09it/s][A[A

Sampling (mamba memory):  75%|███████▌  | 150/200 [00:44<00:45,  1.09it/s][A[A

Sampling (mamba memory):  76%|███████▌  | 151/200 [00:45<00:44,  1.10it/s][A[A

Sampling (mamba memory):  76%|███████▌  | 152/200 [00:46<00:43,  1.10it/s][A[A

Sampling (mamba memory):  76%|███████▋  | 153/200 [00:47<00:42,  1.10it/s][A[A

Sampling (mamba memory):  77%|███████▋  | 154/200 [00:47<00:41,  1.10it/s][A[A

Sampling (mamba memory):  78%|███████▊  | 155/200 [00:48<00:41,  1.09it/s][A[A

Sampling (mamba memory):  78%|███████▊  | 156/200 [00:49<00:40,  1.09it/s][A[A

 | 146/200 [00:41<00:49,  1.09it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:48,  1.09it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:47,  1.09it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:47,  1.08it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:44<00:46,  1.08it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:45<00:45,  1.07it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:46<00:44,  1.07it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:47<00:43,  1.07it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:48<00:43,  1.07it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:49<00:42,  1.07it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:50<00:41,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:51<00:40Sampling (mamba memory):  78%|███████▊  | 157/200 [00:50<00:39,  1.08it/s][A[A

 | 146/200 [00:41<00:50,  1.07it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:49,  1.07it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:48,  1.07it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:47,  1.07it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:46,  1.07it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:45,  1.07it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:44,  1.07it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:44,  1.07it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:43,  1.07it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:42,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:41,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:51<00:40Sampling (mamba memory):  79%|███████▉  | 158/200 [00:51<00:38,  1.08it/s][A[A

 | 146/200 [00:42<00:51,  1.05it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:50,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:49,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:48,  1.05it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:47,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:46,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:45,  1.05it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:45,  1.04it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:44,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:43,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:42,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:41 | 146/200 [00:42<00:51,  1.05it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:50,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:49,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:48,  1.06it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:47,  1.06it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:46,  1.06it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:48<00:45,  1.06it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:49<00:44,  1.06it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:43,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:42,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:41,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:41 | 146/200 [00:42<00:51,  1.05it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:50,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:49,  1.04it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:48,  1.04it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:48,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:47,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:48<00:46,  1.04it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:49<00:45,  1.04it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:50<00:44,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:51<00:43,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:52<00:42,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:53<00:41 | 146/200 [00:42<00:51,  1.05it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:50,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:49,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:48,  1.05it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:47,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:46,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:48<00:45,  1.04it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:49<00:45,  1.04it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:50<00:44,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:51<00:43,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:52<00:42,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:53<00:41Sampling (mamba memory):  80%|███████▉  | 159/200 [00:52<00:37,  1.08it/s][A[A

 | 146/200 [00:43<00:52,  1.03it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:44<00:51,  1.03it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:45<00:50,  1.03it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:46<00:49,  1.03it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:47<00:48,  1.02it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:48<00:48,  1.02it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:49<00:47,  1.01it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:50<00:46,  1.01it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:51<00:45,  1.00it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:52<00:44,  1.00it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:53<00:43,  1.00it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:54<00:42Sampling (mamba memory):  80%|████████  | 160/200 [00:53<00:37,  1.08it/s][A[A

Sampling (mamba memory):  80%|████████  | 161/200 [00:54<00:36,  1.08it/s][A[A

Sampling (mamba memory):  81%|████████  | 162/200 [00:55<00:35,  1.07it/s][A[A

Sampling (mamba memory):  82%|████████▏ | 163/200 [00:56<00:34,  1.07it/s][A[A

Sampling (mamba memory):  82%|████████▏ | 164/200 [00:57<00:33,  1.07it/s][A[A

Sampling (mamba memory):  82%|████████▎ | 165/200 [00:58<00:32,  1.07it/s][A[A

Sampling (mamba memory):  83%|████████▎ | 166/200 [00:59<00:31,  1.07it/s][A[A

Sampling (mamba memory):  84%|████████▎ | 167/200 [01:00<00:30,  1.07it/s][A[A

Sampling (mamba memory):  84%|████████▍ | 168/200 [01:01<00:30,  1.06it/s][A[A

,  1.06it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:52<00:39,  1.06it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:53<00:38,  1.06it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:54<00:37,  1.05it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:55<00:37,  1.05it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:56<00:36,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:57<00:35,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:58<00:34,  1.04it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [00:59<00:33,  1.04it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:00<00:32,  1.04it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:01<00:31,  1.04it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:02<00:30,  1.03it/s,  1.06it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:52<00:39,  1.05it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:53<00:39,  1.05it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:54<00:38,  1.05it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:55<00:37,  1.04it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:56<00:36,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:57<00:35,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:58<00:34,  1.04it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [00:59<00:33,  1.03it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:00<00:32,  1.03it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:01<00:32,  1.03it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:02<00:31,  1.03it/sSampling (mamba memory):  84%|████████▍ | 169/200 [01:02<00:29,  1.06it/s][A[A

,  1.04it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:53<00:40,  1.04it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:54<00:39,  1.04it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:55<00:38,  1.04it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:56<00:37,  1.04it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:57<00:36,  1.03it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:35,  1.03it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:34,  1.03it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:34,  1.03it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:33,  1.03it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:02<00:32,  1.02it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:03<00:31,  1.02it/s,  1.04it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:53<00:40,  1.04it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:54<00:39,  1.04it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:55<00:38,  1.03it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:56<00:37,  1.03it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:57<00:36,  1.03it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:36,  1.03it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:35,  1.03it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:34,  1.03it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:33,  1.02it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:02<00:32,  1.02it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:03<00:31,  1.02it/sSampling (mamba memory):  85%|████████▌ | 170/200 [01:02<00:28,  1.06it/s][A[A

,  1.03it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:54<00:40,  1.03it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:55<00:39,  1.03it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:56<00:38,  1.03it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:57<00:37,  1.03it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:58<00:37,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:59<00:36,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:00<00:35,  1.02it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:01<00:34,  1.02it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:02<00:33,  1.02it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:03<00:32,  1.01it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:04<00:31,  1.00it/s,  1.03it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:54<00:40,  1.03it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:55<00:40,  1.02it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:56<00:39,  1.02it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:57<00:38,  1.02it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:58<00:37,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:59<00:36,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:00<00:35,  1.01it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:01<00:34,  1.01it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:02<00:33,  1.01it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:03<00:32,  1.00it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:04<00:31,  1.00it/sSampling (mamba memory):  86%|████████▌ | 171/200 [01:03<00:27,  1.05it/s][A[A

,  1.00it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:55<00:42,  1.00s/it]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:56<00:41,  1.00s/it]Sampling (mamba memory):  80%|████████  | 160/200 [00:57<00:40,  1.00s/it]Sampling (mamba memory):  80%|████████  | 161/200 [00:58<00:39,  1.00s/it]Sampling (mamba memory):  81%|████████  | 162/200 [00:59<00:38,  1.00s/it]Sampling (mamba memory):  82%|████████▏ | 163/200 [01:00<00:37,  1.01s/it]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:01<00:36,  1.01s/it]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:02<00:35,  1.01s/it]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:03<00:34,  1.02s/it]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:04<00:33,  1.02s/it]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:05<00:32,  1.02s/itSampling (mamba memory):  86%|████████▌ | 172/200 [01:04<00:26,  1.05it/s][A[A

Sampling (mamba memory):  86%|████████▋ | 173/200 [01:05<00:25,  1.04it/s][A[A

Sampling (mamba memory):  87%|████████▋ | 174/200 [01:06<00:25,  1.04it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 175/200 [01:07<00:24,  1.04it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 176/200 [01:08<00:23,  1.04it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 177/200 [01:09<00:22,  1.04it/s][A[A

Sampling (mamba memory):  89%|████████▉ | 178/200 [01:10<00:21,  1.04it/s][A[A

Sampling (mamba memory):  90%|████████▉ | 179/200 [01:11<00:20,  1.04it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:03<00:30,  1.03it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:04<00:29,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:05<00:28,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:05<00:26,  1.04it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:06<00:26,  1.04it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:07<00:25,  1.03it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:08<00:24,  1.03it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:09<00:23,  1.03it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:10<00:22,  1.03it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:11<00:21,  1.03it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:12<00:20,  1.03it/s]]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:03<00:30,  1.02it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:04<00:29,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:05<00:28,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:06<00:27,  1.02it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:07<00:26,  1.02it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:08<00:25,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:09<00:24,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:10<00:23,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:11<00:22,  1.02it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:12<00:21,  1.02it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:13<00:20,  1.01it/s]Sampling (mamba memory):  90%|█████████ | 180/200 [01:12<00:19,  1.04it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:04<00:30,  1.01it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:05<00:29,  1.01it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:06<00:28,  1.01it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:07<00:27,  1.01it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:08<00:26,  1.01it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:09<00:25,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:10<00:24,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:11<00:23,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:12<00:22,  1.01it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:13<00:21,  1.01it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:14<00:20,  1.01it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:13<00:18,  1.04it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:04<00:30,  1.01it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:05<00:29,  1.01it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:06<00:28,  1.01it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:07<00:27,  1.01it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:08<00:26,  1.01it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:09<00:25,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:10<00:24,  1.00it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:11<00:23,  1.00it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:12<00:23,  1.00s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:13<00:22,  1.00s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:14<00:21,  1.01s/it]]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:05<00:30,  1.00it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:06<00:29,  1.00it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:07<00:29,  1.00s/it]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:08<00:28,  1.00s/it]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:09<00:27,  1.00s/it]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:10<00:25,  1.00it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:11<00:25,  1.00s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:12<00:23,  1.00it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:13<00:23,  1.00s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:14<00:22,  1.00s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:15<00:21,  1.01s/it]]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:05<00:30,  1.00it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:06<00:29,  1.00it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:07<00:28,  1.00it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:08<00:27,  1.00it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:09<00:26,  1.00it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:10<00:25,  1.00it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:11<00:25,  1.00s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:12<00:24,  1.00s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:13<00:23,  1.01s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:14<00:22,  1.01s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:15<00:21,  1.01s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:14<00:17,  1.03it/s][A[A

Sampling (mamba memory):  92%|█████████▏| 183/200 [01:15<00:16,  1.03it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:06<00:31,  1.02s/it]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:07<00:30,  1.02s/it]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:08<00:29,  1.02s/it]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:09<00:28,  1.02s/it]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:10<00:27,  1.02s/it]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:11<00:26,  1.03s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:12<00:25,  1.03s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:13<00:24,  1.03s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:14<00:23,  1.04s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:15<00:22,  1.04s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:16<00:21,  1.04s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:16<00:15,  1.03it/s][A[A

Sampling (mamba memory):  92%|█████████▎| 185/200 [01:17<00:14,  1.02it/s][A[A

Sampling (mamba memory):  93%|█████████▎| 186/200 [01:18<00:13,  1.02it/s][A[A

Sampling (mamba memory):  94%|█████████▎| 187/200 [01:19<00:12,  1.02it/s][A[A

Sampling (mamba memory):  94%|█████████▍| 188/200 [01:20<00:11,  1.01it/s][A[A

Sampling (mamba memory):  94%|█████████▍| 189/200 [01:21<00:10,  1.01it/s][A[A

Sampling (mamba memory):  95%|█████████▌| 190/200 [01:22<00:09,  1.01it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:13<00:19,  1.03it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:14<00:18,  1.03it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:15<00:17,  1.02it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:16<00:16,  1.02it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:17<00:15,  1.01it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:18<00:14,  1.01it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:19<00:13,  1.01it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:20<00:12,  1.00it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:21<00:11,  1.00it/s]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:22<00:11,  1.00s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:23<00Sampling (mamba memory):  96%|█████████▌| 191/200 [01:23<00:08,  1.01it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:14<00:19,  1.01it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:15<00:18,  1.01it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:16<00:17,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:17<00:16,  1.00it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:18<00:15,  1.00it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:19<00:15,  1.00s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:20<00:14,  1.00s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:21<00:13,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:22<00:12,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:23<00:11,  1.00s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:24<00Sampling (mamba memory):  96%|█████████▌| 192/200 [01:24<00:07,  1.01it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:15<00:19,  1.00it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:16<00:19,  1.00s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:17<00:18,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:18<00:17,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:19<00:16,  1.01s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:20<00:15,  1.02s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:21<00:14,  1.02s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:22<00:13,  1.02s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:23<00:12,  1.02s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:24<00:11,  1.02s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:25<00Sampling (mamba memory):  90%|█████████ | 180/200 [01:15<00:20,  1.01s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:16<00:19,  1.01s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:17<00:18,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:18<00:17,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:19<00:16,  1.02s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:20<00:15,  1.02s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:21<00:14,  1.02s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:22<00:13,  1.03s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:23<00:12,  1.03s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:24<00:11,  1.03s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:25<00Sampling (mamba memory):  90%|█████████ | 180/200 [01:16<00:20,  1.01s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:17<00:19,  1.01s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:18<00:18,  1.02s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:19<00:17,  1.02s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:20<00:16,  1.02s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:21<00:15,  1.02s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:22<00:14,  1.02s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:23<00:13,  1.03s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:24<00:12,  1.03s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:25<00:11,  1.03s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:26<00Sampling (mamba memory):  96%|█████████▋| 193/200 [01:25<00:06,  1.01it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:16<00:20,  1.01s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:17<00:19,  1.02s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:18<00:18,  1.02s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:19<00:17,  1.02s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:20<00:16,  1.02s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:21<00:15,  1.03s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:22<00:14,  1.03s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:23<00:13,  1.03s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:24<00:12,  1.03s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:25<00:11,  1.03s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:26<00Sampling (mamba memory):  97%|█████████▋| 194/200 [01:26<00:05,  1.01it/s][A[A

Sampling (mamba memory):  98%|█████████▊| 195/200 [01:27<00:04,  1.01it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:17<00:20,  1.04s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:19<00:19,  1.05s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:20<00:18,  1.05s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:21<00:17,  1.05s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:22<00:16,  1.05s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:23<00:15,  1.05s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:24<00:14,  1.05s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:25<00:13,  1.06s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:26<00:12,  1.05s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:27<00:11,  1.05s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:28<00Sampling (mamba memory):  98%|█████████▊| 196/200 [01:28<00:03,  1.01it/s][A[A

Sampling (mamba memory):  98%|█████████▊| 197/200 [01:29<00:02,  1.01it/s][A[A

Sampling (mamba memory):  99%|█████████▉| 198/200 [01:30<00:01,  1.01it/s][A[A

Sampling (mamba memory): 100%|█████████▉| 199/200 [01:31<00:00,  1.01it/s][A[A

Sampling (mamba memory): 100%|██████████| 200/200 [01:32<00:00,  1.00it/s][A[ASampling (mamba memory): 100%|██████████| 200/200 [01:37<00:00,  1.03it/s]
Validation DataLoader 0:   0%|          | 0/1 [00:00<?, ?it/s][A
:10,  1.00s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:24<00:09,  1.00s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:25<00:08,  1.01s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:26<00:07,  1.01s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:27<00:06,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:28<00:05,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:29<00:04,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:30<00:03,  1.01s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:31<00:02,  1.01s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:32<00:01,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:33<00:00,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:38<00:00,  1.02it/s]
:10,  1.00s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:25<00:09,  1.00s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:26<00:08,  1.00s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:27<00:06,  1.00it/s]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:28<00:05,  1.00it/s]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:29<00:05,  1.00s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:30<00:04,  1.00s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:31<00:03,  1.00s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:32<00:02,  1.00s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:33<00:01,  1.00s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:34<00:00,  1.00s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:39<00:00,  1.01it/s]
:10,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:26<00:09,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:27<00:08,  1.02s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:28<00:07,  1.02s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:29<00:06,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:30<00:05,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:31<00:04,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:32<00:03,  1.03s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:33<00:02,  1.03s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:34<00:01,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:35<00:00,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:40<00:00,  1.01s/it]
:10,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:26<00:09,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:27<00:08,  1.04s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:29<00:07,  1.04s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:30<00:06,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:31<00:05,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:32<00:04,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:33<00:03,  1.04s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:34<00:02,  1.04s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:35<00:01,  1.04s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:36<00:00,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:40<00:00,  1.01s/it]
:10,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:27<00:09,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:28<00:08,  1.03s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:29<00:07,  1.03s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:30<00:06,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:31<00:05,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:32<00:04,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:33<00:03,  1.03s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:34<00:02,  1.03s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:35<00:01,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:36<00:00,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:41<00:00,  1.02s/it]
:10,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:27<00:09,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:28<00:08,  1.03s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:29<00:07,  1.03s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:30<00:06,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:31<00:05,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:32<00:04,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:33<00:03,  1.04s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:34<00:02,  1.04s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:36<00:01,  1.04s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:37<00:00,  1.04s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:41<00:00,  1.02s/it]
:10,  1.05s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:29<00:09,  1.05s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:30<00:08,  1.05s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:31<00:07,  1.05s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:32<00:06,  1.05s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:33<00:05,  1.05s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:34<00:04,  1.05s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:35<00:03,  1.05s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:36<00:02,  1.05s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:37<00:01,  1.05s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:39<00:00,  1.05s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:43<00:00,  1.04s/it]
Validation DataLoader 0: 100%|██████████| 1/1 [01:37<00:00,  0.01it/s][A
                                                                      [AEpoch 0:  12%|█▏        | 25000/203307 [28:26:53<202:53:59,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 25001/203307 [28:26:57<202:53:59,  0.24it/s, v_num=t5e6, training/loss=0.0892]Epoch 0:  12%|█▏        | 25001/203307 [28:26:57<202:53:59,  0.24it/s, v_num=t5e6, training/loss=0.091] Epoch 0:  12%|█▏        | 25002/203307 [28:27:01<202:53:51,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25002/203307 [28:27:01<202:53:51,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25003/203307 [28:27:05<202:53:50,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25003/203307 [28:27:05<202:53:50,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25004/203307 [28:27:09<202:53:44,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25004/203307 [28:27:09<202:53:44,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25005/203307 [28:27:14<202:53:42,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25005/203307 [28:27:14<202:53:42,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25006/203307 [28:27:18<202:53:41,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25006/203307 [28:27:18<202:53:41,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25007/203307 [28:27:22<202:53:33,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25007/203307 [28:27:22<202:53:33,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25008/203307 [28:27:26<202:53:30,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25008/203307 [28:27:26<202:53:30,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25009/203307 [28:27:30<202:53:24,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25009/203307 [28:27:30<202:53:24,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25010/203307 [28:27:34<202:53:18,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25010/203307 [28:27:34<202:53:18,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25011/203307 [28:27:38<202:53:18,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25011/203307 [28:27:38<202:53:18,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25012/203307 [28:27:42<202:53:11,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25012/203307 [28:27:42<202:53:11,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25013/203307 [28:27:46<202:53:05,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25013/203307 [28:27:46<202:53:05,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25014/203307 [28:27:50<202:53:02,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25014/203307 [28:27:50<202:53:02,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25015/203307 [28:27:54<202:52:59,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25015/203307 [28:27:54<202:52:59,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25016/203307 [28:27:58<202:52:53,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25016/203307 [28:27:58<202:52:53,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25017/203307 [28:28:03<202:52:52,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25017/203307 [28:28:03<202:52:52,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25018/203307 [28:28:07<202:52:46,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25018/203307 [28:28:07<202:52:46,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25019/203307 [28:28:11<202:52:44,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25019/203307 [28:28:11<202:52:44,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25020/203307 [28:28:15<202:52:42,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25020/203307 [28:28:15<202:52:42,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25021/203307 [28:28:19<202:52:36,  0.24it/s, v_num=t5e6, training/loss=0.091]Epoch 0:  12%|█▏        | 25021/203307 [28:28:19<202:52:36,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25022/203307 [28:28:23<202:52:32,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25022/203307 [28:28:23<202:52:32,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25023/203307 [28:28:28<202:52:32,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25023/203307 [28:28:28<202:52:32,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25024/203307 [28:28:32<202:52:25,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25024/203307 [28:28:32<202:52:25,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25025/203307 [28:28:35<202:52:19,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25025/203307 [28:28:35<202:52:19,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25026/203307 [28:28:40<202:52:18,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25026/203307 [28:28:40<202:52:18,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25027/203307 [28:28:44<202:52:11,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25027/203307 [28:28:44<202:52:11,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25028/203307 [28:28:48<202:52:09,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25028/203307 [28:28:48<202:52:09,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25029/203307 [28:28:52<202:52:07,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25029/203307 [28:28:52<202:52:07,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25030/203307 [28:28:56<202:52:00,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25030/203307 [28:28:56<202:52:00,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25031/203307 [28:29:01<202:51:58,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25031/203307 [28:29:01<202:51:58,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25032/203307 [28:29:05<202:51:55,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25032/203307 [28:29:05<202:51:55,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25033/203307 [28:29:08<202:51:48,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25033/203307 [28:29:08<202:51:48,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25034/203307 [28:29:13<202:51:46,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25034/203307 [28:29:13<202:51:47,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25035/203307 [28:29:17<202:51:40,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25035/203307 [28:29:17<202:51:40,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25036/203307 [28:29:20<202:51:32,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25036/203307 [28:29:20<202:51:32,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25037/203307 [28:29:25<202:51:32,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25037/203307 [28:29:25<202:51:32,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25038/203307 [28:29:29<202:51:25,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25038/203307 [28:29:29<202:51:25,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25039/203307 [28:29:32<202:51:18,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25039/203307 [28:29:32<202:51:18,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25040/203307 [28:29:37<202:51:16,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25040/203307 [28:29:37<202:51:16,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25041/203307 [28:29:40<202:51:09,  0.24it/s, v_num=t5e6, training/loss=0.101]Epoch 0:  12%|█▏        | 25041/203307 [28:29:40<202:51:09,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25042/203307 [28:29:45<202:51:06,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25042/203307 [28:29:45<202:51:06,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25043/203307 [28:29:49<202:51:04,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25043/203307 [28:29:49<202:51:04,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25044/203307 [28:29:53<202:50:57,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25044/203307 [28:29:53<202:50:57,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25045/203307 [28:29:57<202:50:55,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25045/203307 [28:29:57<202:50:55,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25046/203307 [28:30:01<202:50:52,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25046/203307 [28:30:01<202:50:52,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25047/203307 [28:30:05<202:50:45,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25047/203307 [28:30:05<202:50:45,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25048/203307 [28:30:09<202:50:42,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25048/203307 [28:30:09<202:50:42,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25049/203307 [28:30:14<202:50:39,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25049/203307 [28:30:14<202:50:39,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25050/203307 [28:30:17<202:50:32,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25050/203307 [28:30:17<202:50:32,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25051/203307 [28:30:22<202:50:29,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25051/203307 [28:30:22<202:50:30,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25052/203307 [28:30:26<202:50:28,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25052/203307 [28:30:26<202:50:28,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25053/203307 [28:30:30<202:50:21,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25053/203307 [28:30:30<202:50:21,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25054/203307 [28:30:34<202:50:20,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25054/203307 [28:30:34<202:50:20,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25055/203307 [28:30:38<202:50:17,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25055/203307 [28:30:38<202:50:17,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25056/203307 [28:30:42<202:50:09,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25056/203307 [28:30:42<202:50:09,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25057/203307 [28:30:46<202:50:07,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25057/203307 [28:30:46<202:50:07,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25058/203307 [28:30:50<202:50:01,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25058/203307 [28:30:50<202:50:01,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25059/203307 [28:30:54<202:49:54,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25059/203307 [28:30:54<202:49:54,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25060/203307 [28:30:58<202:49:53,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25060/203307 [28:30:58<202:49:53,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25061/203307 [28:31:02<202:49:47,  0.24it/s, v_num=t5e6, training/loss=0.0761]Epoch 0:  12%|█▏        | 25061/203307 [28:31:02<202:49:47,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25062/203307 [28:31:06<202:49:41,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25062/203307 [28:31:06<202:49:41,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25063/203307 [28:31:11<202:49:39,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25063/203307 [28:31:11<202:49:39,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25064/203307 [28:31:14<202:49:32,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25064/203307 [28:31:14<202:49:32,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25065/203307 [28:31:18<202:49:26,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25065/203307 [28:31:18<202:49:26,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25066/203307 [28:31:22<202:49:24,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25066/203307 [28:31:22<202:49:24,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25067/203307 [28:31:26<202:49:17,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25067/203307 [28:31:26<202:49:17,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25068/203307 [28:31:30<202:49:11,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25068/203307 [28:31:30<202:49:11,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25069/203307 [28:31:34<202:49:10,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25069/203307 [28:31:34<202:49:10,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25070/203307 [28:31:38<202:49:04,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25070/203307 [28:31:38<202:49:04,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25071/203307 [28:31:43<202:49:03,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25071/203307 [28:31:43<202:49:03,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25072/203307 [28:31:47<202:49:00,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25072/203307 [28:31:47<202:49:00,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25073/203307 [28:31:51<202:48:54,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25073/203307 [28:31:51<202:48:54,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25074/203307 [28:31:55<202:48:51,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25074/203307 [28:31:55<202:48:52,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25075/203307 [28:32:00<202:48:49,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25075/203307 [28:32:00<202:48:49,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25076/203307 [28:32:03<202:48:42,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25076/203307 [28:32:03<202:48:42,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25077/203307 [28:32:07<202:48:35,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25077/203307 [28:32:07<202:48:35,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25078/203307 [28:32:11<202:48:34,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25078/203307 [28:32:11<202:48:34,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25079/203307 [28:32:15<202:48:27,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25079/203307 [28:32:15<202:48:27,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25080/203307 [28:32:20<202:48:25,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25080/203307 [28:32:20<202:48:25,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25081/203307 [28:32:24<202:48:22,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  12%|█▏        | 25081/203307 [28:32:24<202:48:23,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25082/203307 [28:32:27<202:48:15,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25082/203307 [28:32:27<202:48:15,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25083/203307 [28:32:32<202:48:13,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25083/203307 [28:32:32<202:48:13,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25084/203307 [28:32:36<202:48:06,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25084/203307 [28:32:36<202:48:06,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25085/203307 [28:32:39<202:47:59,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25085/203307 [28:32:39<202:47:59,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25086/203307 [28:32:44<202:47:58,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25086/203307 [28:32:44<202:47:58,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25087/203307 [28:32:48<202:47:54,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25087/203307 [28:32:48<202:47:54,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25088/203307 [28:32:51<202:47:47,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25088/203307 [28:32:52<202:47:47,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25089/203307 [28:32:56<202:47:45,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25089/203307 [28:32:56<202:47:45,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25090/203307 [28:33:00<202:47:37,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25090/203307 [28:33:00<202:47:37,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25091/203307 [28:33:03<202:47:30,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25091/203307 [28:33:03<202:47:30,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25092/203307 [28:33:08<202:47:28,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25092/203307 [28:33:08<202:47:28,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25093/203307 [28:33:11<202:47:21,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25093/203307 [28:33:11<202:47:21,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25094/203307 [28:33:15<202:47:13,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25094/203307 [28:33:15<202:47:13,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25095/203307 [28:33:19<202:47:12,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25095/203307 [28:33:19<202:47:12,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25096/203307 [28:33:24<202:47:09,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25096/203307 [28:33:24<202:47:09,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25097/203307 [28:33:28<202:47:06,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25097/203307 [28:33:28<202:47:06,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25098/203307 [28:33:32<202:47:03,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25098/203307 [28:33:32<202:47:03,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25099/203307 [28:33:36<202:46:56,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25099/203307 [28:33:36<202:46:56,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25100/203307 [28:33:40<202:46:53,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25100/203307 [28:33:40<202:46:53,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25101/203307 [28:33:44<202:46:51,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  12%|█▏        | 25101/203307 [28:33:44<202:46:51,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25102/203307 [28:33:48<202:46:43,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25102/203307 [28:33:48<202:46:43,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25103/203307 [28:33:52<202:46:36,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25103/203307 [28:33:52<202:46:36,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25104/203307 [28:33:56<202:46:35,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25104/203307 [28:33:56<202:46:35,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25105/203307 [28:34:00<202:46:31,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25105/203307 [28:34:00<202:46:31,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25106/203307 [28:34:05<202:46:29,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25106/203307 [28:34:05<202:46:29,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25107/203307 [28:34:09<202:46:25,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25107/203307 [28:34:09<202:46:25,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25108/203307 [28:34:12<202:46:18,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25108/203307 [28:34:12<202:46:18,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25109/203307 [28:34:17<202:46:16,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25109/203307 [28:34:17<202:46:16,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25110/203307 [28:34:21<202:46:09,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25110/203307 [28:34:21<202:46:09,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25111/203307 [28:34:24<202:46:03,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25111/203307 [28:34:24<202:46:03,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25112/203307 [28:34:29<202:46:01,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25112/203307 [28:34:29<202:46:01,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25113/203307 [28:34:33<202:45:54,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25113/203307 [28:34:33<202:45:55,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25114/203307 [28:34:37<202:45:51,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25114/203307 [28:34:37<202:45:51,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25115/203307 [28:34:41<202:45:50,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25115/203307 [28:34:41<202:45:50,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25116/203307 [28:34:45<202:45:43,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25116/203307 [28:34:45<202:45:44,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25117/203307 [28:34:49<202:45:37,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25117/203307 [28:34:49<202:45:37,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25118/203307 [28:34:53<202:45:35,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25118/203307 [28:34:53<202:45:35,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25119/203307 [28:34:57<202:45:28,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25119/203307 [28:34:57<202:45:28,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25120/203307 [28:35:01<202:45:22,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25120/203307 [28:35:01<202:45:22,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25121/203307 [28:35:05<202:45:21,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  12%|█▏        | 25121/203307 [28:35:05<202:45:21,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25122/203307 [28:35:09<202:45:14,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25122/203307 [28:35:09<202:45:14,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25123/203307 [28:35:13<202:45:12,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25123/203307 [28:35:13<202:45:12,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25124/203307 [28:35:18<202:45:09,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25124/203307 [28:35:18<202:45:09,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25125/203307 [28:35:21<202:45:03,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25125/203307 [28:35:21<202:45:03,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25126/203307 [28:35:26<202:45:01,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25126/203307 [28:35:26<202:45:01,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25127/203307 [28:35:30<202:44:58,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25127/203307 [28:35:30<202:44:58,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25128/203307 [28:35:34<202:44:52,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25128/203307 [28:35:34<202:44:52,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25129/203307 [28:35:38<202:44:45,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25129/203307 [28:35:38<202:44:45,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25130/203307 [28:35:42<202:44:44,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25130/203307 [28:35:42<202:44:44,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25131/203307 [28:35:46<202:44:37,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25131/203307 [28:35:46<202:44:37,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25132/203307 [28:35:50<202:44:35,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25132/203307 [28:35:50<202:44:35,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25133/203307 [28:35:54<202:44:32,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25133/203307 [28:35:54<202:44:32,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25134/203307 [28:35:58<202:44:25,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25134/203307 [28:35:58<202:44:25,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25135/203307 [28:36:02<202:44:23,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25135/203307 [28:36:02<202:44:23,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25136/203307 [28:36:06<202:44:16,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25136/203307 [28:36:06<202:44:16,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25137/203307 [28:36:10<202:44:09,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25137/203307 [28:36:10<202:44:09,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25138/203307 [28:36:14<202:44:08,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25138/203307 [28:36:14<202:44:08,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25139/203307 [28:36:18<202:44:02,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25139/203307 [28:36:18<202:44:02,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25140/203307 [28:36:22<202:43:55,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25140/203307 [28:36:22<202:43:56,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25141/203307 [28:36:26<202:43:54,  0.24it/s, v_num=t5e6, training/loss=0.0783]Epoch 0:  12%|█▏        | 25141/203307 [28:36:26<202:43:54,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25142/203307 [28:36:30<202:43:47,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25142/203307 [28:36:30<202:43:47,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25143/203307 [28:36:34<202:43:41,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25143/203307 [28:36:34<202:43:41,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25144/203307 [28:36:38<202:43:39,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25144/203307 [28:36:38<202:43:39,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25145/203307 [28:36:42<202:43:32,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25145/203307 [28:36:42<202:43:32,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25146/203307 [28:36:46<202:43:26,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25146/203307 [28:36:46<202:43:26,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25147/203307 [28:36:50<202:43:24,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25147/203307 [28:36:50<202:43:24,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25148/203307 [28:36:54<202:43:17,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25148/203307 [28:36:54<202:43:17,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25149/203307 [28:36:58<202:43:15,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25149/203307 [28:36:58<202:43:15,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25150/203307 [28:37:03<202:43:12,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25150/203307 [28:37:03<202:43:12,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25151/203307 [28:37:07<202:43:07,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25151/203307 [28:37:07<202:43:07,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25152/203307 [28:37:11<202:43:05,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25152/203307 [28:37:11<202:43:05,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25153/203307 [28:37:15<202:43:02,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25153/203307 [28:37:15<202:43:02,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25154/203307 [28:37:19<202:42:56,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25154/203307 [28:37:19<202:42:56,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25155/203307 [28:37:23<202:42:49,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25155/203307 [28:37:23<202:42:49,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25156/203307 [28:37:27<202:42:47,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25156/203307 [28:37:27<202:42:47,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25157/203307 [28:37:31<202:42:40,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25157/203307 [28:37:31<202:42:40,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25158/203307 [28:37:35<202:42:39,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25158/203307 [28:37:35<202:42:39,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25159/203307 [28:37:39<202:42:35,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25159/203307 [28:37:39<202:42:35,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25160/203307 [28:37:43<202:42:28,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25160/203307 [28:37:43<202:42:28,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25161/203307 [28:37:47<202:42:26,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  12%|█▏        | 25161/203307 [28:37:47<202:42:26,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25162/203307 [28:37:51<202:42:19,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25162/203307 [28:37:51<202:42:19,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25163/203307 [28:37:55<202:42:12,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25163/203307 [28:37:55<202:42:12,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25164/203307 [28:37:59<202:42:10,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25164/203307 [28:37:59<202:42:10,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25165/203307 [28:38:03<202:42:04,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25165/203307 [28:38:03<202:42:04,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25166/203307 [28:38:07<202:41:57,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25166/203307 [28:38:07<202:41:57,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25167/203307 [28:38:11<202:41:55,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25167/203307 [28:38:11<202:41:55,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25168/203307 [28:38:15<202:41:51,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25168/203307 [28:38:15<202:41:51,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25169/203307 [28:38:19<202:41:45,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25169/203307 [28:38:19<202:41:45,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25170/203307 [28:38:23<202:41:42,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25170/203307 [28:38:23<202:41:42,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25171/203307 [28:38:27<202:41:35,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25171/203307 [28:38:27<202:41:35,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25172/203307 [28:38:31<202:41:29,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25172/203307 [28:38:31<202:41:29,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25173/203307 [28:38:35<202:41:27,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25173/203307 [28:38:35<202:41:28,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25174/203307 [28:38:39<202:41:21,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25174/203307 [28:38:39<202:41:21,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25175/203307 [28:38:43<202:41:18,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25175/203307 [28:38:43<202:41:18,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25176/203307 [28:38:48<202:41:15,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25176/203307 [28:38:48<202:41:15,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25177/203307 [28:38:52<202:41:12,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25177/203307 [28:38:52<202:41:12,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25178/203307 [28:38:56<202:41:10,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25178/203307 [28:38:56<202:41:10,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25179/203307 [28:39:00<202:41:07,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25179/203307 [28:39:01<202:41:07,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25180/203307 [28:39:04<202:41:01,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25180/203307 [28:39:04<202:41:01,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25181/203307 [28:39:08<202:40:54,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  12%|█▏        | 25181/203307 [28:39:08<202:40:54,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25182/203307 [28:39:13<202:40:53,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25182/203307 [28:39:13<202:40:53,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25183/203307 [28:39:16<202:40:46,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25183/203307 [28:39:16<202:40:46,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25184/203307 [28:39:21<202:40:44,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25184/203307 [28:39:21<202:40:44,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25185/203307 [28:39:25<202:40:43,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25185/203307 [28:39:25<202:40:43,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25186/203307 [28:39:29<202:40:39,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25186/203307 [28:39:29<202:40:39,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25187/203307 [28:39:34<202:40:37,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25187/203307 [28:39:34<202:40:37,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25188/203307 [28:39:37<202:40:31,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25188/203307 [28:39:37<202:40:31,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25189/203307 [28:39:41<202:40:24,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25189/203307 [28:39:41<202:40:24,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25190/203307 [28:39:46<202:40:23,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25190/203307 [28:39:46<202:40:23,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25191/203307 [28:39:49<202:40:16,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25191/203307 [28:39:49<202:40:16,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25192/203307 [28:39:53<202:40:09,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25192/203307 [28:39:53<202:40:10,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25193/203307 [28:39:58<202:40:08,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25193/203307 [28:39:58<202:40:09,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25194/203307 [28:40:01<202:40:02,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25194/203307 [28:40:01<202:40:02,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25195/203307 [28:40:06<202:39:59,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25195/203307 [28:40:06<202:39:59,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25196/203307 [28:40:10<202:39:57,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25196/203307 [28:40:10<202:39:57,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25197/203307 [28:40:14<202:39:50,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25197/203307 [28:40:14<202:39:50,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25198/203307 [28:40:18<202:39:44,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25198/203307 [28:40:18<202:39:44,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25199/203307 [28:40:22<202:39:43,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25199/203307 [28:40:22<202:39:43,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25200/203307 [28:40:26<202:39:36,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25200/203307 [28:40:26<202:39:36,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25201/203307 [28:40:30<202:39:34,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  12%|█▏        | 25201/203307 [28:40:30<202:39:34,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25202/203307 [28:40:35<202:39:32,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25202/203307 [28:40:35<202:39:32,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25203/203307 [28:40:38<202:39:24,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25203/203307 [28:40:38<202:39:24,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25204/203307 [28:40:42<202:39:22,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25204/203307 [28:40:42<202:39:22,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25205/203307 [28:40:47<202:39:19,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25205/203307 [28:40:47<202:39:19,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25206/203307 [28:40:50<202:39:12,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25206/203307 [28:40:50<202:39:12,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25207/203307 [28:40:54<202:39:05,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25207/203307 [28:40:54<202:39:05,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25208/203307 [28:40:59<202:39:03,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25208/203307 [28:40:59<202:39:03,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25209/203307 [28:41:02<202:38:56,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25209/203307 [28:41:02<202:38:56,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25210/203307 [28:41:07<202:38:55,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25210/203307 [28:41:07<202:38:55,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25211/203307 [28:41:11<202:38:51,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25211/203307 [28:41:11<202:38:51,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25212/203307 [28:41:15<202:38:44,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25212/203307 [28:41:15<202:38:44,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25213/203307 [28:41:19<202:38:42,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25213/203307 [28:41:19<202:38:42,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25214/203307 [28:41:23<202:38:35,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25214/203307 [28:41:23<202:38:35,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25215/203307 [28:41:26<202:38:28,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25215/203307 [28:41:26<202:38:28,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25216/203307 [28:41:31<202:38:26,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25216/203307 [28:41:31<202:38:26,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25217/203307 [28:41:34<202:38:19,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25217/203307 [28:41:34<202:38:19,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25218/203307 [28:41:38<202:38:12,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25218/203307 [28:41:38<202:38:12,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25219/203307 [28:41:43<202:38:10,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25219/203307 [28:41:43<202:38:10,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25220/203307 [28:41:46<202:38:03,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25220/203307 [28:41:46<202:38:03,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25221/203307 [28:41:50<202:37:56,  0.24it/s, v_num=t5e6, training/loss=0.0953]Epoch 0:  12%|█▏        | 25221/203307 [28:41:50<202:37:56,  0.24it/s, v_num=t5e6, training/loss=0.094] Epoch 0:  12%|█▏        | 25222/203307 [28:41:54<202:37:54,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25222/203307 [28:41:54<202:37:54,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25223/203307 [28:41:58<202:37:47,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25223/203307 [28:41:58<202:37:47,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25224/203307 [28:42:02<202:37:40,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25224/203307 [28:42:02<202:37:40,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25225/203307 [28:42:06<202:37:39,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25225/203307 [28:42:06<202:37:39,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25226/203307 [28:42:10<202:37:32,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25226/203307 [28:42:10<202:37:32,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25227/203307 [28:42:14<202:37:31,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25227/203307 [28:42:14<202:37:31,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25228/203307 [28:42:19<202:37:28,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25228/203307 [28:42:19<202:37:28,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25229/203307 [28:42:22<202:37:22,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25229/203307 [28:42:22<202:37:22,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25230/203307 [28:42:27<202:37:19,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25230/203307 [28:42:27<202:37:19,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25231/203307 [28:42:31<202:37:17,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25231/203307 [28:42:31<202:37:18,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25232/203307 [28:42:35<202:37:10,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25232/203307 [28:42:35<202:37:10,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25233/203307 [28:42:39<202:37:04,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25233/203307 [28:42:39<202:37:04,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25234/203307 [28:42:43<202:37:03,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25234/203307 [28:42:43<202:37:03,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25235/203307 [28:42:47<202:36:56,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25235/203307 [28:42:47<202:36:56,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25236/203307 [28:42:51<202:36:54,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25236/203307 [28:42:51<202:36:54,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25237/203307 [28:42:55<202:36:51,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25237/203307 [28:42:56<202:36:51,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25238/203307 [28:42:59<202:36:44,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25238/203307 [28:42:59<202:36:44,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25239/203307 [28:43:04<202:36:42,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25239/203307 [28:43:04<202:36:42,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25240/203307 [28:43:08<202:36:39,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25240/203307 [28:43:08<202:36:39,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25241/203307 [28:43:11<202:36:32,  0.24it/s, v_num=t5e6, training/loss=0.094]Epoch 0:  12%|█▏        | 25241/203307 [28:43:11<202:36:32,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25242/203307 [28:43:16<202:36:30,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25242/203307 [28:43:16<202:36:30,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25243/203307 [28:43:20<202:36:23,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25243/203307 [28:43:20<202:36:23,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25244/203307 [28:43:23<202:36:16,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25244/203307 [28:43:23<202:36:16,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25245/203307 [28:43:28<202:36:14,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25245/203307 [28:43:28<202:36:14,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25246/203307 [28:43:31<202:36:08,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25246/203307 [28:43:31<202:36:08,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25247/203307 [28:43:35<202:36:01,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25247/203307 [28:43:35<202:36:01,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25248/203307 [28:43:39<202:35:58,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25248/203307 [28:43:39<202:35:58,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25249/203307 [28:43:43<202:35:54,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25249/203307 [28:43:43<202:35:54,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25250/203307 [28:43:47<202:35:47,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25250/203307 [28:43:47<202:35:47,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25251/203307 [28:43:52<202:35:45,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25251/203307 [28:43:52<202:35:45,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25252/203307 [28:43:55<202:35:37,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25252/203307 [28:43:55<202:35:37,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25253/203307 [28:43:59<202:35:35,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25253/203307 [28:43:59<202:35:35,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25254/203307 [28:44:04<202:35:31,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25254/203307 [28:44:04<202:35:32,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25255/203307 [28:44:07<202:35:25,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25255/203307 [28:44:07<202:35:25,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25256/203307 [28:44:12<202:35:22,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25256/203307 [28:44:12<202:35:22,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25257/203307 [28:44:16<202:35:19,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25257/203307 [28:44:16<202:35:19,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25258/203307 [28:44:20<202:35:16,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25258/203307 [28:44:20<202:35:16,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25259/203307 [28:44:24<202:35:09,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25259/203307 [28:44:24<202:35:09,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25260/203307 [28:44:28<202:35:07,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25260/203307 [28:44:28<202:35:07,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25261/203307 [28:44:32<202:35:00,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25261/203307 [28:44:32<202:35:00,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25262/203307 [28:44:36<202:34:58,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25262/203307 [28:44:36<202:34:58,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25263/203307 [28:44:41<202:34:55,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25263/203307 [28:44:41<202:34:55,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25264/203307 [28:44:44<202:34:48,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25264/203307 [28:44:44<202:34:48,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25265/203307 [28:44:49<202:34:46,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25265/203307 [28:44:49<202:34:46,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25266/203307 [28:44:52<202:34:39,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25266/203307 [28:44:52<202:34:39,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25267/203307 [28:44:57<202:34:36,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25267/203307 [28:44:57<202:34:36,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25268/203307 [28:45:01<202:34:34,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25268/203307 [28:45:01<202:34:34,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25269/203307 [28:45:05<202:34:27,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25269/203307 [28:45:05<202:34:27,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25270/203307 [28:45:08<202:34:19,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25270/203307 [28:45:08<202:34:19,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25271/203307 [28:45:13<202:34:18,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25271/203307 [28:45:13<202:34:18,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25272/203307 [28:45:17<202:34:12,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25272/203307 [28:45:17<202:34:12,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25273/203307 [28:45:20<202:34:06,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25273/203307 [28:45:20<202:34:06,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25274/203307 [28:45:25<202:34:03,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25274/203307 [28:45:25<202:34:03,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25275/203307 [28:45:29<202:33:57,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25275/203307 [28:45:29<202:33:57,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25276/203307 [28:45:33<202:33:54,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25276/203307 [28:45:33<202:33:54,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25277/203307 [28:45:37<202:33:53,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25277/203307 [28:45:37<202:33:53,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25278/203307 [28:45:41<202:33:47,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25278/203307 [28:45:41<202:33:47,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25279/203307 [28:45:46<202:33:45,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25279/203307 [28:45:46<202:33:45,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25280/203307 [28:45:50<202:33:43,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25280/203307 [28:45:50<202:33:43,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25281/203307 [28:45:54<202:33:37,  0.24it/s, v_num=t5e6, training/loss=0.0919]Epoch 0:  12%|█▏        | 25281/203307 [28:45:54<202:33:37,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25282/203307 [28:45:58<202:33:34,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25282/203307 [28:45:58<202:33:34,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25283/203307 [28:46:02<202:33:31,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25283/203307 [28:46:02<202:33:31,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25284/203307 [28:46:06<202:33:24,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25284/203307 [28:46:06<202:33:24,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25285/203307 [28:46:10<202:33:22,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25285/203307 [28:46:10<202:33:22,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25286/203307 [28:46:15<202:33:21,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25286/203307 [28:46:15<202:33:21,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25287/203307 [28:46:19<202:33:14,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25287/203307 [28:46:19<202:33:14,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25288/203307 [28:46:23<202:33:13,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25288/203307 [28:46:23<202:33:13,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25289/203307 [28:46:27<202:33:10,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25289/203307 [28:46:27<202:33:10,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25290/203307 [28:46:31<202:33:04,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25290/203307 [28:46:31<202:33:04,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25291/203307 [28:46:36<202:33:02,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25291/203307 [28:46:36<202:33:02,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25292/203307 [28:46:39<202:32:56,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25292/203307 [28:46:39<202:32:56,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25293/203307 [28:46:43<202:32:49,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25293/203307 [28:46:43<202:32:49,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25294/203307 [28:46:47<202:32:47,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25294/203307 [28:46:47<202:32:47,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25295/203307 [28:46:51<202:32:41,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25295/203307 [28:46:51<202:32:41,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25296/203307 [28:46:55<202:32:34,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25296/203307 [28:46:55<202:32:34,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25297/203307 [28:46:59<202:32:33,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25297/203307 [28:46:59<202:32:33,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25298/203307 [28:47:03<202:32:25,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25298/203307 [28:47:03<202:32:25,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25299/203307 [28:47:07<202:32:18,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25299/203307 [28:47:07<202:32:18,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25300/203307 [28:47:11<202:32:17,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25300/203307 [28:47:11<202:32:17,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25301/203307 [28:47:15<202:32:09,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  12%|█▏        | 25301/203307 [28:47:15<202:32:09,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25302/203307 [28:47:19<202:32:03,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25302/203307 [28:47:19<202:32:03,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25303/203307 [28:47:23<202:32:02,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25303/203307 [28:47:23<202:32:02,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25304/203307 [28:47:27<202:31:57,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25304/203307 [28:47:27<202:31:57,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25305/203307 [28:47:31<202:31:55,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25305/203307 [28:47:31<202:31:55,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25306/203307 [28:47:36<202:31:52,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25306/203307 [28:47:36<202:31:52,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25307/203307 [28:47:39<202:31:45,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25307/203307 [28:47:39<202:31:45,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25308/203307 [28:47:44<202:31:42,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25308/203307 [28:47:44<202:31:43,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25309/203307 [28:47:48<202:31:40,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25309/203307 [28:47:48<202:31:40,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25310/203307 [28:47:52<202:31:32,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25310/203307 [28:47:52<202:31:33,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25311/203307 [28:47:55<202:31:25,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25311/203307 [28:47:55<202:31:25,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25312/203307 [28:48:00<202:31:23,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25312/203307 [28:48:00<202:31:23,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25313/203307 [28:48:03<202:31:16,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25313/203307 [28:48:03<202:31:16,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25314/203307 [28:48:08<202:31:15,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25314/203307 [28:48:08<202:31:15,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25315/203307 [28:48:12<202:31:08,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25315/203307 [28:48:12<202:31:08,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25316/203307 [28:48:15<202:31:01,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25316/203307 [28:48:15<202:31:01,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25317/203307 [28:48:20<202:31:00,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25317/203307 [28:48:20<202:31:00,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25318/203307 [28:48:24<202:30:54,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25318/203307 [28:48:24<202:30:54,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25319/203307 [28:48:27<202:30:47,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25319/203307 [28:48:27<202:30:47,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25320/203307 [28:48:32<202:30:46,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25320/203307 [28:48:32<202:30:46,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25321/203307 [28:48:36<202:30:43,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  12%|█▏        | 25321/203307 [28:48:36<202:30:43,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25322/203307 [28:48:40<202:30:40,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25322/203307 [28:48:40<202:30:40,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25323/203307 [28:48:45<202:30:40,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25323/203307 [28:48:45<202:30:40,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25324/203307 [28:48:49<202:30:33,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25324/203307 [28:48:49<202:30:33,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25325/203307 [28:48:52<202:30:26,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25325/203307 [28:48:52<202:30:26,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25326/203307 [28:48:57<202:30:25,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25326/203307 [28:48:57<202:30:25,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25327/203307 [28:49:01<202:30:18,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25327/203307 [28:49:01<202:30:18,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25328/203307 [28:49:04<202:30:11,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25328/203307 [28:49:04<202:30:11,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25329/203307 [28:49:09<202:30:10,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25329/203307 [28:49:09<202:30:10,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25330/203307 [28:49:13<202:30:07,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25330/203307 [28:49:13<202:30:07,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25331/203307 [28:49:18<202:30:06,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25331/203307 [28:49:18<202:30:06,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25332/203307 [28:49:21<202:29:59,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25332/203307 [28:49:21<202:29:59,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25333/203307 [28:49:25<202:29:53,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25333/203307 [28:49:25<202:29:53,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25334/203307 [28:49:30<202:29:51,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25334/203307 [28:49:30<202:29:51,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25335/203307 [28:49:34<202:29:48,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25335/203307 [28:49:34<202:29:49,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25336/203307 [28:49:38<202:29:42,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25336/203307 [28:49:38<202:29:42,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25337/203307 [28:49:41<202:29:35,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25337/203307 [28:49:41<202:29:35,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25338/203307 [28:49:46<202:29:33,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25338/203307 [28:49:46<202:29:33,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25339/203307 [28:49:50<202:29:31,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25339/203307 [28:49:50<202:29:31,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25340/203307 [28:49:54<202:29:29,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25340/203307 [28:49:54<202:29:29,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25341/203307 [28:49:58<202:29:22,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25341/203307 [28:49:58<202:29:22,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25342/203307 [28:50:02<202:29:15,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25342/203307 [28:50:02<202:29:15,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25343/203307 [28:50:06<202:29:12,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25343/203307 [28:50:06<202:29:12,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25344/203307 [28:50:10<202:29:06,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25344/203307 [28:50:10<202:29:06,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25345/203307 [28:50:14<202:28:59,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25345/203307 [28:50:14<202:28:59,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25346/203307 [28:50:18<202:28:58,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25346/203307 [28:50:18<202:28:58,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25347/203307 [28:50:22<202:28:55,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25347/203307 [28:50:22<202:28:55,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25348/203307 [28:50:27<202:28:52,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25348/203307 [28:50:27<202:28:52,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25349/203307 [28:50:31<202:28:50,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25349/203307 [28:50:31<202:28:50,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25350/203307 [28:50:35<202:28:44,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25350/203307 [28:50:35<202:28:44,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25351/203307 [28:50:39<202:28:38,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25351/203307 [28:50:39<202:28:38,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25352/203307 [28:50:43<202:28:36,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25352/203307 [28:50:43<202:28:36,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25353/203307 [28:50:47<202:28:29,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25353/203307 [28:50:47<202:28:29,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25354/203307 [28:50:50<202:28:22,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25354/203307 [28:50:50<202:28:22,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25355/203307 [28:50:55<202:28:21,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25355/203307 [28:50:55<202:28:21,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25356/203307 [28:50:59<202:28:18,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25356/203307 [28:50:59<202:28:18,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25357/203307 [28:51:04<202:28:16,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25357/203307 [28:51:04<202:28:16,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25358/203307 [28:51:08<202:28:10,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25358/203307 [28:51:08<202:28:10,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25359/203307 [28:51:11<202:28:03,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25359/203307 [28:51:11<202:28:03,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25360/203307 [28:51:16<202:28:01,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25360/203307 [28:51:16<202:28:01,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25361/203307 [28:51:20<202:27:59,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  12%|█▏        | 25361/203307 [28:51:20<202:27:59,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25362/203307 [28:51:24<202:27:52,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25362/203307 [28:51:24<202:27:52,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25363/203307 [28:51:27<202:27:45,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25363/203307 [28:51:27<202:27:45,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25364/203307 [28:51:32<202:27:44,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25364/203307 [28:51:32<202:27:44,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25365/203307 [28:51:36<202:27:37,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25365/203307 [28:51:36<202:27:37,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25366/203307 [28:51:40<202:27:35,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25366/203307 [28:51:40<202:27:35,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25367/203307 [28:51:44<202:27:28,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25367/203307 [28:51:44<202:27:28,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25368/203307 [28:51:47<202:27:21,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25368/203307 [28:51:47<202:27:21,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25369/203307 [28:51:52<202:27:19,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25369/203307 [28:51:52<202:27:19,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25370/203307 [28:51:55<202:27:13,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25370/203307 [28:51:56<202:27:13,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25371/203307 [28:51:59<202:27:07,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25371/203307 [28:51:59<202:27:07,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25372/203307 [28:52:04<202:27:05,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25372/203307 [28:52:04<202:27:05,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25373/203307 [28:52:08<202:26:59,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25373/203307 [28:52:08<202:26:59,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25374/203307 [28:52:11<202:26:52,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25374/203307 [28:52:11<202:26:52,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25375/203307 [28:52:16<202:26:50,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25375/203307 [28:52:16<202:26:50,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25376/203307 [28:52:19<202:26:44,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25376/203307 [28:52:19<202:26:44,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25377/203307 [28:52:23<202:26:38,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25377/203307 [28:52:23<202:26:38,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25378/203307 [28:52:28<202:26:37,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25378/203307 [28:52:28<202:26:37,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25379/203307 [28:52:32<202:26:30,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25379/203307 [28:52:32<202:26:30,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25380/203307 [28:52:35<202:26:24,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25380/203307 [28:52:35<202:26:24,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25381/203307 [28:52:40<202:26:23,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  12%|█▏        | 25381/203307 [28:52:40<202:26:23,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25382/203307 [28:52:44<202:26:17,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25382/203307 [28:52:44<202:26:17,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25383/203307 [28:52:48<202:26:15,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25383/203307 [28:52:48<202:26:15,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25384/203307 [28:52:52<202:26:12,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25384/203307 [28:52:52<202:26:12,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25385/203307 [28:52:56<202:26:05,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25385/203307 [28:52:56<202:26:06,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25386/203307 [28:53:01<202:26:04,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25386/203307 [28:53:01<202:26:04,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25387/203307 [28:53:05<202:26:02,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25387/203307 [28:53:05<202:26:02,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25388/203307 [28:53:09<202:25:55,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25388/203307 [28:53:09<202:25:55,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25389/203307 [28:53:13<202:25:53,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25389/203307 [28:53:13<202:25:53,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25390/203307 [28:53:17<202:25:51,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25390/203307 [28:53:17<202:25:51,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25391/203307 [28:53:21<202:25:44,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25391/203307 [28:53:21<202:25:44,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25392/203307 [28:53:26<202:25:43,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25392/203307 [28:53:26<202:25:43,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25393/203307 [28:53:30<202:25:39,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25393/203307 [28:53:30<202:25:39,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25394/203307 [28:53:34<202:25:33,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25394/203307 [28:53:34<202:25:33,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25395/203307 [28:53:38<202:25:30,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25395/203307 [28:53:38<202:25:31,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25396/203307 [28:53:42<202:25:24,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25396/203307 [28:53:42<202:25:24,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25397/203307 [28:53:46<202:25:21,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25397/203307 [28:53:46<202:25:21,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25398/203307 [28:53:50<202:25:20,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25398/203307 [28:53:50<202:25:20,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25399/203307 [28:53:54<202:25:13,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25399/203307 [28:53:54<202:25:14,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25400/203307 [28:53:58<202:25:07,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25400/203307 [28:53:58<202:25:07,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25401/203307 [28:54:02<202:25:06,  0.24it/s, v_num=t5e6, training/loss=0.0846]Epoch 0:  12%|█▏        | 25401/203307 [28:54:02<202:25:06,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25402/203307 [28:54:07<202:25:02,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25402/203307 [28:54:07<202:25:02,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25403/203307 [28:54:10<202:24:56,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25403/203307 [28:54:10<202:24:56,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25404/203307 [28:54:15<202:24:53,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25404/203307 [28:54:15<202:24:53,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25405/203307 [28:54:18<202:24:46,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25405/203307 [28:54:18<202:24:46,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25406/203307 [28:54:23<202:24:44,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25406/203307 [28:54:23<202:24:44,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25407/203307 [28:54:27<202:24:43,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25407/203307 [28:54:27<202:24:43,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25408/203307 [28:54:31<202:24:36,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25408/203307 [28:54:31<202:24:36,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25409/203307 [28:54:35<202:24:34,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25409/203307 [28:54:35<202:24:34,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25410/203307 [28:54:39<202:24:28,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25410/203307 [28:54:39<202:24:28,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25411/203307 [28:54:43<202:24:24,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25411/203307 [28:54:43<202:24:24,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25412/203307 [28:54:48<202:24:22,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25412/203307 [28:54:48<202:24:22,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25413/203307 [28:54:52<202:24:19,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  12%|█▏        | 25413/203307 [28:54:52<202:24:19,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  13%|█▎        | 25414/203307 [28:54:56<202:24:15,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  13%|█▎        | 25414/203307 [28:54:56<202:24:15,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  13%|█▎        | 25415/203307 [28:55:00<202:24:08,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  13%|█▎        | 25415/203307 [28:55:00<202:24:08,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  13%|█▎        | 25416/203307 [28:55:04<202:24:07,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  13%|█▎        | 25416/203307 [28:55:04<202:24:07,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  13%|█▎        | 25417/203307 [28:55:08<202:24:01,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  13%|█▎        | 25417/203307 [28:55:08<202:24:01,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  13%|█▎        | 25418/203307 [28:55:13<202:23:59,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  13%|█▎        | 25418/203307 [28:55:13<202:23:59,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  13%|█▎        | 25419/203307 [28:55:16<202:23:52,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  13%|█▎        | 25419/203307 [28:55:16<202:23:52,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  13%|█▎        | 25420/203307 [28:55:20<202:23:48,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  13%|█▎        | 25420/203307 [28:55:20<202:23:48,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  13%|█▎        | 25421/203307 [28:55:25<202:23:46,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  13%|█▎        | 25421/203307 [28:55:25<202:23:46,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25422/203307 [28:55:29<202:23:44,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25422/203307 [28:55:29<202:23:44,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25423/203307 [28:55:33<202:23:37,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25423/203307 [28:55:33<202:23:37,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25424/203307 [28:55:37<202:23:35,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25424/203307 [28:55:37<202:23:35,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25425/203307 [28:55:41<202:23:29,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25425/203307 [28:55:41<202:23:29,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25426/203307 [28:55:45<202:23:22,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25426/203307 [28:55:45<202:23:22,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25427/203307 [28:55:49<202:23:21,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25427/203307 [28:55:49<202:23:21,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25428/203307 [28:55:53<202:23:13,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25428/203307 [28:55:53<202:23:13,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25429/203307 [28:55:57<202:23:11,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25429/203307 [28:55:57<202:23:11,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25430/203307 [28:56:01<202:23:08,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25430/203307 [28:56:01<202:23:08,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25431/203307 [28:56:06<202:23:05,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25431/203307 [28:56:06<202:23:05,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25432/203307 [28:56:09<202:22:58,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25432/203307 [28:56:09<202:22:58,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25433/203307 [28:56:14<202:22:57,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25433/203307 [28:56:14<202:22:57,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25434/203307 [28:56:18<202:22:50,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25434/203307 [28:56:18<202:22:50,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25435/203307 [28:56:22<202:22:48,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25435/203307 [28:56:22<202:22:48,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25436/203307 [28:56:26<202:22:41,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25436/203307 [28:56:26<202:22:41,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25437/203307 [28:56:29<202:22:34,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25437/203307 [28:56:29<202:22:34,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25438/203307 [28:56:34<202:22:31,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25438/203307 [28:56:34<202:22:31,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25439/203307 [28:56:38<202:22:29,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25439/203307 [28:56:38<202:22:29,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25440/203307 [28:56:42<202:22:22,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25440/203307 [28:56:42<202:22:22,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25441/203307 [28:56:45<202:22:16,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 25441/203307 [28:56:45<202:22:16,  0.24it/s, v_num=t5e6, training/loss=0.087] Epoch 0:  13%|█▎        | 25442/203307 [28:56:50<202:22:14,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25442/203307 [28:56:50<202:22:14,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25443/203307 [28:56:54<202:22:07,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25443/203307 [28:56:54<202:22:07,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25444/203307 [28:56:58<202:22:05,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25444/203307 [28:56:58<202:22:05,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25445/203307 [28:57:02<202:21:59,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25445/203307 [28:57:02<202:21:59,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25446/203307 [28:57:05<202:21:52,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25446/203307 [28:57:05<202:21:52,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25447/203307 [28:57:10<202:21:50,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25447/203307 [28:57:10<202:21:50,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25448/203307 [28:57:14<202:21:43,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25448/203307 [28:57:14<202:21:43,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25449/203307 [28:57:17<202:21:37,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25449/203307 [28:57:17<202:21:37,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25450/203307 [28:57:22<202:21:36,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25450/203307 [28:57:22<202:21:36,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25451/203307 [28:57:26<202:21:29,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25451/203307 [28:57:26<202:21:29,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25452/203307 [28:57:29<202:21:23,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25452/203307 [28:57:29<202:21:23,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25453/203307 [28:57:34<202:21:22,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25453/203307 [28:57:34<202:21:22,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25454/203307 [28:57:38<202:21:15,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25454/203307 [28:57:38<202:21:15,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25455/203307 [28:57:41<202:21:09,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25455/203307 [28:57:41<202:21:09,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25456/203307 [28:57:46<202:21:07,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25456/203307 [28:57:46<202:21:07,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25457/203307 [28:57:49<202:21:00,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25457/203307 [28:57:49<202:21:00,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25458/203307 [28:57:53<202:20:53,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25458/203307 [28:57:53<202:20:54,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25459/203307 [28:57:58<202:20:53,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25459/203307 [28:57:58<202:20:53,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25460/203307 [28:58:01<202:20:45,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25460/203307 [28:58:01<202:20:45,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25461/203307 [28:58:06<202:20:44,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  13%|█▎        | 25461/203307 [28:58:06<202:20:45,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25462/203307 [28:58:10<202:20:38,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25462/203307 [28:58:10<202:20:38,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25463/203307 [28:58:13<202:20:31,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25463/203307 [28:58:13<202:20:31,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25464/203307 [28:58:18<202:20:29,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25464/203307 [28:58:18<202:20:29,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25465/203307 [28:58:22<202:20:26,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25465/203307 [28:58:22<202:20:26,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25466/203307 [28:58:26<202:20:19,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25466/203307 [28:58:26<202:20:19,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25467/203307 [28:58:30<202:20:13,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25467/203307 [28:58:30<202:20:14,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25468/203307 [28:58:34<202:20:13,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25468/203307 [28:58:34<202:20:13,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25469/203307 [28:58:38<202:20:07,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25469/203307 [28:58:38<202:20:07,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25470/203307 [28:58:43<202:20:05,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25470/203307 [28:58:43<202:20:05,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25471/203307 [28:58:46<202:19:58,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25471/203307 [28:58:46<202:19:58,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25472/203307 [28:58:50<202:19:55,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25472/203307 [28:58:50<202:19:55,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25473/203307 [28:58:55<202:19:53,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25473/203307 [28:58:55<202:19:53,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25474/203307 [28:58:59<202:19:50,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25474/203307 [28:58:59<202:19:50,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25475/203307 [28:59:03<202:19:43,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25475/203307 [28:59:03<202:19:43,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25476/203307 [28:59:07<202:19:42,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25476/203307 [28:59:07<202:19:42,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25477/203307 [28:59:11<202:19:35,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25477/203307 [28:59:11<202:19:35,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25478/203307 [28:59:15<202:19:29,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25478/203307 [28:59:15<202:19:29,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25479/203307 [28:59:19<202:19:28,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25479/203307 [28:59:19<202:19:28,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25480/203307 [28:59:23<202:19:20,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25480/203307 [28:59:23<202:19:20,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25481/203307 [28:59:27<202:19:18,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 25481/203307 [28:59:27<202:19:18,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25482/203307 [28:59:32<202:19:16,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25482/203307 [28:59:32<202:19:16,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25483/203307 [28:59:36<202:19:12,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25483/203307 [28:59:36<202:19:12,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25484/203307 [28:59:40<202:19:06,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25484/203307 [28:59:40<202:19:06,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25485/203307 [28:59:44<202:19:05,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25485/203307 [28:59:44<202:19:05,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25486/203307 [28:59:48<202:18:58,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25486/203307 [28:59:48<202:18:58,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25487/203307 [28:59:52<202:18:56,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25487/203307 [28:59:52<202:18:56,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25488/203307 [28:59:56<202:18:49,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25488/203307 [28:59:56<202:18:49,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25489/203307 [29:00:00<202:18:46,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25489/203307 [29:00:00<202:18:46,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25490/203307 [29:00:04<202:18:44,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25490/203307 [29:00:04<202:18:44,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25491/203307 [29:00:09<202:18:41,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25491/203307 [29:00:09<202:18:41,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25492/203307 [29:00:13<202:18:38,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25492/203307 [29:00:13<202:18:38,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25493/203307 [29:00:17<202:18:31,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25493/203307 [29:00:17<202:18:31,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25494/203307 [29:00:21<202:18:29,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25494/203307 [29:00:21<202:18:29,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25495/203307 [29:00:25<202:18:22,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25495/203307 [29:00:25<202:18:22,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25496/203307 [29:00:29<202:18:19,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25496/203307 [29:00:29<202:18:19,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25497/203307 [29:00:33<202:18:16,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25497/203307 [29:00:33<202:18:16,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25498/203307 [29:00:37<202:18:09,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25498/203307 [29:00:37<202:18:09,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25499/203307 [29:00:41<202:18:07,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25499/203307 [29:00:41<202:18:07,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25500/203307 [29:00:45<202:18:00,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25500/203307 [29:00:45<202:18:00,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25501/203307 [29:00:49<202:17:57,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25501/203307 [29:00:49<202:17:57,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25502/203307 [29:00:54<202:17:55,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25502/203307 [29:00:54<202:17:55,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25503/203307 [29:00:57<202:17:48,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25503/203307 [29:00:57<202:17:48,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25504/203307 [29:01:01<202:17:42,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25504/203307 [29:01:01<202:17:42,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25505/203307 [29:01:06<202:17:40,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25505/203307 [29:01:06<202:17:40,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25506/203307 [29:01:10<202:17:37,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25506/203307 [29:01:10<202:17:38,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25507/203307 [29:01:14<202:17:31,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25507/203307 [29:01:14<202:17:31,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25508/203307 [29:01:18<202:17:29,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25508/203307 [29:01:18<202:17:29,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25509/203307 [29:01:22<202:17:22,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25509/203307 [29:01:22<202:17:22,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25510/203307 [29:01:26<202:17:20,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25510/203307 [29:01:26<202:17:20,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25511/203307 [29:01:31<202:17:18,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25511/203307 [29:01:31<202:17:18,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25512/203307 [29:01:34<202:17:12,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25512/203307 [29:01:34<202:17:12,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25513/203307 [29:01:39<202:17:10,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25513/203307 [29:01:39<202:17:11,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25514/203307 [29:01:43<202:17:08,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25514/203307 [29:01:43<202:17:08,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25515/203307 [29:01:47<202:17:01,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25515/203307 [29:01:47<202:17:01,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25516/203307 [29:01:51<202:16:59,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25516/203307 [29:01:51<202:16:59,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25517/203307 [29:01:56<202:16:57,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25517/203307 [29:01:56<202:16:57,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25518/203307 [29:01:59<202:16:50,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25518/203307 [29:01:59<202:16:50,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25519/203307 [29:02:04<202:16:47,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25519/203307 [29:02:04<202:16:47,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25520/203307 [29:02:08<202:16:45,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25520/203307 [29:02:08<202:16:45,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25521/203307 [29:02:12<202:16:38,  0.24it/s, v_num=t5e6, training/loss=0.0907]Epoch 0:  13%|█▎        | 25521/203307 [29:02:12<202:16:38,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25522/203307 [29:02:16<202:16:37,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25522/203307 [29:02:16<202:16:37,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25523/203307 [29:02:20<202:16:30,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25523/203307 [29:02:20<202:16:30,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25524/203307 [29:02:24<202:16:23,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25524/203307 [29:02:24<202:16:23,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25525/203307 [29:02:28<202:16:21,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25525/203307 [29:02:28<202:16:21,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25526/203307 [29:02:32<202:16:15,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25526/203307 [29:02:32<202:16:15,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25527/203307 [29:02:35<202:16:08,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25527/203307 [29:02:35<202:16:08,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25528/203307 [29:02:40<202:16:06,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25528/203307 [29:02:40<202:16:06,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25529/203307 [29:02:44<202:15:59,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25529/203307 [29:02:44<202:15:59,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25530/203307 [29:02:47<202:15:53,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25530/203307 [29:02:47<202:15:53,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25531/203307 [29:02:52<202:15:51,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25531/203307 [29:02:52<202:15:51,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25532/203307 [29:02:55<202:15:44,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25532/203307 [29:02:56<202:15:45,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25533/203307 [29:02:59<202:15:38,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25533/203307 [29:02:59<202:15:38,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25534/203307 [29:03:04<202:15:35,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25534/203307 [29:03:04<202:15:35,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25535/203307 [29:03:07<202:15:28,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25535/203307 [29:03:07<202:15:28,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25536/203307 [29:03:11<202:15:21,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25536/203307 [29:03:11<202:15:21,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25537/203307 [29:03:15<202:15:20,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25537/203307 [29:03:15<202:15:20,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25538/203307 [29:03:19<202:15:13,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25538/203307 [29:03:19<202:15:13,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25539/203307 [29:03:23<202:15:11,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25539/203307 [29:03:23<202:15:11,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25540/203307 [29:03:27<202:15:04,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25540/203307 [29:03:27<202:15:04,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25541/203307 [29:03:31<202:14:57,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 25541/203307 [29:03:31<202:14:57,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25542/203307 [29:03:35<202:14:54,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25542/203307 [29:03:35<202:14:55,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25543/203307 [29:03:39<202:14:51,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25543/203307 [29:03:39<202:14:51,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25544/203307 [29:03:43<202:14:44,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25544/203307 [29:03:43<202:14:44,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25545/203307 [29:03:47<202:14:37,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25545/203307 [29:03:47<202:14:37,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25546/203307 [29:03:51<202:14:35,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25546/203307 [29:03:51<202:14:35,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25547/203307 [29:03:55<202:14:32,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25547/203307 [29:03:55<202:14:32,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25548/203307 [29:04:00<202:14:30,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25548/203307 [29:04:00<202:14:30,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25549/203307 [29:04:03<202:14:22,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25549/203307 [29:04:03<202:14:23,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25550/203307 [29:04:07<202:14:15,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25550/203307 [29:04:07<202:14:16,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25551/203307 [29:04:11<202:14:13,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25551/203307 [29:04:11<202:14:13,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25552/203307 [29:04:15<202:14:07,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25552/203307 [29:04:15<202:14:07,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25553/203307 [29:04:19<202:14:00,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25553/203307 [29:04:19<202:14:00,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25554/203307 [29:04:23<202:13:58,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25554/203307 [29:04:23<202:13:58,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25555/203307 [29:04:28<202:13:55,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25555/203307 [29:04:28<202:13:55,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25556/203307 [29:04:32<202:13:53,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25556/203307 [29:04:32<202:13:53,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25557/203307 [29:04:36<202:13:51,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25557/203307 [29:04:36<202:13:51,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25558/203307 [29:04:40<202:13:44,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25558/203307 [29:04:40<202:13:44,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25559/203307 [29:04:44<202:13:38,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25559/203307 [29:04:44<202:13:38,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25560/203307 [29:04:48<202:13:35,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25560/203307 [29:04:48<202:13:36,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25561/203307 [29:04:52<202:13:28,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 25561/203307 [29:04:52<202:13:28,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25562/203307 [29:04:55<202:13:21,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25562/203307 [29:04:55<202:13:21,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25563/203307 [29:05:00<202:13:20,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25563/203307 [29:05:00<202:13:20,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25564/203307 [29:05:04<202:13:17,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25564/203307 [29:05:04<202:13:17,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25565/203307 [29:05:09<202:13:16,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25565/203307 [29:05:09<202:13:16,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25566/203307 [29:05:12<202:13:09,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25566/203307 [29:05:12<202:13:09,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25567/203307 [29:05:16<202:13:02,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25567/203307 [29:05:16<202:13:02,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25568/203307 [29:05:21<202:13:00,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25568/203307 [29:05:21<202:13:00,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25569/203307 [29:05:25<202:12:58,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25569/203307 [29:05:25<202:12:58,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25570/203307 [29:05:29<202:12:52,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25570/203307 [29:05:29<202:12:52,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25571/203307 [29:05:32<202:12:44,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25571/203307 [29:05:32<202:12:44,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25572/203307 [29:05:37<202:12:43,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25572/203307 [29:05:37<202:12:43,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25573/203307 [29:05:41<202:12:40,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25573/203307 [29:05:41<202:12:40,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25574/203307 [29:05:45<202:12:38,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25574/203307 [29:05:45<202:12:38,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25575/203307 [29:05:49<202:12:30,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25575/203307 [29:05:49<202:12:30,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25576/203307 [29:05:53<202:12:25,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25576/203307 [29:05:53<202:12:25,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25577/203307 [29:05:57<202:12:22,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25577/203307 [29:05:57<202:12:22,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25578/203307 [29:06:01<202:12:16,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25578/203307 [29:06:01<202:12:16,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25579/203307 [29:06:05<202:12:09,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25579/203307 [29:06:05<202:12:09,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25580/203307 [29:06:09<202:12:09,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25580/203307 [29:06:09<202:12:09,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25581/203307 [29:06:14<202:12:06,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 25581/203307 [29:06:14<202:12:06,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25582/203307 [29:06:18<202:12:02,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25582/203307 [29:06:18<202:12:02,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25583/203307 [29:06:22<202:12:01,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25583/203307 [29:06:22<202:12:01,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25584/203307 [29:06:26<202:11:54,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25584/203307 [29:06:26<202:11:54,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25585/203307 [29:06:30<202:11:48,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25585/203307 [29:06:30<202:11:48,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25586/203307 [29:06:34<202:11:46,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25586/203307 [29:06:34<202:11:46,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25587/203307 [29:06:38<202:11:39,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25587/203307 [29:06:38<202:11:39,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25588/203307 [29:06:42<202:11:33,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25588/203307 [29:06:42<202:11:33,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25589/203307 [29:06:46<202:11:31,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25589/203307 [29:06:46<202:11:31,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25590/203307 [29:06:50<202:11:24,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25590/203307 [29:06:50<202:11:24,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25591/203307 [29:06:54<202:11:22,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25591/203307 [29:06:54<202:11:22,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25592/203307 [29:06:58<202:11:16,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25592/203307 [29:06:58<202:11:16,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25593/203307 [29:07:02<202:11:09,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25593/203307 [29:07:02<202:11:09,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25594/203307 [29:07:06<202:11:06,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25594/203307 [29:07:06<202:11:06,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25595/203307 [29:07:10<202:11:04,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25595/203307 [29:07:10<202:11:04,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25596/203307 [29:07:14<202:10:57,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25596/203307 [29:07:14<202:10:57,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25597/203307 [29:07:18<202:10:54,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25597/203307 [29:07:18<202:10:55,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25598/203307 [29:07:23<202:10:53,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25598/203307 [29:07:23<202:10:53,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25599/203307 [29:07:27<202:10:46,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25599/203307 [29:07:27<202:10:46,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25600/203307 [29:07:31<202:10:44,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25600/203307 [29:07:31<202:10:44,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25601/203307 [29:07:35<202:10:38,  0.24it/s, v_num=t5e6, training/loss=0.0943]Epoch 0:  13%|█▎        | 25601/203307 [29:07:35<202:10:38,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25602/203307 [29:07:38<202:10:31,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25602/203307 [29:07:38<202:10:31,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25603/203307 [29:07:43<202:10:29,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25603/203307 [29:07:43<202:10:29,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25604/203307 [29:07:46<202:10:22,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25604/203307 [29:07:46<202:10:22,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25605/203307 [29:07:50<202:10:15,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25605/203307 [29:07:50<202:10:15,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25606/203307 [29:07:55<202:10:14,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25606/203307 [29:07:55<202:10:14,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25607/203307 [29:07:58<202:10:06,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25607/203307 [29:07:58<202:10:06,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25608/203307 [29:08:02<202:10:00,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25608/203307 [29:08:02<202:10:00,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25609/203307 [29:08:06<202:09:57,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25609/203307 [29:08:06<202:09:57,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25610/203307 [29:08:10<202:09:50,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25610/203307 [29:08:10<202:09:50,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25611/203307 [29:08:14<202:09:43,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25611/203307 [29:08:14<202:09:43,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25612/203307 [29:08:18<202:09:42,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25612/203307 [29:08:18<202:09:42,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25613/203307 [29:08:22<202:09:35,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25613/203307 [29:08:22<202:09:35,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25614/203307 [29:08:26<202:09:33,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25614/203307 [29:08:26<202:09:33,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25615/203307 [29:08:31<202:09:31,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25615/203307 [29:08:31<202:09:31,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25616/203307 [29:08:34<202:09:24,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25616/203307 [29:08:34<202:09:24,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25617/203307 [29:08:39<202:09:21,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25617/203307 [29:08:39<202:09:21,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25618/203307 [29:08:43<202:09:18,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25618/203307 [29:08:43<202:09:18,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25619/203307 [29:08:47<202:09:11,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25619/203307 [29:08:47<202:09:12,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25620/203307 [29:08:51<202:09:09,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25620/203307 [29:08:51<202:09:09,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25621/203307 [29:08:55<202:09:06,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  13%|█▎        | 25621/203307 [29:08:55<202:09:06,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25622/203307 [29:08:59<202:09:02,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25622/203307 [29:08:59<202:09:02,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25623/203307 [29:09:03<202:08:55,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25623/203307 [29:09:03<202:08:56,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25624/203307 [29:09:07<202:08:54,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25624/203307 [29:09:07<202:08:54,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25625/203307 [29:09:11<202:08:46,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25625/203307 [29:09:11<202:08:46,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25626/203307 [29:09:15<202:08:44,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25626/203307 [29:09:15<202:08:44,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25627/203307 [29:09:20<202:08:41,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25627/203307 [29:09:20<202:08:41,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25628/203307 [29:09:23<202:08:34,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25628/203307 [29:09:23<202:08:34,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25629/203307 [29:09:28<202:08:31,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25629/203307 [29:09:28<202:08:31,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25630/203307 [29:09:31<202:08:24,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25630/203307 [29:09:31<202:08:24,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25631/203307 [29:09:36<202:08:21,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25631/203307 [29:09:36<202:08:21,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25632/203307 [29:09:40<202:08:19,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25632/203307 [29:09:40<202:08:19,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25633/203307 [29:09:44<202:08:12,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25633/203307 [29:09:44<202:08:12,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25634/203307 [29:09:47<202:08:05,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25634/203307 [29:09:47<202:08:05,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25635/203307 [29:09:52<202:08:03,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25635/203307 [29:09:52<202:08:03,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25636/203307 [29:09:56<202:07:59,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25636/203307 [29:09:56<202:07:59,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25637/203307 [29:09:59<202:07:52,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25637/203307 [29:10:00<202:07:52,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25638/203307 [29:10:04<202:07:50,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25638/203307 [29:10:04<202:07:50,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25639/203307 [29:10:08<202:07:46,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25639/203307 [29:10:08<202:07:46,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25640/203307 [29:10:12<202:07:39,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25640/203307 [29:10:12<202:07:39,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25641/203307 [29:10:16<202:07:38,  0.24it/s, v_num=t5e6, training/loss=0.0994]Epoch 0:  13%|█▎        | 25641/203307 [29:10:16<202:07:38,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25642/203307 [29:10:20<202:07:32,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25642/203307 [29:10:20<202:07:32,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25643/203307 [29:10:24<202:07:30,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25643/203307 [29:10:24<202:07:30,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25644/203307 [29:10:28<202:07:23,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25644/203307 [29:10:28<202:07:23,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25645/203307 [29:10:32<202:07:20,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25645/203307 [29:10:32<202:07:20,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25646/203307 [29:10:36<202:07:16,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25646/203307 [29:10:37<202:07:17,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25647/203307 [29:10:41<202:07:13,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25647/203307 [29:10:41<202:07:13,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25648/203307 [29:10:45<202:07:07,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25648/203307 [29:10:45<202:07:07,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25649/203307 [29:10:48<202:07:00,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25649/203307 [29:10:48<202:07:00,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25650/203307 [29:10:53<202:06:59,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25650/203307 [29:10:53<202:06:59,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25651/203307 [29:10:56<202:06:52,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25651/203307 [29:10:56<202:06:52,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25652/203307 [29:11:01<202:06:50,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25652/203307 [29:11:01<202:06:50,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25653/203307 [29:11:04<202:06:43,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25653/203307 [29:11:05<202:06:43,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25654/203307 [29:11:09<202:06:40,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25654/203307 [29:11:09<202:06:40,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25655/203307 [29:11:13<202:06:38,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25655/203307 [29:11:13<202:06:38,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25656/203307 [29:11:17<202:06:35,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25656/203307 [29:11:17<202:06:35,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25657/203307 [29:11:21<202:06:28,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25657/203307 [29:11:21<202:06:28,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25658/203307 [29:11:25<202:06:26,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25658/203307 [29:11:25<202:06:26,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25659/203307 [29:11:29<202:06:20,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25659/203307 [29:11:29<202:06:20,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25660/203307 [29:11:33<202:06:13,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25660/203307 [29:11:33<202:06:13,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25661/203307 [29:11:37<202:06:11,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  13%|█▎        | 25661/203307 [29:11:37<202:06:11,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25662/203307 [29:11:41<202:06:04,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25662/203307 [29:11:41<202:06:04,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25663/203307 [29:11:45<202:06:01,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25663/203307 [29:11:45<202:06:01,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25664/203307 [29:11:50<202:05:59,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25664/203307 [29:11:50<202:05:59,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25665/203307 [29:11:53<202:05:52,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25665/203307 [29:11:53<202:05:52,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25666/203307 [29:11:57<202:05:45,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25666/203307 [29:11:57<202:05:45,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25667/203307 [29:12:02<202:05:44,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25667/203307 [29:12:02<202:05:44,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25668/203307 [29:12:05<202:05:37,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25668/203307 [29:12:05<202:05:37,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25669/203307 [29:12:10<202:05:35,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25669/203307 [29:12:10<202:05:35,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25670/203307 [29:12:13<202:05:29,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25670/203307 [29:12:13<202:05:29,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25671/203307 [29:12:17<202:05:22,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25671/203307 [29:12:17<202:05:22,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25672/203307 [29:12:22<202:05:20,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25672/203307 [29:12:22<202:05:20,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25673/203307 [29:12:26<202:05:18,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25673/203307 [29:12:26<202:05:18,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25674/203307 [29:12:30<202:05:11,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25674/203307 [29:12:30<202:05:11,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25675/203307 [29:12:33<202:05:05,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25675/203307 [29:12:33<202:05:05,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25676/203307 [29:12:38<202:05:04,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25676/203307 [29:12:38<202:05:04,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25677/203307 [29:12:42<202:04:57,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25677/203307 [29:12:42<202:04:57,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25678/203307 [29:12:46<202:04:55,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25678/203307 [29:12:46<202:04:55,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25679/203307 [29:12:50<202:04:48,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25679/203307 [29:12:50<202:04:48,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25680/203307 [29:12:53<202:04:41,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25680/203307 [29:12:53<202:04:41,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25681/203307 [29:12:58<202:04:39,  0.24it/s, v_num=t5e6, training/loss=0.0814]Epoch 0:  13%|█▎        | 25681/203307 [29:12:58<202:04:39,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25682/203307 [29:13:01<202:04:32,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25682/203307 [29:13:01<202:04:32,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25683/203307 [29:13:05<202:04:25,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25683/203307 [29:13:05<202:04:25,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25684/203307 [29:13:10<202:04:23,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25684/203307 [29:13:10<202:04:23,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25685/203307 [29:13:13<202:04:17,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25685/203307 [29:13:13<202:04:17,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25686/203307 [29:13:17<202:04:10,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25686/203307 [29:13:17<202:04:10,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25687/203307 [29:13:21<202:04:08,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25687/203307 [29:13:22<202:04:08,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25688/203307 [29:13:25<202:04:01,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25688/203307 [29:13:25<202:04:01,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25689/203307 [29:13:29<202:03:59,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25689/203307 [29:13:29<202:03:59,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25690/203307 [29:13:34<202:03:57,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25690/203307 [29:13:34<202:03:57,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25691/203307 [29:13:38<202:03:50,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25691/203307 [29:13:38<202:03:50,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25692/203307 [29:13:41<202:03:43,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25692/203307 [29:13:41<202:03:43,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25693/203307 [29:13:46<202:03:42,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25693/203307 [29:13:46<202:03:42,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25694/203307 [29:13:50<202:03:35,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25694/203307 [29:13:50<202:03:35,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25695/203307 [29:13:54<202:03:33,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25695/203307 [29:13:54<202:03:33,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25696/203307 [29:13:58<202:03:27,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25696/203307 [29:13:58<202:03:27,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25697/203307 [29:14:02<202:03:23,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25697/203307 [29:14:02<202:03:23,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25698/203307 [29:14:06<202:03:21,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25698/203307 [29:14:06<202:03:21,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25699/203307 [29:14:11<202:03:19,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25699/203307 [29:14:11<202:03:19,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25700/203307 [29:14:14<202:03:12,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25700/203307 [29:14:14<202:03:12,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25701/203307 [29:14:18<202:03:06,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 25701/203307 [29:14:18<202:03:06,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25702/203307 [29:14:23<202:03:04,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25702/203307 [29:14:23<202:03:05,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25703/203307 [29:14:26<202:02:58,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25703/203307 [29:14:26<202:02:58,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25704/203307 [29:14:31<202:02:56,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25704/203307 [29:14:31<202:02:56,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25705/203307 [29:14:35<202:02:50,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25705/203307 [29:14:35<202:02:50,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25706/203307 [29:14:39<202:02:47,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25706/203307 [29:14:39<202:02:47,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25707/203307 [29:14:43<202:02:45,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25707/203307 [29:14:43<202:02:45,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25708/203307 [29:14:47<202:02:42,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25708/203307 [29:14:47<202:02:42,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25709/203307 [29:14:51<202:02:35,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25709/203307 [29:14:51<202:02:36,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25710/203307 [29:14:56<202:02:34,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25710/203307 [29:14:56<202:02:34,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25711/203307 [29:14:59<202:02:27,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25711/203307 [29:14:59<202:02:27,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25712/203307 [29:15:03<202:02:20,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25712/203307 [29:15:03<202:02:21,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25713/203307 [29:15:08<202:02:19,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25713/203307 [29:15:08<202:02:19,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25714/203307 [29:15:12<202:02:17,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25714/203307 [29:15:12<202:02:17,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25715/203307 [29:15:16<202:02:10,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25715/203307 [29:15:16<202:02:10,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25716/203307 [29:15:20<202:02:09,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25716/203307 [29:15:20<202:02:09,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25717/203307 [29:15:24<202:02:06,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25717/203307 [29:15:24<202:02:06,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25718/203307 [29:15:28<202:02:00,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25718/203307 [29:15:28<202:02:00,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25719/203307 [29:15:33<202:01:59,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25719/203307 [29:15:33<202:01:59,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25720/203307 [29:15:37<202:01:53,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25720/203307 [29:15:37<202:01:53,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25721/203307 [29:15:41<202:01:51,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  13%|█▎        | 25721/203307 [29:15:41<202:01:51,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25722/203307 [29:15:45<202:01:48,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25722/203307 [29:15:45<202:01:48,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25723/203307 [29:15:49<202:01:41,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25723/203307 [29:15:49<202:01:41,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25724/203307 [29:15:53<202:01:39,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25724/203307 [29:15:53<202:01:39,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25725/203307 [29:15:58<202:01:36,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25725/203307 [29:15:58<202:01:36,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25726/203307 [29:16:02<202:01:33,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25726/203307 [29:16:02<202:01:33,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25727/203307 [29:16:06<202:01:27,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25727/203307 [29:16:06<202:01:27,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25728/203307 [29:16:10<202:01:26,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25728/203307 [29:16:10<202:01:26,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25729/203307 [29:16:14<202:01:19,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25729/203307 [29:16:14<202:01:19,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25730/203307 [29:16:18<202:01:18,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25730/203307 [29:16:18<202:01:18,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25731/203307 [29:16:23<202:01:15,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25731/203307 [29:16:23<202:01:15,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25732/203307 [29:16:26<202:01:08,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25732/203307 [29:16:26<202:01:09,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25733/203307 [29:16:31<202:01:07,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25733/203307 [29:16:31<202:01:07,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25734/203307 [29:16:35<202:01:00,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25734/203307 [29:16:35<202:01:00,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25735/203307 [29:16:39<202:00:57,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25735/203307 [29:16:39<202:00:57,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25736/203307 [29:16:43<202:00:55,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25736/203307 [29:16:43<202:00:55,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25737/203307 [29:16:47<202:00:49,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25737/203307 [29:16:47<202:00:49,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25738/203307 [29:16:51<202:00:42,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25738/203307 [29:16:51<202:00:42,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25739/203307 [29:16:55<202:00:41,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25739/203307 [29:16:55<202:00:41,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25740/203307 [29:16:59<202:00:34,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25740/203307 [29:16:59<202:00:35,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25741/203307 [29:17:03<202:00:28,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  13%|█▎        | 25741/203307 [29:17:03<202:00:28,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25742/203307 [29:17:07<202:00:26,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25742/203307 [29:17:07<202:00:26,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25743/203307 [29:17:11<202:00:19,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25743/203307 [29:17:11<202:00:20,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25744/203307 [29:17:15<202:00:16,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25744/203307 [29:17:15<202:00:16,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25745/203307 [29:17:20<202:00:15,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25745/203307 [29:17:20<202:00:15,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25746/203307 [29:17:23<202:00:08,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25746/203307 [29:17:23<202:00:08,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25747/203307 [29:17:28<202:00:06,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25747/203307 [29:17:28<202:00:06,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25748/203307 [29:17:32<202:00:00,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25748/203307 [29:17:32<202:00:00,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25749/203307 [29:17:35<201:59:53,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25749/203307 [29:17:35<201:59:53,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25750/203307 [29:17:39<201:59:50,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25750/203307 [29:17:39<201:59:50,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25751/203307 [29:17:44<201:59:47,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25751/203307 [29:17:44<201:59:47,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25752/203307 [29:17:47<201:59:40,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25752/203307 [29:17:47<201:59:41,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25753/203307 [29:17:52<201:59:37,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25753/203307 [29:17:52<201:59:37,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25754/203307 [29:17:56<201:59:36,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25754/203307 [29:17:56<201:59:36,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25755/203307 [29:18:00<201:59:29,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25755/203307 [29:18:00<201:59:29,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25756/203307 [29:18:04<201:59:27,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25756/203307 [29:18:04<201:59:27,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25757/203307 [29:18:08<201:59:20,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25757/203307 [29:18:08<201:59:20,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25758/203307 [29:18:12<201:59:13,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25758/203307 [29:18:12<201:59:13,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25759/203307 [29:18:16<201:59:11,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25759/203307 [29:18:16<201:59:11,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25760/203307 [29:18:20<201:59:05,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25760/203307 [29:18:20<201:59:05,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25761/203307 [29:18:24<201:58:58,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 25761/203307 [29:18:24<201:58:58,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25762/203307 [29:18:28<201:58:57,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25762/203307 [29:18:28<201:58:57,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25763/203307 [29:18:32<201:58:51,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25763/203307 [29:18:32<201:58:51,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25764/203307 [29:18:36<201:58:48,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25764/203307 [29:18:36<201:58:48,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25765/203307 [29:18:41<201:58:47,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25765/203307 [29:18:41<201:58:47,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25766/203307 [29:18:44<201:58:40,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25766/203307 [29:18:44<201:58:40,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25767/203307 [29:18:48<201:58:34,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25767/203307 [29:18:48<201:58:34,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25768/203307 [29:18:53<201:58:32,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25768/203307 [29:18:53<201:58:32,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25769/203307 [29:18:56<201:58:26,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25769/203307 [29:18:56<201:58:26,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25770/203307 [29:19:00<201:58:19,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25770/203307 [29:19:00<201:58:19,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25771/203307 [29:19:05<201:58:18,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25771/203307 [29:19:05<201:58:18,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25772/203307 [29:19:09<201:58:14,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25772/203307 [29:19:09<201:58:14,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25773/203307 [29:19:13<201:58:12,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25773/203307 [29:19:13<201:58:12,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25774/203307 [29:19:17<201:58:05,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25774/203307 [29:19:17<201:58:05,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25775/203307 [29:19:21<201:57:58,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25775/203307 [29:19:21<201:57:58,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25776/203307 [29:19:25<201:57:57,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25776/203307 [29:19:25<201:57:57,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25777/203307 [29:19:29<201:57:54,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25777/203307 [29:19:29<201:57:54,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25778/203307 [29:19:33<201:57:47,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25778/203307 [29:19:33<201:57:47,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25779/203307 [29:19:37<201:57:40,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25779/203307 [29:19:37<201:57:40,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25780/203307 [29:19:41<201:57:39,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25780/203307 [29:19:41<201:57:39,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25781/203307 [29:19:45<201:57:36,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 25781/203307 [29:19:45<201:57:36,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25782/203307 [29:19:50<201:57:34,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25782/203307 [29:19:50<201:57:34,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25783/203307 [29:19:54<201:57:27,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25783/203307 [29:19:54<201:57:28,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25784/203307 [29:19:57<201:57:20,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25784/203307 [29:19:57<201:57:20,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25785/203307 [29:20:02<201:57:19,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25785/203307 [29:20:02<201:57:19,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25786/203307 [29:20:05<201:57:13,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25786/203307 [29:20:05<201:57:13,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25787/203307 [29:20:09<201:57:06,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25787/203307 [29:20:09<201:57:06,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25788/203307 [29:20:14<201:57:05,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25788/203307 [29:20:14<201:57:05,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25789/203307 [29:20:18<201:57:02,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25789/203307 [29:20:18<201:57:02,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25790/203307 [29:20:22<201:56:57,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25790/203307 [29:20:22<201:56:57,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25791/203307 [29:20:26<201:56:56,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25791/203307 [29:20:26<201:56:56,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25792/203307 [29:20:30<201:56:49,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25792/203307 [29:20:30<201:56:49,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25793/203307 [29:20:34<201:56:42,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25793/203307 [29:20:34<201:56:43,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25794/203307 [29:20:38<201:56:40,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25794/203307 [29:20:38<201:56:40,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25795/203307 [29:20:42<201:56:33,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25795/203307 [29:20:42<201:56:33,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25796/203307 [29:20:46<201:56:27,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25796/203307 [29:20:46<201:56:27,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25797/203307 [29:20:50<201:56:26,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25797/203307 [29:20:50<201:56:26,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25798/203307 [29:20:55<201:56:23,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25798/203307 [29:20:55<201:56:23,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25799/203307 [29:20:59<201:56:21,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25799/203307 [29:20:59<201:56:21,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25800/203307 [29:21:03<201:56:15,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25800/203307 [29:21:03<201:56:15,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25801/203307 [29:21:06<201:56:08,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 25801/203307 [29:21:06<201:56:08,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25802/203307 [29:21:11<201:56:06,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25802/203307 [29:21:11<201:56:06,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25803/203307 [29:21:15<201:56:04,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25803/203307 [29:21:15<201:56:04,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25804/203307 [29:21:19<201:55:57,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25804/203307 [29:21:19<201:55:57,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25805/203307 [29:21:23<201:55:50,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25805/203307 [29:21:23<201:55:50,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25806/203307 [29:21:27<201:55:48,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25806/203307 [29:21:27<201:55:48,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25807/203307 [29:21:31<201:55:45,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25807/203307 [29:21:31<201:55:45,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25808/203307 [29:21:36<201:55:43,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25808/203307 [29:21:36<201:55:43,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25809/203307 [29:21:39<201:55:36,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25809/203307 [29:21:39<201:55:36,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25810/203307 [29:21:43<201:55:29,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25810/203307 [29:21:43<201:55:29,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25811/203307 [29:21:47<201:55:26,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25811/203307 [29:21:47<201:55:27,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25812/203307 [29:21:51<201:55:20,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25812/203307 [29:21:51<201:55:20,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25813/203307 [29:21:55<201:55:13,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25813/203307 [29:21:55<201:55:13,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25814/203307 [29:21:59<201:55:11,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25814/203307 [29:21:59<201:55:12,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25815/203307 [29:22:03<201:55:04,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25815/203307 [29:22:03<201:55:04,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25816/203307 [29:22:07<201:55:01,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25816/203307 [29:22:07<201:55:01,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25817/203307 [29:22:11<201:54:58,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25817/203307 [29:22:11<201:54:59,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25818/203307 [29:22:15<201:54:51,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25818/203307 [29:22:15<201:54:51,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25819/203307 [29:22:19<201:54:44,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25819/203307 [29:22:19<201:54:44,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25820/203307 [29:22:23<201:54:42,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25820/203307 [29:22:23<201:54:42,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25821/203307 [29:22:27<201:54:35,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  13%|█▎        | 25821/203307 [29:22:27<201:54:35,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25822/203307 [29:22:31<201:54:32,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25822/203307 [29:22:31<201:54:32,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25823/203307 [29:22:35<201:54:29,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25823/203307 [29:22:35<201:54:29,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25824/203307 [29:22:39<201:54:22,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25824/203307 [29:22:39<201:54:23,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25825/203307 [29:22:43<201:54:20,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25825/203307 [29:22:43<201:54:21,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25826/203307 [29:22:47<201:54:13,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25826/203307 [29:22:47<201:54:13,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25827/203307 [29:22:51<201:54:06,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25827/203307 [29:22:51<201:54:07,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25828/203307 [29:22:55<201:54:04,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25828/203307 [29:22:55<201:54:04,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25829/203307 [29:22:59<201:54:01,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25829/203307 [29:22:59<201:54:01,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25830/203307 [29:23:03<201:53:54,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25830/203307 [29:23:03<201:53:54,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25831/203307 [29:23:07<201:53:51,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25831/203307 [29:23:07<201:53:51,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25832/203307 [29:23:12<201:53:49,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25832/203307 [29:23:12<201:53:50,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25833/203307 [29:23:15<201:53:43,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25833/203307 [29:23:15<201:53:43,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25834/203307 [29:23:20<201:53:41,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25834/203307 [29:23:20<201:53:41,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25835/203307 [29:23:24<201:53:35,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25835/203307 [29:23:24<201:53:35,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25836/203307 [29:23:27<201:53:28,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25836/203307 [29:23:27<201:53:29,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25837/203307 [29:23:32<201:53:27,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25837/203307 [29:23:32<201:53:27,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25838/203307 [29:23:36<201:53:20,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25838/203307 [29:23:36<201:53:20,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25839/203307 [29:23:40<201:53:18,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25839/203307 [29:23:40<201:53:18,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25840/203307 [29:23:44<201:53:16,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25840/203307 [29:23:44<201:53:16,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25841/203307 [29:23:48<201:53:10,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 25841/203307 [29:23:48<201:53:10,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25842/203307 [29:23:52<201:53:03,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25842/203307 [29:23:52<201:53:03,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25843/203307 [29:23:56<201:53:02,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25843/203307 [29:23:56<201:53:02,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25844/203307 [29:24:00<201:52:55,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25844/203307 [29:24:00<201:52:55,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25845/203307 [29:24:04<201:52:47,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25845/203307 [29:24:04<201:52:48,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25846/203307 [29:24:08<201:52:45,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25846/203307 [29:24:08<201:52:45,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25847/203307 [29:24:12<201:52:41,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25847/203307 [29:24:12<201:52:41,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25848/203307 [29:24:16<201:52:35,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25848/203307 [29:24:16<201:52:35,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25849/203307 [29:24:20<201:52:34,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25849/203307 [29:24:20<201:52:34,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25850/203307 [29:24:24<201:52:28,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25850/203307 [29:24:24<201:52:28,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25851/203307 [29:24:29<201:52:26,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25851/203307 [29:24:29<201:52:26,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25852/203307 [29:24:33<201:52:23,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25852/203307 [29:24:33<201:52:23,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25853/203307 [29:24:37<201:52:17,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25853/203307 [29:24:37<201:52:17,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25854/203307 [29:24:41<201:52:14,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25854/203307 [29:24:41<201:52:14,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25855/203307 [29:24:45<201:52:11,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25855/203307 [29:24:45<201:52:11,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25856/203307 [29:24:50<201:52:08,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25856/203307 [29:24:50<201:52:09,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25857/203307 [29:24:53<201:52:01,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25857/203307 [29:24:53<201:52:02,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25858/203307 [29:24:58<201:52:00,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25858/203307 [29:24:58<201:52:00,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25859/203307 [29:25:01<201:51:53,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25859/203307 [29:25:01<201:51:53,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25860/203307 [29:25:06<201:51:51,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25860/203307 [29:25:06<201:51:51,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25861/203307 [29:25:10<201:51:48,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  13%|█▎        | 25861/203307 [29:25:10<201:51:49,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25862/203307 [29:25:14<201:51:41,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25862/203307 [29:25:14<201:51:41,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25863/203307 [29:25:18<201:51:39,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25863/203307 [29:25:18<201:51:39,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25864/203307 [29:25:22<201:51:36,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25864/203307 [29:25:22<201:51:36,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25865/203307 [29:25:26<201:51:29,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25865/203307 [29:25:26<201:51:29,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25866/203307 [29:25:30<201:51:27,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25866/203307 [29:25:30<201:51:27,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25867/203307 [29:25:34<201:51:20,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25867/203307 [29:25:34<201:51:20,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25868/203307 [29:25:38<201:51:13,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25868/203307 [29:25:38<201:51:13,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25869/203307 [29:25:42<201:51:12,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25869/203307 [29:25:42<201:51:12,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25870/203307 [29:25:46<201:51:08,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25870/203307 [29:25:46<201:51:08,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25871/203307 [29:25:50<201:51:00,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25871/203307 [29:25:50<201:51:00,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25872/203307 [29:25:54<201:50:58,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25872/203307 [29:25:54<201:50:58,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25873/203307 [29:25:58<201:50:51,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25873/203307 [29:25:58<201:50:51,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25874/203307 [29:26:02<201:50:44,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25874/203307 [29:26:02<201:50:44,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25875/203307 [29:26:06<201:50:42,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25875/203307 [29:26:06<201:50:43,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25876/203307 [29:26:10<201:50:35,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25876/203307 [29:26:10<201:50:35,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25877/203307 [29:26:14<201:50:34,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25877/203307 [29:26:14<201:50:34,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25878/203307 [29:26:18<201:50:28,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25878/203307 [29:26:18<201:50:28,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25879/203307 [29:26:22<201:50:25,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25879/203307 [29:26:22<201:50:25,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25880/203307 [29:26:27<201:50:22,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25880/203307 [29:26:27<201:50:22,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25881/203307 [29:26:31<201:50:19,  0.24it/s, v_num=t5e6, training/loss=0.0775]Epoch 0:  13%|█▎        | 25881/203307 [29:26:31<201:50:19,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25882/203307 [29:26:35<201:50:12,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25882/203307 [29:26:35<201:50:12,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25883/203307 [29:26:38<201:50:05,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25883/203307 [29:26:38<201:50:05,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25884/203307 [29:26:43<201:50:03,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25884/203307 [29:26:43<201:50:03,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25885/203307 [29:26:46<201:49:56,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25885/203307 [29:26:46<201:49:56,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25886/203307 [29:26:51<201:49:54,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25886/203307 [29:26:51<201:49:54,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25887/203307 [29:26:54<201:49:47,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25887/203307 [29:26:55<201:49:47,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25888/203307 [29:26:59<201:49:44,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25888/203307 [29:26:59<201:49:44,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25889/203307 [29:27:03<201:49:41,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25889/203307 [29:27:03<201:49:41,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25890/203307 [29:27:07<201:49:34,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25890/203307 [29:27:07<201:49:34,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25891/203307 [29:27:10<201:49:27,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25891/203307 [29:27:10<201:49:27,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25892/203307 [29:27:15<201:49:26,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25892/203307 [29:27:15<201:49:26,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25893/203307 [29:27:19<201:49:20,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25893/203307 [29:27:19<201:49:20,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25894/203307 [29:27:22<201:49:13,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25894/203307 [29:27:22<201:49:13,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25895/203307 [29:27:27<201:49:11,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25895/203307 [29:27:27<201:49:11,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25896/203307 [29:27:30<201:49:04,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25896/203307 [29:27:30<201:49:04,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25897/203307 [29:27:35<201:49:02,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25897/203307 [29:27:35<201:49:02,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25898/203307 [29:27:39<201:48:58,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25898/203307 [29:27:39<201:48:59,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25899/203307 [29:27:43<201:48:51,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25899/203307 [29:27:43<201:48:52,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25900/203307 [29:27:46<201:48:44,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25900/203307 [29:27:46<201:48:44,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25901/203307 [29:27:51<201:48:43,  0.24it/s, v_num=t5e6, training/loss=0.0927]Epoch 0:  13%|█▎        | 25901/203307 [29:27:51<201:48:43,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25902/203307 [29:27:54<201:48:36,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25902/203307 [29:27:54<201:48:36,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25903/203307 [29:27:59<201:48:33,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25903/203307 [29:27:59<201:48:33,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25904/203307 [29:28:02<201:48:26,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25904/203307 [29:28:02<201:48:26,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25905/203307 [29:28:06<201:48:19,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25905/203307 [29:28:06<201:48:20,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25906/203307 [29:28:10<201:48:17,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25906/203307 [29:28:10<201:48:17,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25907/203307 [29:28:15<201:48:14,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25907/203307 [29:28:15<201:48:14,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25908/203307 [29:28:18<201:48:07,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25908/203307 [29:28:18<201:48:07,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25909/203307 [29:28:22<201:48:01,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25909/203307 [29:28:22<201:48:01,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25910/203307 [29:28:27<201:47:59,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25910/203307 [29:28:27<201:47:59,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25911/203307 [29:28:30<201:47:53,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25911/203307 [29:28:30<201:47:53,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25912/203307 [29:28:35<201:47:51,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25912/203307 [29:28:35<201:47:51,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25913/203307 [29:28:39<201:47:44,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25913/203307 [29:28:39<201:47:44,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25914/203307 [29:28:43<201:47:41,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25914/203307 [29:28:43<201:47:41,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25915/203307 [29:28:47<201:47:38,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25915/203307 [29:28:47<201:47:38,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25916/203307 [29:28:51<201:47:32,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25916/203307 [29:28:51<201:47:32,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25917/203307 [29:28:54<201:47:25,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25917/203307 [29:28:54<201:47:25,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25918/203307 [29:28:59<201:47:24,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25918/203307 [29:28:59<201:47:24,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25919/203307 [29:29:03<201:47:17,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25919/203307 [29:29:03<201:47:17,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25920/203307 [29:29:06<201:47:10,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25920/203307 [29:29:06<201:47:10,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25921/203307 [29:29:11<201:47:08,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 25921/203307 [29:29:11<201:47:08,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25922/203307 [29:29:15<201:47:06,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25922/203307 [29:29:15<201:47:06,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25923/203307 [29:29:19<201:47:00,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25923/203307 [29:29:19<201:47:00,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25924/203307 [29:29:23<201:46:57,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25924/203307 [29:29:23<201:46:57,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25925/203307 [29:29:27<201:46:51,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25925/203307 [29:29:27<201:46:51,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25926/203307 [29:29:31<201:46:46,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25926/203307 [29:29:31<201:46:46,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25927/203307 [29:29:35<201:46:44,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25927/203307 [29:29:35<201:46:44,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25928/203307 [29:29:39<201:46:37,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25928/203307 [29:29:39<201:46:37,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25929/203307 [29:29:43<201:46:34,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25929/203307 [29:29:43<201:46:34,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25930/203307 [29:29:47<201:46:28,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25930/203307 [29:29:47<201:46:28,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25931/203307 [29:29:51<201:46:25,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25931/203307 [29:29:51<201:46:25,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25932/203307 [29:29:56<201:46:22,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25932/203307 [29:29:56<201:46:22,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25933/203307 [29:30:00<201:46:19,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25933/203307 [29:30:00<201:46:19,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25934/203307 [29:30:04<201:46:12,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25934/203307 [29:30:04<201:46:12,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25935/203307 [29:30:07<201:46:05,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25935/203307 [29:30:07<201:46:05,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25936/203307 [29:30:12<201:46:03,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25936/203307 [29:30:12<201:46:03,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25937/203307 [29:30:15<201:45:56,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25937/203307 [29:30:15<201:45:56,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25938/203307 [29:30:20<201:45:54,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25938/203307 [29:30:20<201:45:54,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25939/203307 [29:30:24<201:45:51,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25939/203307 [29:30:24<201:45:51,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25940/203307 [29:30:28<201:45:44,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25940/203307 [29:30:28<201:45:44,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25941/203307 [29:30:32<201:45:42,  0.24it/s, v_num=t5e6, training/loss=0.0771]Epoch 0:  13%|█▎        | 25941/203307 [29:30:32<201:45:42,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25942/203307 [29:30:36<201:45:38,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25942/203307 [29:30:36<201:45:38,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25943/203307 [29:30:40<201:45:32,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25943/203307 [29:30:40<201:45:32,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25944/203307 [29:30:44<201:45:30,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25944/203307 [29:30:44<201:45:30,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25945/203307 [29:30:48<201:45:23,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25945/203307 [29:30:48<201:45:23,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25946/203307 [29:30:52<201:45:16,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25946/203307 [29:30:52<201:45:16,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25947/203307 [29:30:56<201:45:15,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25947/203307 [29:30:56<201:45:15,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25948/203307 [29:31:00<201:45:08,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25948/203307 [29:31:00<201:45:08,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25949/203307 [29:31:04<201:45:02,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25949/203307 [29:31:04<201:45:02,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25950/203307 [29:31:08<201:45:00,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25950/203307 [29:31:08<201:45:00,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25951/203307 [29:31:12<201:44:56,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25951/203307 [29:31:12<201:44:56,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25952/203307 [29:31:16<201:44:50,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25952/203307 [29:31:16<201:44:50,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25953/203307 [29:31:21<201:44:48,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25953/203307 [29:31:21<201:44:48,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25954/203307 [29:31:24<201:44:42,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25954/203307 [29:31:24<201:44:42,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25955/203307 [29:31:29<201:44:40,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25955/203307 [29:31:29<201:44:40,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25956/203307 [29:31:33<201:44:37,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25956/203307 [29:31:33<201:44:37,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25957/203307 [29:31:37<201:44:30,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25957/203307 [29:31:37<201:44:30,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25958/203307 [29:31:41<201:44:28,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25958/203307 [29:31:41<201:44:28,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25959/203307 [29:31:45<201:44:25,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25959/203307 [29:31:45<201:44:25,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25960/203307 [29:31:49<201:44:21,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25960/203307 [29:31:49<201:44:21,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25961/203307 [29:31:53<201:44:15,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 25961/203307 [29:31:53<201:44:15,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25962/203307 [29:31:58<201:44:13,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25962/203307 [29:31:58<201:44:13,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25963/203307 [29:32:01<201:44:06,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25963/203307 [29:32:01<201:44:06,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25964/203307 [29:32:06<201:44:04,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25964/203307 [29:32:06<201:44:04,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25965/203307 [29:32:10<201:43:59,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25965/203307 [29:32:10<201:43:59,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25966/203307 [29:32:13<201:43:52,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25966/203307 [29:32:13<201:43:52,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25967/203307 [29:32:18<201:43:51,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25967/203307 [29:32:18<201:43:51,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25968/203307 [29:32:22<201:43:44,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25968/203307 [29:32:22<201:43:44,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25969/203307 [29:32:26<201:43:41,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25969/203307 [29:32:26<201:43:41,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25970/203307 [29:32:30<201:43:39,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25970/203307 [29:32:30<201:43:39,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25971/203307 [29:32:34<201:43:32,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25971/203307 [29:32:34<201:43:32,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25972/203307 [29:32:38<201:43:29,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25972/203307 [29:32:38<201:43:29,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25973/203307 [29:32:43<201:43:27,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25973/203307 [29:32:43<201:43:27,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25974/203307 [29:32:46<201:43:20,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25974/203307 [29:32:46<201:43:20,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25975/203307 [29:32:50<201:43:13,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25975/203307 [29:32:50<201:43:13,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25976/203307 [29:32:54<201:43:11,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25976/203307 [29:32:54<201:43:11,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25977/203307 [29:32:58<201:43:04,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25977/203307 [29:32:58<201:43:04,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25978/203307 [29:33:02<201:43:02,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25978/203307 [29:33:02<201:43:02,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25979/203307 [29:33:07<201:43:00,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25979/203307 [29:33:07<201:43:00,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25980/203307 [29:33:10<201:42:53,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25980/203307 [29:33:10<201:42:53,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25981/203307 [29:33:15<201:42:51,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 25981/203307 [29:33:15<201:42:51,  0.24it/s, v_num=t5e6, training/loss=0.086] Epoch 0:  13%|█▎        | 25982/203307 [29:33:19<201:42:44,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25982/203307 [29:33:19<201:42:44,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25983/203307 [29:33:22<201:42:38,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25983/203307 [29:33:22<201:42:38,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25984/203307 [29:33:27<201:42:35,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25984/203307 [29:33:27<201:42:35,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25985/203307 [29:33:31<201:42:32,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25985/203307 [29:33:31<201:42:32,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25986/203307 [29:33:34<201:42:24,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25986/203307 [29:33:34<201:42:24,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25987/203307 [29:33:39<201:42:20,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25987/203307 [29:33:39<201:42:20,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25988/203307 [29:33:43<201:42:18,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25988/203307 [29:33:43<201:42:18,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25989/203307 [29:33:47<201:42:15,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25989/203307 [29:33:47<201:42:15,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25990/203307 [29:33:51<201:42:12,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25990/203307 [29:33:51<201:42:12,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25991/203307 [29:33:55<201:42:05,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25991/203307 [29:33:55<201:42:05,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25992/203307 [29:33:59<201:41:58,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25992/203307 [29:33:59<201:41:58,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25993/203307 [29:34:03<201:41:55,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25993/203307 [29:34:03<201:41:56,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25994/203307 [29:34:07<201:41:49,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25994/203307 [29:34:07<201:41:49,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25995/203307 [29:34:10<201:41:42,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25995/203307 [29:34:10<201:41:42,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25996/203307 [29:34:15<201:41:40,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25996/203307 [29:34:15<201:41:40,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25997/203307 [29:34:19<201:41:38,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25997/203307 [29:34:19<201:41:38,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25998/203307 [29:34:23<201:41:31,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25998/203307 [29:34:23<201:41:31,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25999/203307 [29:34:27<201:41:29,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 25999/203307 [29:34:27<201:41:29,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 26000/203307 [29:34:31<201:41:22,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 26000/203307 [29:34:31<201:41:22,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 26001/203307 [29:34:35<201:41:16,  0.24it/s, v_num=t5e6, training/loss=0.086]Epoch 0:  13%|█▎        | 26001/203307 [29:34:35<201:41:16,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26002/203307 [29:34:39<201:41:13,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26002/203307 [29:34:39<201:41:13,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26003/203307 [29:34:43<201:41:06,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26003/203307 [29:34:43<201:41:06,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26004/203307 [29:34:46<201:40:59,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26004/203307 [29:34:46<201:40:59,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26005/203307 [29:34:51<201:40:57,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26005/203307 [29:34:51<201:40:57,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26006/203307 [29:34:55<201:40:54,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26006/203307 [29:34:55<201:40:54,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26007/203307 [29:34:59<201:40:51,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26007/203307 [29:34:59<201:40:51,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26008/203307 [29:35:03<201:40:45,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26008/203307 [29:35:03<201:40:45,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26009/203307 [29:35:07<201:40:38,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26009/203307 [29:35:07<201:40:38,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26010/203307 [29:35:11<201:40:35,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26010/203307 [29:35:11<201:40:35,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26011/203307 [29:35:15<201:40:32,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26011/203307 [29:35:15<201:40:32,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26012/203307 [29:35:19<201:40:25,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26012/203307 [29:35:19<201:40:25,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26013/203307 [29:35:23<201:40:18,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26013/203307 [29:35:23<201:40:18,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26014/203307 [29:35:27<201:40:16,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26014/203307 [29:35:27<201:40:16,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26015/203307 [29:35:31<201:40:10,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26015/203307 [29:35:31<201:40:10,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26016/203307 [29:35:35<201:40:07,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26016/203307 [29:35:35<201:40:07,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26017/203307 [29:35:39<201:40:00,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26017/203307 [29:35:39<201:40:00,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26018/203307 [29:35:42<201:39:53,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26018/203307 [29:35:42<201:39:53,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26019/203307 [29:35:47<201:39:50,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26019/203307 [29:35:47<201:39:50,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26020/203307 [29:35:50<201:39:43,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26020/203307 [29:35:50<201:39:43,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26021/203307 [29:35:54<201:39:36,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  13%|█▎        | 26021/203307 [29:35:54<201:39:36,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26022/203307 [29:35:59<201:39:34,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26022/203307 [29:35:59<201:39:34,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26023/203307 [29:36:03<201:39:31,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26023/203307 [29:36:03<201:39:31,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26024/203307 [29:36:06<201:39:24,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26024/203307 [29:36:06<201:39:24,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26025/203307 [29:36:11<201:39:22,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26025/203307 [29:36:11<201:39:22,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26026/203307 [29:36:14<201:39:15,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26026/203307 [29:36:14<201:39:15,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26027/203307 [29:36:18<201:39:08,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26027/203307 [29:36:18<201:39:08,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26028/203307 [29:36:23<201:39:06,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26028/203307 [29:36:23<201:39:06,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26029/203307 [29:36:26<201:39:00,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26029/203307 [29:36:26<201:39:00,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26030/203307 [29:36:30<201:38:53,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26030/203307 [29:36:30<201:38:53,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26031/203307 [29:36:35<201:38:52,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26031/203307 [29:36:35<201:38:52,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26032/203307 [29:36:39<201:38:48,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26032/203307 [29:36:39<201:38:48,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26033/203307 [29:36:43<201:38:46,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26033/203307 [29:36:43<201:38:46,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26034/203307 [29:36:47<201:38:39,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26034/203307 [29:36:47<201:38:39,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26035/203307 [29:36:51<201:38:33,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26035/203307 [29:36:51<201:38:33,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26036/203307 [29:36:55<201:38:30,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26036/203307 [29:36:55<201:38:30,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26037/203307 [29:36:59<201:38:28,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26037/203307 [29:36:59<201:38:28,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26038/203307 [29:37:03<201:38:21,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26038/203307 [29:37:03<201:38:21,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26039/203307 [29:37:07<201:38:18,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26039/203307 [29:37:07<201:38:18,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26040/203307 [29:37:11<201:38:15,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26040/203307 [29:37:11<201:38:16,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26041/203307 [29:37:16<201:38:13,  0.24it/s, v_num=t5e6, training/loss=0.0924]Epoch 0:  13%|█▎        | 26041/203307 [29:37:16<201:38:13,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26042/203307 [29:37:20<201:38:11,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26042/203307 [29:37:20<201:38:11,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26043/203307 [29:37:24<201:38:04,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26043/203307 [29:37:24<201:38:04,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26044/203307 [29:37:28<201:37:57,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26044/203307 [29:37:28<201:37:57,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26045/203307 [29:37:32<201:37:55,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26045/203307 [29:37:32<201:37:55,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26046/203307 [29:37:36<201:37:48,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26046/203307 [29:37:36<201:37:48,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26047/203307 [29:37:40<201:37:45,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26047/203307 [29:37:40<201:37:45,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26048/203307 [29:37:44<201:37:42,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26048/203307 [29:37:44<201:37:42,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26049/203307 [29:37:48<201:37:36,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26049/203307 [29:37:48<201:37:36,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26050/203307 [29:37:52<201:37:32,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26050/203307 [29:37:52<201:37:32,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26051/203307 [29:37:56<201:37:30,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26051/203307 [29:37:56<201:37:30,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26052/203307 [29:38:00<201:37:23,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26052/203307 [29:38:00<201:37:23,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26053/203307 [29:38:04<201:37:16,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26053/203307 [29:38:04<201:37:16,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26054/203307 [29:38:08<201:37:14,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26054/203307 [29:38:08<201:37:14,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26055/203307 [29:38:12<201:37:06,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26055/203307 [29:38:12<201:37:07,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26056/203307 [29:38:16<201:37:03,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26056/203307 [29:38:16<201:37:03,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26057/203307 [29:38:21<201:37:02,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26057/203307 [29:38:21<201:37:02,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26058/203307 [29:38:24<201:36:55,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26058/203307 [29:38:24<201:36:55,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26059/203307 [29:38:28<201:36:52,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26059/203307 [29:38:28<201:36:52,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26060/203307 [29:38:32<201:36:45,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26060/203307 [29:38:32<201:36:45,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26061/203307 [29:38:36<201:36:38,  0.24it/s, v_num=t5e6, training/loss=0.0792]Epoch 0:  13%|█▎        | 26061/203307 [29:38:36<201:36:38,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26062/203307 [29:38:40<201:36:35,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26062/203307 [29:38:40<201:36:35,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26063/203307 [29:38:44<201:36:32,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26063/203307 [29:38:44<201:36:32,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26064/203307 [29:38:48<201:36:28,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26064/203307 [29:38:48<201:36:28,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26065/203307 [29:38:52<201:36:21,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26065/203307 [29:38:52<201:36:21,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26066/203307 [29:38:56<201:36:19,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26066/203307 [29:38:56<201:36:19,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26067/203307 [29:39:00<201:36:12,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26067/203307 [29:39:00<201:36:12,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26068/203307 [29:39:04<201:36:10,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26068/203307 [29:39:04<201:36:10,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26069/203307 [29:39:08<201:36:02,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26069/203307 [29:39:08<201:36:02,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26070/203307 [29:39:12<201:35:55,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26070/203307 [29:39:12<201:35:55,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26071/203307 [29:39:16<201:35:53,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26071/203307 [29:39:16<201:35:53,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26072/203307 [29:39:21<201:35:51,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26072/203307 [29:39:21<201:35:51,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26073/203307 [29:39:24<201:35:44,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26073/203307 [29:39:24<201:35:45,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26074/203307 [29:39:29<201:35:43,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26074/203307 [29:39:29<201:35:43,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26075/203307 [29:39:32<201:35:36,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26075/203307 [29:39:32<201:35:36,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26076/203307 [29:39:36<201:35:30,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26076/203307 [29:39:36<201:35:30,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26077/203307 [29:39:41<201:35:28,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26077/203307 [29:39:41<201:35:28,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26078/203307 [29:39:44<201:35:22,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26078/203307 [29:39:44<201:35:22,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26079/203307 [29:39:48<201:35:15,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26079/203307 [29:39:48<201:35:15,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26080/203307 [29:39:52<201:35:12,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26080/203307 [29:39:52<201:35:12,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26081/203307 [29:39:57<201:35:10,  0.24it/s, v_num=t5e6, training/loss=0.0818]Epoch 0:  13%|█▎        | 26081/203307 [29:39:57<201:35:10,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26082/203307 [29:40:01<201:35:04,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26082/203307 [29:40:01<201:35:04,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26083/203307 [29:40:05<201:35:02,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26083/203307 [29:40:05<201:35:02,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26084/203307 [29:40:09<201:34:56,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26084/203307 [29:40:09<201:34:56,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26085/203307 [29:40:13<201:34:54,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26085/203307 [29:40:13<201:34:54,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26086/203307 [29:40:17<201:34:50,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26086/203307 [29:40:17<201:34:50,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26087/203307 [29:40:21<201:34:44,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26087/203307 [29:40:21<201:34:44,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26088/203307 [29:40:25<201:34:41,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26088/203307 [29:40:25<201:34:42,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26089/203307 [29:40:30<201:34:39,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26089/203307 [29:40:30<201:34:39,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26090/203307 [29:40:34<201:34:32,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26090/203307 [29:40:34<201:34:32,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26091/203307 [29:40:37<201:34:26,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26091/203307 [29:40:37<201:34:26,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26092/203307 [29:40:42<201:34:24,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26092/203307 [29:40:42<201:34:24,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26093/203307 [29:40:45<201:34:18,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26093/203307 [29:40:45<201:34:18,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26094/203307 [29:40:50<201:34:16,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26094/203307 [29:40:50<201:34:16,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26095/203307 [29:40:54<201:34:13,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26095/203307 [29:40:54<201:34:13,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26096/203307 [29:40:58<201:34:06,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26096/203307 [29:40:58<201:34:06,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26097/203307 [29:41:02<201:34:04,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26097/203307 [29:41:02<201:34:04,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26098/203307 [29:41:06<201:33:57,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26098/203307 [29:41:06<201:33:57,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26099/203307 [29:41:10<201:33:50,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26099/203307 [29:41:10<201:33:51,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26100/203307 [29:41:14<201:33:49,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26100/203307 [29:41:14<201:33:49,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26101/203307 [29:41:18<201:33:42,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 26101/203307 [29:41:18<201:33:42,  0.24it/s, v_num=t5e6, training/loss=0.081] Epoch 0:  13%|█▎        | 26102/203307 [29:41:21<201:33:35,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26102/203307 [29:41:22<201:33:35,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26103/203307 [29:41:26<201:33:34,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26103/203307 [29:41:26<201:33:34,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26104/203307 [29:41:30<201:33:32,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26104/203307 [29:41:30<201:33:32,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26105/203307 [29:41:34<201:33:25,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26105/203307 [29:41:34<201:33:25,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26106/203307 [29:41:38<201:33:23,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26106/203307 [29:41:38<201:33:23,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26107/203307 [29:41:42<201:33:16,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26107/203307 [29:41:42<201:33:16,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26108/203307 [29:41:46<201:33:10,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26108/203307 [29:41:46<201:33:10,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26109/203307 [29:41:50<201:33:09,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26109/203307 [29:41:50<201:33:09,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26110/203307 [29:41:54<201:33:02,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26110/203307 [29:41:54<201:33:02,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26111/203307 [29:41:59<201:33:00,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26111/203307 [29:41:59<201:33:00,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26112/203307 [29:42:02<201:32:54,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26112/203307 [29:42:02<201:32:54,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26113/203307 [29:42:07<201:32:51,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26113/203307 [29:42:07<201:32:51,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26114/203307 [29:42:11<201:32:48,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26114/203307 [29:42:11<201:32:48,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26115/203307 [29:42:15<201:32:45,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26115/203307 [29:42:15<201:32:45,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26116/203307 [29:42:19<201:32:39,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26116/203307 [29:42:19<201:32:39,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26117/203307 [29:42:23<201:32:32,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26117/203307 [29:42:23<201:32:32,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26118/203307 [29:42:27<201:32:30,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26118/203307 [29:42:27<201:32:30,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26119/203307 [29:42:31<201:32:24,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26119/203307 [29:42:31<201:32:24,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26120/203307 [29:42:35<201:32:22,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26120/203307 [29:42:35<201:32:22,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26121/203307 [29:42:39<201:32:15,  0.24it/s, v_num=t5e6, training/loss=0.081]Epoch 0:  13%|█▎        | 26121/203307 [29:42:39<201:32:15,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26122/203307 [29:42:43<201:32:12,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26122/203307 [29:42:43<201:32:12,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26123/203307 [29:42:47<201:32:09,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26123/203307 [29:42:47<201:32:09,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26124/203307 [29:42:51<201:32:02,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26124/203307 [29:42:51<201:32:02,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26125/203307 [29:42:55<201:31:55,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26125/203307 [29:42:55<201:31:55,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26126/203307 [29:42:59<201:31:54,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26126/203307 [29:42:59<201:31:54,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26127/203307 [29:43:03<201:31:47,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26127/203307 [29:43:03<201:31:47,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26128/203307 [29:43:07<201:31:40,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26128/203307 [29:43:07<201:31:40,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26129/203307 [29:43:11<201:31:38,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26129/203307 [29:43:11<201:31:38,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26130/203307 [29:43:15<201:31:31,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26130/203307 [29:43:15<201:31:31,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26131/203307 [29:43:19<201:31:29,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26131/203307 [29:43:19<201:31:29,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26132/203307 [29:43:23<201:31:26,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26132/203307 [29:43:23<201:31:26,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26133/203307 [29:43:27<201:31:19,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26133/203307 [29:43:27<201:31:19,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26134/203307 [29:43:31<201:31:12,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26134/203307 [29:43:31<201:31:12,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26135/203307 [29:43:35<201:31:11,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26135/203307 [29:43:35<201:31:11,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26136/203307 [29:43:39<201:31:04,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26136/203307 [29:43:39<201:31:04,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26137/203307 [29:43:43<201:31:01,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26137/203307 [29:43:43<201:31:01,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26138/203307 [29:43:47<201:30:55,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26138/203307 [29:43:47<201:30:55,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26139/203307 [29:43:51<201:30:51,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26139/203307 [29:43:51<201:30:51,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26140/203307 [29:43:55<201:30:49,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26140/203307 [29:43:55<201:30:49,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26141/203307 [29:44:00<201:30:45,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  13%|█▎        | 26141/203307 [29:44:00<201:30:45,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26142/203307 [29:44:03<201:30:38,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26142/203307 [29:44:03<201:30:38,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26143/203307 [29:44:07<201:30:30,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26143/203307 [29:44:07<201:30:30,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26144/203307 [29:44:11<201:30:28,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26144/203307 [29:44:11<201:30:28,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26145/203307 [29:44:15<201:30:22,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26145/203307 [29:44:15<201:30:22,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26146/203307 [29:44:19<201:30:19,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26146/203307 [29:44:19<201:30:20,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26147/203307 [29:44:24<201:30:16,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26147/203307 [29:44:24<201:30:16,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26148/203307 [29:44:27<201:30:09,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26148/203307 [29:44:27<201:30:09,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26149/203307 [29:44:31<201:30:06,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26149/203307 [29:44:31<201:30:06,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26150/203307 [29:44:35<201:29:59,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26150/203307 [29:44:35<201:29:59,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26151/203307 [29:44:39<201:29:52,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26151/203307 [29:44:39<201:29:52,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26152/203307 [29:44:43<201:29:50,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26152/203307 [29:44:43<201:29:50,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26153/203307 [29:44:47<201:29:42,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26153/203307 [29:44:47<201:29:42,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26154/203307 [29:44:50<201:29:35,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26154/203307 [29:44:50<201:29:35,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26155/203307 [29:44:55<201:29:33,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26155/203307 [29:44:55<201:29:33,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26156/203307 [29:44:59<201:29:30,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26156/203307 [29:44:59<201:29:30,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26157/203307 [29:45:03<201:29:23,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26157/203307 [29:45:03<201:29:23,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26158/203307 [29:45:07<201:29:20,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26158/203307 [29:45:07<201:29:21,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26159/203307 [29:45:11<201:29:14,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26159/203307 [29:45:11<201:29:14,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26160/203307 [29:45:14<201:29:07,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26160/203307 [29:45:14<201:29:07,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26161/203307 [29:45:19<201:29:05,  0.24it/s, v_num=t5e6, training/loss=0.0884]Epoch 0:  13%|█▎        | 26161/203307 [29:45:19<201:29:05,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26162/203307 [29:45:23<201:28:58,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26162/203307 [29:45:23<201:28:59,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26163/203307 [29:45:27<201:28:56,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26163/203307 [29:45:27<201:28:56,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26164/203307 [29:45:31<201:28:53,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26164/203307 [29:45:31<201:28:54,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26165/203307 [29:45:35<201:28:47,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26165/203307 [29:45:35<201:28:47,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26166/203307 [29:45:39<201:28:44,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26166/203307 [29:45:39<201:28:44,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26167/203307 [29:45:44<201:28:42,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26167/203307 [29:45:44<201:28:42,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26168/203307 [29:45:47<201:28:36,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26168/203307 [29:45:47<201:28:36,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26169/203307 [29:45:51<201:28:29,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26169/203307 [29:45:51<201:28:29,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26170/203307 [29:45:56<201:28:27,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26170/203307 [29:45:56<201:28:27,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26171/203307 [29:45:59<201:28:21,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26171/203307 [29:45:59<201:28:21,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26172/203307 [29:46:04<201:28:19,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26172/203307 [29:46:04<201:28:19,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26173/203307 [29:46:08<201:28:13,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26173/203307 [29:46:08<201:28:13,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26174/203307 [29:46:11<201:28:06,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26174/203307 [29:46:11<201:28:06,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26175/203307 [29:46:16<201:28:04,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26175/203307 [29:46:16<201:28:04,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26176/203307 [29:46:20<201:28:01,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26176/203307 [29:46:20<201:28:01,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26177/203307 [29:46:24<201:27:54,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26177/203307 [29:46:24<201:27:54,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26178/203307 [29:46:28<201:27:53,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26178/203307 [29:46:28<201:27:53,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26179/203307 [29:46:32<201:27:46,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26179/203307 [29:46:32<201:27:46,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26180/203307 [29:46:36<201:27:40,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26180/203307 [29:46:36<201:27:40,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26181/203307 [29:46:40<201:27:39,  0.24it/s, v_num=t5e6, training/loss=0.0861]Epoch 0:  13%|█▎        | 26181/203307 [29:46:40<201:27:39,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26182/203307 [29:46:44<201:27:33,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26182/203307 [29:46:44<201:27:33,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26183/203307 [29:46:48<201:27:26,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26183/203307 [29:46:48<201:27:26,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26184/203307 [29:46:52<201:27:24,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26184/203307 [29:46:52<201:27:24,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26185/203307 [29:46:56<201:27:21,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26185/203307 [29:46:56<201:27:21,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26186/203307 [29:47:00<201:27:15,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26186/203307 [29:47:00<201:27:15,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26187/203307 [29:47:05<201:27:13,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26187/203307 [29:47:05<201:27:13,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26188/203307 [29:47:08<201:27:07,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26188/203307 [29:47:08<201:27:07,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26189/203307 [29:47:13<201:27:05,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26189/203307 [29:47:13<201:27:05,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26190/203307 [29:47:16<201:26:58,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26190/203307 [29:47:16<201:26:59,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26191/203307 [29:47:20<201:26:52,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26191/203307 [29:47:20<201:26:52,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26192/203307 [29:47:24<201:26:49,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26192/203307 [29:47:25<201:26:49,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26193/203307 [29:47:29<201:26:47,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26193/203307 [29:47:29<201:26:47,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26194/203307 [29:47:33<201:26:44,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26194/203307 [29:47:33<201:26:44,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26195/203307 [29:47:37<201:26:38,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26195/203307 [29:47:37<201:26:38,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26196/203307 [29:47:41<201:26:37,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26196/203307 [29:47:41<201:26:37,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26197/203307 [29:47:46<201:26:34,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26197/203307 [29:47:46<201:26:34,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26198/203307 [29:47:50<201:26:32,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26198/203307 [29:47:50<201:26:32,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26199/203307 [29:47:54<201:26:25,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26199/203307 [29:47:54<201:26:25,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26200/203307 [29:47:58<201:26:18,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26200/203307 [29:47:58<201:26:18,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26201/203307 [29:48:02<201:26:16,  0.24it/s, v_num=t5e6, training/loss=0.0938]Epoch 0:  13%|█▎        | 26201/203307 [29:48:02<201:26:16,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26202/203307 [29:48:06<201:26:10,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26202/203307 [29:48:06<201:26:10,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26203/203307 [29:48:10<201:26:07,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26203/203307 [29:48:10<201:26:08,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26204/203307 [29:48:14<201:26:06,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26204/203307 [29:48:14<201:26:06,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26205/203307 [29:48:18<201:25:59,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26205/203307 [29:48:18<201:25:59,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26206/203307 [29:48:22<201:25:56,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26206/203307 [29:48:22<201:25:56,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26207/203307 [29:48:27<201:25:55,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26207/203307 [29:48:27<201:25:55,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26208/203307 [29:48:31<201:25:49,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26208/203307 [29:48:31<201:25:49,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26209/203307 [29:48:34<201:25:42,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26209/203307 [29:48:34<201:25:42,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26210/203307 [29:48:39<201:25:40,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26210/203307 [29:48:39<201:25:40,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26211/203307 [29:48:42<201:25:33,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26211/203307 [29:48:42<201:25:33,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26212/203307 [29:48:47<201:25:30,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26212/203307 [29:48:47<201:25:30,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26213/203307 [29:48:51<201:25:29,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26213/203307 [29:48:51<201:25:29,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26214/203307 [29:48:55<201:25:25,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26214/203307 [29:48:55<201:25:25,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26215/203307 [29:49:00<201:25:24,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26215/203307 [29:49:00<201:25:24,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26216/203307 [29:49:04<201:25:17,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26216/203307 [29:49:04<201:25:17,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26217/203307 [29:49:07<201:25:10,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26217/203307 [29:49:07<201:25:10,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26218/203307 [29:49:12<201:25:08,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26218/203307 [29:49:12<201:25:08,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26219/203307 [29:49:16<201:25:05,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26219/203307 [29:49:16<201:25:05,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26220/203307 [29:49:20<201:24:58,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26220/203307 [29:49:20<201:24:58,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26221/203307 [29:49:24<201:24:56,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  13%|█▎        | 26221/203307 [29:49:24<201:24:56,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26222/203307 [29:49:28<201:24:54,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26222/203307 [29:49:28<201:24:54,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26223/203307 [29:49:32<201:24:47,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26223/203307 [29:49:32<201:24:47,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26224/203307 [29:49:37<201:24:45,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26224/203307 [29:49:37<201:24:45,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26225/203307 [29:49:40<201:24:39,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26225/203307 [29:49:40<201:24:39,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26226/203307 [29:49:44<201:24:31,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26226/203307 [29:49:44<201:24:32,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26227/203307 [29:49:48<201:24:29,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26227/203307 [29:49:48<201:24:29,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26228/203307 [29:49:52<201:24:23,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26228/203307 [29:49:52<201:24:23,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26229/203307 [29:49:56<201:24:16,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26229/203307 [29:49:56<201:24:16,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26230/203307 [29:50:00<201:24:14,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26230/203307 [29:50:00<201:24:14,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26231/203307 [29:50:04<201:24:11,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26231/203307 [29:50:04<201:24:11,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26232/203307 [29:50:08<201:24:04,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26232/203307 [29:50:08<201:24:04,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26233/203307 [29:50:12<201:24:02,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26233/203307 [29:50:12<201:24:02,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26234/203307 [29:50:16<201:23:56,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26234/203307 [29:50:16<201:23:56,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26235/203307 [29:50:20<201:23:49,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26235/203307 [29:50:20<201:23:49,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26236/203307 [29:50:24<201:23:47,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26236/203307 [29:50:24<201:23:47,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26237/203307 [29:50:28<201:23:41,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26237/203307 [29:50:28<201:23:41,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26238/203307 [29:50:32<201:23:34,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26238/203307 [29:50:32<201:23:34,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26239/203307 [29:50:36<201:23:32,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26239/203307 [29:50:36<201:23:32,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26240/203307 [29:50:40<201:23:25,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26240/203307 [29:50:40<201:23:25,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26241/203307 [29:50:44<201:23:23,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26241/203307 [29:50:44<201:23:23,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26242/203307 [29:50:48<201:23:16,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26242/203307 [29:50:48<201:23:17,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26243/203307 [29:50:52<201:23:09,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26243/203307 [29:50:52<201:23:09,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26244/203307 [29:50:56<201:23:07,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26244/203307 [29:50:56<201:23:07,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26245/203307 [29:51:00<201:23:04,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26245/203307 [29:51:00<201:23:04,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26246/203307 [29:51:04<201:22:57,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26246/203307 [29:51:04<201:22:57,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26247/203307 [29:51:08<201:22:53,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26247/203307 [29:51:08<201:22:53,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26248/203307 [29:51:12<201:22:51,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26248/203307 [29:51:12<201:22:51,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26249/203307 [29:51:16<201:22:45,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26249/203307 [29:51:16<201:22:45,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26250/203307 [29:51:21<201:22:43,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26250/203307 [29:51:21<201:22:43,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26251/203307 [29:51:24<201:22:36,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26251/203307 [29:51:24<201:22:36,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26252/203307 [29:51:28<201:22:30,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26252/203307 [29:51:28<201:22:30,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26253/203307 [29:51:32<201:22:27,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26253/203307 [29:51:32<201:22:27,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26254/203307 [29:51:36<201:22:21,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26254/203307 [29:51:36<201:22:21,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26255/203307 [29:51:40<201:22:13,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26255/203307 [29:51:40<201:22:14,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26256/203307 [29:51:44<201:22:12,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26256/203307 [29:51:44<201:22:12,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26257/203307 [29:51:49<201:22:09,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26257/203307 [29:51:49<201:22:09,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26258/203307 [29:51:52<201:22:02,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26258/203307 [29:51:52<201:22:02,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26259/203307 [29:51:57<201:22:00,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26259/203307 [29:51:57<201:22:00,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26260/203307 [29:52:00<201:21:54,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26260/203307 [29:52:00<201:21:54,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26261/203307 [29:52:04<201:21:47,  0.24it/s, v_num=t5e6, training/loss=0.0894]Epoch 0:  13%|█▎        | 26261/203307 [29:52:04<201:21:47,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26262/203307 [29:52:08<201:21:45,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26262/203307 [29:52:08<201:21:45,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26263/203307 [29:52:12<201:21:38,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26263/203307 [29:52:12<201:21:38,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26264/203307 [29:52:16<201:21:35,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26264/203307 [29:52:16<201:21:35,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26265/203307 [29:52:21<201:21:33,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26265/203307 [29:52:21<201:21:33,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26266/203307 [29:52:25<201:21:30,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26266/203307 [29:52:25<201:21:30,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26267/203307 [29:52:29<201:21:28,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26267/203307 [29:52:29<201:21:28,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26268/203307 [29:52:33<201:21:21,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26268/203307 [29:52:33<201:21:21,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26269/203307 [29:52:37<201:21:15,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26269/203307 [29:52:37<201:21:15,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26270/203307 [29:52:41<201:21:12,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26270/203307 [29:52:41<201:21:12,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26271/203307 [29:52:46<201:21:10,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26271/203307 [29:52:46<201:21:10,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26272/203307 [29:52:50<201:21:06,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26272/203307 [29:52:50<201:21:06,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26273/203307 [29:52:53<201:21:00,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26273/203307 [29:52:53<201:21:00,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26274/203307 [29:52:58<201:20:58,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26274/203307 [29:52:58<201:20:58,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26275/203307 [29:53:02<201:20:55,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26275/203307 [29:53:02<201:20:55,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26276/203307 [29:53:07<201:20:53,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26276/203307 [29:53:07<201:20:53,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26277/203307 [29:53:10<201:20:46,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26277/203307 [29:53:10<201:20:46,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26278/203307 [29:53:14<201:20:39,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26278/203307 [29:53:14<201:20:39,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26279/203307 [29:53:18<201:20:38,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26279/203307 [29:53:18<201:20:38,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26280/203307 [29:53:22<201:20:31,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26280/203307 [29:53:22<201:20:31,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26281/203307 [29:53:26<201:20:28,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  13%|█▎        | 26281/203307 [29:53:26<201:20:28,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26282/203307 [29:53:31<201:20:26,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26282/203307 [29:53:31<201:20:26,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26283/203307 [29:53:34<201:20:19,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26283/203307 [29:53:34<201:20:19,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26284/203307 [29:53:39<201:20:16,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26284/203307 [29:53:39<201:20:16,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26285/203307 [29:53:43<201:20:13,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26285/203307 [29:53:43<201:20:13,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26286/203307 [29:53:47<201:20:06,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26286/203307 [29:53:47<201:20:06,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26287/203307 [29:53:50<201:19:59,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26287/203307 [29:53:50<201:19:59,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26288/203307 [29:53:55<201:19:57,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26288/203307 [29:53:55<201:19:57,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26289/203307 [29:53:59<201:19:54,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26289/203307 [29:53:59<201:19:54,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26290/203307 [29:54:03<201:19:46,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26290/203307 [29:54:03<201:19:47,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26291/203307 [29:54:07<201:19:45,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26291/203307 [29:54:07<201:19:45,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26292/203307 [29:54:11<201:19:38,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26292/203307 [29:54:11<201:19:38,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26293/203307 [29:54:15<201:19:36,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26293/203307 [29:54:15<201:19:36,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26294/203307 [29:54:19<201:19:29,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26294/203307 [29:54:19<201:19:29,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26295/203307 [29:54:22<201:19:22,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26295/203307 [29:54:22<201:19:22,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26296/203307 [29:54:27<201:19:20,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26296/203307 [29:54:27<201:19:20,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26297/203307 [29:54:31<201:19:18,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26297/203307 [29:54:31<201:19:18,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26298/203307 [29:54:35<201:19:11,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26298/203307 [29:54:35<201:19:11,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26299/203307 [29:54:39<201:19:07,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26299/203307 [29:54:39<201:19:07,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26300/203307 [29:54:43<201:19:05,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26300/203307 [29:54:43<201:19:05,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26301/203307 [29:54:47<201:18:59,  0.24it/s, v_num=t5e6, training/loss=0.0843]Epoch 0:  13%|█▎        | 26301/203307 [29:54:47<201:18:59,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26302/203307 [29:54:52<201:18:56,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26302/203307 [29:54:52<201:18:56,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26303/203307 [29:54:55<201:18:50,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26303/203307 [29:54:55<201:18:50,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26304/203307 [29:54:59<201:18:43,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26304/203307 [29:54:59<201:18:43,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26305/203307 [29:55:03<201:18:42,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26305/203307 [29:55:03<201:18:42,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26306/203307 [29:55:08<201:18:39,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26306/203307 [29:55:08<201:18:39,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26307/203307 [29:55:11<201:18:32,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26307/203307 [29:55:11<201:18:32,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26308/203307 [29:55:16<201:18:31,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26308/203307 [29:55:16<201:18:31,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26309/203307 [29:55:20<201:18:24,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26309/203307 [29:55:20<201:18:24,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26310/203307 [29:55:23<201:18:17,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26310/203307 [29:55:23<201:18:17,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26311/203307 [29:55:28<201:18:16,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26311/203307 [29:55:28<201:18:16,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26312/203307 [29:55:32<201:18:09,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26312/203307 [29:55:32<201:18:09,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26313/203307 [29:55:35<201:18:02,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26313/203307 [29:55:35<201:18:02,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26314/203307 [29:55:40<201:18:00,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26314/203307 [29:55:40<201:18:00,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26315/203307 [29:55:44<201:17:56,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26315/203307 [29:55:44<201:17:56,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26316/203307 [29:55:47<201:17:49,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26316/203307 [29:55:47<201:17:49,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26317/203307 [29:55:52<201:17:47,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26317/203307 [29:55:52<201:17:47,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26318/203307 [29:55:55<201:17:40,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26318/203307 [29:55:55<201:17:40,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26319/203307 [29:56:00<201:17:38,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26319/203307 [29:56:00<201:17:38,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26320/203307 [29:56:04<201:17:35,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26320/203307 [29:56:04<201:17:35,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26321/203307 [29:56:08<201:17:29,  0.24it/s, v_num=t5e6, training/loss=0.0824]Epoch 0:  13%|█▎        | 26321/203307 [29:56:08<201:17:29,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26322/203307 [29:56:12<201:17:26,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26322/203307 [29:56:12<201:17:26,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26323/203307 [29:56:16<201:17:23,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26323/203307 [29:56:16<201:17:23,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26324/203307 [29:56:20<201:17:17,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26324/203307 [29:56:20<201:17:17,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26325/203307 [29:56:24<201:17:10,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26325/203307 [29:56:24<201:17:10,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26326/203307 [29:56:28<201:17:09,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26326/203307 [29:56:28<201:17:09,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26327/203307 [29:56:32<201:17:02,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26327/203307 [29:56:32<201:17:02,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26328/203307 [29:56:37<201:17:00,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26328/203307 [29:56:37<201:17:00,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26329/203307 [29:56:41<201:16:57,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26329/203307 [29:56:41<201:16:57,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26330/203307 [29:56:44<201:16:50,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26330/203307 [29:56:44<201:16:50,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26331/203307 [29:56:49<201:16:48,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26331/203307 [29:56:49<201:16:48,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26332/203307 [29:56:53<201:16:41,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26332/203307 [29:56:53<201:16:41,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26333/203307 [29:56:56<201:16:34,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26333/203307 [29:56:56<201:16:34,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26334/203307 [29:57:01<201:16:33,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26334/203307 [29:57:01<201:16:33,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26335/203307 [29:57:05<201:16:27,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26335/203307 [29:57:05<201:16:27,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26336/203307 [29:57:08<201:16:20,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26336/203307 [29:57:08<201:16:20,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26337/203307 [29:57:13<201:16:19,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26337/203307 [29:57:13<201:16:20,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26338/203307 [29:57:17<201:16:17,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26338/203307 [29:57:17<201:16:17,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26339/203307 [29:57:21<201:16:14,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26339/203307 [29:57:21<201:16:14,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26340/203307 [29:57:26<201:16:12,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26340/203307 [29:57:26<201:16:12,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26341/203307 [29:57:30<201:16:06,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  13%|█▎        | 26341/203307 [29:57:30<201:16:06,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26342/203307 [29:57:33<201:16:00,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26342/203307 [29:57:33<201:16:00,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26343/203307 [29:57:38<201:15:59,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26343/203307 [29:57:38<201:15:59,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26344/203307 [29:57:42<201:15:52,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26344/203307 [29:57:42<201:15:52,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26345/203307 [29:57:46<201:15:51,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26345/203307 [29:57:46<201:15:51,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26346/203307 [29:57:50<201:15:44,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26346/203307 [29:57:50<201:15:44,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26347/203307 [29:57:54<201:15:41,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26347/203307 [29:57:54<201:15:41,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26348/203307 [29:57:59<201:15:39,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26348/203307 [29:57:59<201:15:39,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26349/203307 [29:58:03<201:15:37,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26349/203307 [29:58:03<201:15:37,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26350/203307 [29:58:07<201:15:30,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26350/203307 [29:58:07<201:15:30,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26351/203307 [29:58:10<201:15:23,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26351/203307 [29:58:10<201:15:23,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26352/203307 [29:58:15<201:15:23,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26352/203307 [29:58:15<201:15:23,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26353/203307 [29:58:19<201:15:16,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26353/203307 [29:58:19<201:15:16,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26354/203307 [29:58:23<201:15:15,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26354/203307 [29:58:23<201:15:15,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26355/203307 [29:58:27<201:15:08,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26355/203307 [29:58:27<201:15:08,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26356/203307 [29:58:31<201:15:06,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26356/203307 [29:58:31<201:15:06,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26357/203307 [29:58:36<201:15:04,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26357/203307 [29:58:36<201:15:04,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26358/203307 [29:58:39<201:14:57,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26358/203307 [29:58:39<201:14:57,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26359/203307 [29:58:43<201:14:50,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26359/203307 [29:58:43<201:14:50,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26360/203307 [29:58:48<201:14:49,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26360/203307 [29:58:48<201:14:49,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26361/203307 [29:58:51<201:14:42,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 26361/203307 [29:58:51<201:14:42,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26362/203307 [29:58:55<201:14:35,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26362/203307 [29:58:55<201:14:35,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26363/203307 [29:58:59<201:14:33,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26363/203307 [29:58:59<201:14:33,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26364/203307 [29:59:04<201:14:30,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26364/203307 [29:59:04<201:14:30,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26365/203307 [29:59:08<201:14:27,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26365/203307 [29:59:08<201:14:27,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26366/203307 [29:59:12<201:14:24,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26366/203307 [29:59:12<201:14:24,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26367/203307 [29:59:16<201:14:18,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26367/203307 [29:59:16<201:14:18,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26368/203307 [29:59:20<201:14:12,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26368/203307 [29:59:20<201:14:12,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26369/203307 [29:59:24<201:14:11,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26369/203307 [29:59:24<201:14:11,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26370/203307 [29:59:28<201:14:04,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26370/203307 [29:59:28<201:14:05,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26371/203307 [29:59:32<201:14:02,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26371/203307 [29:59:32<201:14:02,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26372/203307 [29:59:37<201:13:59,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26372/203307 [29:59:37<201:13:59,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26373/203307 [29:59:40<201:13:53,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26373/203307 [29:59:40<201:13:53,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26374/203307 [29:59:45<201:13:52,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26374/203307 [29:59:45<201:13:52,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26375/203307 [29:59:49<201:13:49,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26375/203307 [29:59:49<201:13:50,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26376/203307 [29:59:53<201:13:43,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26376/203307 [29:59:53<201:13:43,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26377/203307 [29:59:57<201:13:36,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26377/203307 [29:59:57<201:13:36,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26378/203307 [30:00:01<201:13:35,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26378/203307 [30:00:01<201:13:35,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26379/203307 [30:00:05<201:13:28,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26379/203307 [30:00:05<201:13:28,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26380/203307 [30:00:09<201:13:26,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26380/203307 [30:00:09<201:13:26,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26381/203307 [30:00:14<201:13:24,  0.24it/s, v_num=t5e6, training/loss=0.0769]Epoch 0:  13%|█▎        | 26381/203307 [30:00:14<201:13:24,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26382/203307 [30:00:18<201:13:18,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26382/203307 [30:00:18<201:13:18,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26383/203307 [30:00:22<201:13:16,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26383/203307 [30:00:22<201:13:16,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26384/203307 [30:00:26<201:13:10,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26384/203307 [30:00:26<201:13:10,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26385/203307 [30:00:29<201:13:03,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26385/203307 [30:00:29<201:13:03,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26386/203307 [30:00:34<201:13:02,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26386/203307 [30:00:34<201:13:02,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26387/203307 [30:00:38<201:12:55,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26387/203307 [30:00:38<201:12:55,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26388/203307 [30:00:41<201:12:48,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26388/203307 [30:00:41<201:12:48,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26389/203307 [30:00:46<201:12:47,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26389/203307 [30:00:46<201:12:47,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26390/203307 [30:00:49<201:12:40,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26390/203307 [30:00:49<201:12:40,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26391/203307 [30:00:53<201:12:33,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26391/203307 [30:00:53<201:12:34,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26392/203307 [30:00:58<201:12:32,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26392/203307 [30:00:58<201:12:32,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26393/203307 [30:01:01<201:12:25,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26393/203307 [30:01:01<201:12:25,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26394/203307 [30:01:05<201:12:18,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26394/203307 [30:01:05<201:12:18,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26395/203307 [30:01:10<201:12:17,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26395/203307 [30:01:10<201:12:17,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26396/203307 [30:01:13<201:12:11,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26396/203307 [30:01:13<201:12:11,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26397/203307 [30:01:18<201:12:09,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26397/203307 [30:01:18<201:12:09,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26398/203307 [30:01:21<201:12:02,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26398/203307 [30:01:21<201:12:02,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26399/203307 [30:01:25<201:11:55,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26399/203307 [30:01:25<201:11:55,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26400/203307 [30:01:29<201:11:53,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26400/203307 [30:01:29<201:11:53,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26401/203307 [30:01:34<201:11:50,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  13%|█▎        | 26401/203307 [30:01:34<201:11:50,  0.24it/s, v_num=t5e6, training/loss=0.075] Epoch 0:  13%|█▎        | 26402/203307 [30:01:37<201:11:43,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26402/203307 [30:01:37<201:11:43,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26403/203307 [30:01:41<201:11:36,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26403/203307 [30:01:41<201:11:36,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26404/203307 [30:01:46<201:11:35,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26404/203307 [30:01:46<201:11:35,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26405/203307 [30:01:49<201:11:27,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26405/203307 [30:01:49<201:11:28,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26406/203307 [30:01:54<201:11:25,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26406/203307 [30:01:54<201:11:26,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26407/203307 [30:01:57<201:11:19,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26407/203307 [30:01:57<201:11:19,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26408/203307 [30:02:01<201:11:12,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26408/203307 [30:02:01<201:11:12,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26409/203307 [30:02:05<201:11:10,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26409/203307 [30:02:05<201:11:10,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26410/203307 [30:02:10<201:11:06,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26410/203307 [30:02:10<201:11:06,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26411/203307 [30:02:13<201:10:59,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26411/203307 [30:02:13<201:10:59,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26412/203307 [30:02:18<201:10:57,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26412/203307 [30:02:18<201:10:57,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26413/203307 [30:02:21<201:10:51,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26413/203307 [30:02:21<201:10:51,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26414/203307 [30:02:26<201:10:48,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26414/203307 [30:02:26<201:10:48,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26415/203307 [30:02:30<201:10:46,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26415/203307 [30:02:30<201:10:46,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26416/203307 [30:02:34<201:10:39,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26416/203307 [30:02:34<201:10:39,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26417/203307 [30:02:37<201:10:32,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26417/203307 [30:02:37<201:10:32,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26418/203307 [30:02:42<201:10:31,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26418/203307 [30:02:42<201:10:31,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26419/203307 [30:02:46<201:10:27,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26419/203307 [30:02:46<201:10:27,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26420/203307 [30:02:50<201:10:20,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26420/203307 [30:02:50<201:10:20,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26421/203307 [30:02:54<201:10:18,  0.24it/s, v_num=t5e6, training/loss=0.075]Epoch 0:  13%|█▎        | 26421/203307 [30:02:54<201:10:18,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26422/203307 [30:02:58<201:10:14,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26422/203307 [30:02:58<201:10:14,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26423/203307 [30:03:03<201:10:12,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26423/203307 [30:03:03<201:10:12,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26424/203307 [30:03:06<201:10:05,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26424/203307 [30:03:06<201:10:05,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26425/203307 [30:03:10<201:10:00,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26425/203307 [30:03:10<201:10:00,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26426/203307 [30:03:15<201:09:58,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26426/203307 [30:03:15<201:09:58,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26427/203307 [30:03:19<201:09:57,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26427/203307 [30:03:19<201:09:57,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26428/203307 [30:03:23<201:09:53,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26428/203307 [30:03:23<201:09:53,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26429/203307 [30:03:27<201:09:45,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26429/203307 [30:03:27<201:09:45,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26430/203307 [30:03:31<201:09:43,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26430/203307 [30:03:31<201:09:43,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26431/203307 [30:03:35<201:09:40,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26431/203307 [30:03:36<201:09:40,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26432/203307 [30:03:40<201:09:37,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26432/203307 [30:03:40<201:09:37,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26433/203307 [30:03:43<201:09:30,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26433/203307 [30:03:43<201:09:30,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26434/203307 [30:03:47<201:09:23,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26434/203307 [30:03:47<201:09:23,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26435/203307 [30:03:51<201:09:20,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26435/203307 [30:03:51<201:09:20,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26436/203307 [30:03:55<201:09:14,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26436/203307 [30:03:55<201:09:14,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26437/203307 [30:03:59<201:09:10,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26437/203307 [30:03:59<201:09:10,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26438/203307 [30:04:04<201:09:08,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26438/203307 [30:04:04<201:09:08,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26439/203307 [30:04:08<201:09:04,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26439/203307 [30:04:08<201:09:04,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26440/203307 [30:04:11<201:08:57,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26440/203307 [30:04:11<201:08:57,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26441/203307 [30:04:16<201:08:55,  0.24it/s, v_num=t5e6, training/loss=0.0893]Epoch 0:  13%|█▎        | 26441/203307 [30:04:16<201:08:55,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26442/203307 [30:04:19<201:08:48,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26442/203307 [30:04:19<201:08:48,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26443/203307 [30:04:23<201:08:41,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26443/203307 [30:04:23<201:08:41,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26444/203307 [30:04:27<201:08:38,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26444/203307 [30:04:28<201:08:39,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26445/203307 [30:04:31<201:08:31,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26445/203307 [30:04:31<201:08:31,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26446/203307 [30:04:35<201:08:27,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26446/203307 [30:04:35<201:08:27,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26447/203307 [30:04:40<201:08:25,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26447/203307 [30:04:40<201:08:25,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26448/203307 [30:04:43<201:08:17,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26448/203307 [30:04:43<201:08:18,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26449/203307 [30:04:47<201:08:15,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26449/203307 [30:04:47<201:08:15,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26450/203307 [30:04:51<201:08:08,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26450/203307 [30:04:51<201:08:08,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26451/203307 [30:04:55<201:08:00,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26451/203307 [30:04:55<201:08:00,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26452/203307 [30:04:59<201:07:58,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26452/203307 [30:04:59<201:07:58,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26453/203307 [30:05:03<201:07:54,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26453/203307 [30:05:03<201:07:54,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26454/203307 [30:05:07<201:07:47,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26454/203307 [30:05:07<201:07:47,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26455/203307 [30:05:11<201:07:44,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26455/203307 [30:05:11<201:07:44,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26456/203307 [30:05:15<201:07:41,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26456/203307 [30:05:15<201:07:41,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26457/203307 [30:05:19<201:07:34,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26457/203307 [30:05:19<201:07:34,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26458/203307 [30:05:24<201:07:33,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26458/203307 [30:05:24<201:07:33,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26459/203307 [30:05:27<201:07:25,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26459/203307 [30:05:27<201:07:25,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26460/203307 [30:05:31<201:07:18,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26460/203307 [30:05:31<201:07:18,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26461/203307 [30:05:35<201:07:16,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26461/203307 [30:05:35<201:07:16,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26462/203307 [30:05:39<201:07:09,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26462/203307 [30:05:39<201:07:09,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26463/203307 [30:05:43<201:07:02,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26463/203307 [30:05:43<201:07:02,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26464/203307 [30:05:47<201:07:00,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26464/203307 [30:05:47<201:07:00,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26465/203307 [30:05:51<201:06:54,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26465/203307 [30:05:51<201:06:54,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26466/203307 [30:05:54<201:06:47,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26466/203307 [30:05:54<201:06:47,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26467/203307 [30:05:59<201:06:45,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26467/203307 [30:05:59<201:06:45,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26468/203307 [30:06:02<201:06:38,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26468/203307 [30:06:03<201:06:38,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26469/203307 [30:06:06<201:06:32,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26469/203307 [30:06:06<201:06:32,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26470/203307 [30:06:11<201:06:30,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26470/203307 [30:06:11<201:06:30,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26471/203307 [30:06:14<201:06:23,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26471/203307 [30:06:14<201:06:23,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26472/203307 [30:06:19<201:06:21,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26472/203307 [30:06:19<201:06:21,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26473/203307 [30:06:23<201:06:19,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26473/203307 [30:06:23<201:06:19,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26474/203307 [30:06:27<201:06:12,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26474/203307 [30:06:27<201:06:12,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26475/203307 [30:06:31<201:06:10,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26475/203307 [30:06:31<201:06:10,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26476/203307 [30:06:35<201:06:03,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26476/203307 [30:06:35<201:06:03,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26477/203307 [30:06:39<201:05:57,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26477/203307 [30:06:39<201:05:57,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26478/203307 [30:06:43<201:05:54,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26478/203307 [30:06:43<201:05:54,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26479/203307 [30:06:47<201:05:51,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26479/203307 [30:06:47<201:05:51,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26480/203307 [30:06:51<201:05:44,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26480/203307 [30:06:51<201:05:44,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26481/203307 [30:06:55<201:05:41,  0.24it/s, v_num=t5e6, training/loss=0.0891]Epoch 0:  13%|█▎        | 26481/203307 [30:06:55<201:05:41,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26482/203307 [30:06:59<201:05:39,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26482/203307 [30:06:59<201:05:39,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26483/203307 [30:07:03<201:05:33,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26483/203307 [30:07:03<201:05:33,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26484/203307 [30:07:08<201:05:30,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26484/203307 [30:07:08<201:05:30,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26485/203307 [30:07:11<201:05:24,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26485/203307 [30:07:11<201:05:24,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26486/203307 [30:07:15<201:05:17,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26486/203307 [30:07:15<201:05:17,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26487/203307 [30:07:19<201:05:15,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26487/203307 [30:07:19<201:05:15,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26488/203307 [30:07:23<201:05:08,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26488/203307 [30:07:23<201:05:08,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26489/203307 [30:07:27<201:05:06,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26489/203307 [30:07:27<201:05:06,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26490/203307 [30:07:32<201:05:04,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26490/203307 [30:07:32<201:05:04,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26491/203307 [30:07:36<201:05:00,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26491/203307 [30:07:36<201:05:00,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26492/203307 [30:07:40<201:04:54,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26492/203307 [30:07:40<201:04:54,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26493/203307 [30:07:44<201:04:52,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26493/203307 [30:07:44<201:04:52,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26494/203307 [30:07:48<201:04:45,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26494/203307 [30:07:48<201:04:45,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26495/203307 [30:07:52<201:04:38,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26495/203307 [30:07:52<201:04:38,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26496/203307 [30:07:56<201:04:36,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26496/203307 [30:07:56<201:04:36,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26497/203307 [30:08:00<201:04:32,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26497/203307 [30:08:00<201:04:32,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26498/203307 [30:08:04<201:04:26,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26498/203307 [30:08:04<201:04:26,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26499/203307 [30:08:08<201:04:24,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26499/203307 [30:08:08<201:04:24,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26500/203307 [30:08:12<201:04:21,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26500/203307 [30:08:12<201:04:21,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26501/203307 [30:08:17<201:04:18,  0.24it/s, v_num=t5e6, training/loss=0.0923]Epoch 0:  13%|█▎        | 26501/203307 [30:08:17<201:04:18,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26502/203307 [30:08:21<201:04:12,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26502/203307 [30:08:21<201:04:12,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26503/203307 [30:08:24<201:04:05,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26503/203307 [30:08:24<201:04:05,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26504/203307 [30:08:29<201:04:02,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26504/203307 [30:08:29<201:04:02,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26505/203307 [30:08:33<201:04:00,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26505/203307 [30:08:33<201:04:00,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26506/203307 [30:08:37<201:03:57,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26506/203307 [30:08:37<201:03:57,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26507/203307 [30:08:41<201:03:50,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26507/203307 [30:08:41<201:03:50,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26508/203307 [30:08:45<201:03:48,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26508/203307 [30:08:45<201:03:48,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26509/203307 [30:08:50<201:03:45,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26509/203307 [30:08:50<201:03:45,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26510/203307 [30:08:54<201:03:43,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26510/203307 [30:08:54<201:03:43,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26511/203307 [30:08:58<201:03:36,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26511/203307 [30:08:58<201:03:36,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26512/203307 [30:09:01<201:03:29,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26512/203307 [30:09:01<201:03:29,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26513/203307 [30:09:06<201:03:27,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26513/203307 [30:09:06<201:03:27,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26514/203307 [30:09:10<201:03:24,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26514/203307 [30:09:10<201:03:24,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26515/203307 [30:09:14<201:03:17,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26515/203307 [30:09:14<201:03:17,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26516/203307 [30:09:18<201:03:15,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26516/203307 [30:09:18<201:03:15,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26517/203307 [30:09:22<201:03:09,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26517/203307 [30:09:22<201:03:09,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26518/203307 [30:09:26<201:03:05,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26518/203307 [30:09:26<201:03:05,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26519/203307 [30:09:30<201:03:03,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26519/203307 [30:09:30<201:03:03,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26520/203307 [30:09:34<201:02:56,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26520/203307 [30:09:34<201:02:56,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26521/203307 [30:09:38<201:02:49,  0.24it/s, v_num=t5e6, training/loss=0.0888]Epoch 0:  13%|█▎        | 26521/203307 [30:09:38<201:02:49,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26522/203307 [30:09:42<201:02:46,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26522/203307 [30:09:42<201:02:46,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26523/203307 [30:09:46<201:02:39,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26523/203307 [30:09:46<201:02:39,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26524/203307 [30:09:49<201:02:33,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26524/203307 [30:09:49<201:02:33,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26525/203307 [30:09:54<201:02:31,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26525/203307 [30:09:54<201:02:31,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26526/203307 [30:09:57<201:02:24,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26526/203307 [30:09:57<201:02:24,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26527/203307 [30:10:02<201:02:21,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26527/203307 [30:10:02<201:02:21,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26528/203307 [30:10:05<201:02:14,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26528/203307 [30:10:05<201:02:14,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26529/203307 [30:10:09<201:02:08,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26529/203307 [30:10:09<201:02:08,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26530/203307 [30:10:13<201:02:05,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26530/203307 [30:10:13<201:02:05,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26531/203307 [30:10:18<201:02:02,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26531/203307 [30:10:18<201:02:02,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26532/203307 [30:10:21<201:01:56,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26532/203307 [30:10:21<201:01:56,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26533/203307 [30:10:25<201:01:49,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26533/203307 [30:10:25<201:01:49,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26534/203307 [30:10:30<201:01:48,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26534/203307 [30:10:30<201:01:48,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26535/203307 [30:10:33<201:01:41,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26535/203307 [30:10:33<201:01:41,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26536/203307 [30:10:38<201:01:39,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26536/203307 [30:10:38<201:01:39,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26537/203307 [30:10:41<201:01:32,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26537/203307 [30:10:41<201:01:32,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26538/203307 [30:10:45<201:01:25,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26538/203307 [30:10:45<201:01:25,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26539/203307 [30:10:49<201:01:22,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26539/203307 [30:10:49<201:01:22,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26540/203307 [30:10:53<201:01:15,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26540/203307 [30:10:53<201:01:16,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26541/203307 [30:10:57<201:01:09,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 26541/203307 [30:10:57<201:01:09,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26542/203307 [30:11:01<201:01:07,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26542/203307 [30:11:01<201:01:07,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26543/203307 [30:11:05<201:01:00,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26543/203307 [30:11:05<201:01:00,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26544/203307 [30:11:09<201:00:53,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26544/203307 [30:11:09<201:00:53,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26545/203307 [30:11:13<201:00:51,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26545/203307 [30:11:13<201:00:52,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26546/203307 [30:11:17<201:00:45,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26546/203307 [30:11:17<201:00:45,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26547/203307 [30:11:21<201:00:43,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26547/203307 [30:11:21<201:00:43,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26548/203307 [30:11:25<201:00:40,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26548/203307 [30:11:25<201:00:40,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26549/203307 [30:11:29<201:00:34,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26549/203307 [30:11:29<201:00:34,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26550/203307 [30:11:33<201:00:27,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26550/203307 [30:11:33<201:00:27,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26551/203307 [30:11:37<201:00:26,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26551/203307 [30:11:37<201:00:26,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26552/203307 [30:11:41<201:00:20,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26552/203307 [30:11:41<201:00:20,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26553/203307 [30:11:46<201:00:18,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26553/203307 [30:11:46<201:00:18,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26554/203307 [30:11:50<201:00:14,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26554/203307 [30:11:50<201:00:15,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26555/203307 [30:11:54<201:00:08,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26555/203307 [30:11:54<201:00:08,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26556/203307 [30:11:58<201:00:05,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26556/203307 [30:11:58<201:00:05,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26557/203307 [30:12:02<201:00:03,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26557/203307 [30:12:02<201:00:03,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26558/203307 [30:12:06<200:59:56,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26558/203307 [30:12:06<200:59:56,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26559/203307 [30:12:10<200:59:49,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26559/203307 [30:12:10<200:59:49,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26560/203307 [30:12:14<200:59:48,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26560/203307 [30:12:14<200:59:48,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26561/203307 [30:12:18<200:59:42,  0.24it/s, v_num=t5e6, training/loss=0.0864]Epoch 0:  13%|█▎        | 26561/203307 [30:12:18<200:59:42,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26562/203307 [30:12:22<200:59:40,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26562/203307 [30:12:22<200:59:40,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26563/203307 [30:12:26<200:59:36,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26563/203307 [30:12:26<200:59:36,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26564/203307 [30:12:31<200:59:32,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26564/203307 [30:12:31<200:59:32,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26565/203307 [30:12:35<200:59:30,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26565/203307 [30:12:35<200:59:30,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26566/203307 [30:12:39<200:59:23,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26566/203307 [30:12:39<200:59:23,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26567/203307 [30:12:42<200:59:16,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26567/203307 [30:12:42<200:59:16,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26568/203307 [30:12:47<200:59:14,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26568/203307 [30:12:47<200:59:14,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26569/203307 [30:12:50<200:59:07,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26569/203307 [30:12:50<200:59:07,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26570/203307 [30:12:54<200:59:00,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26570/203307 [30:12:54<200:59:00,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26571/203307 [30:12:58<200:58:58,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26571/203307 [30:12:58<200:58:58,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26572/203307 [30:13:03<200:58:55,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26572/203307 [30:13:03<200:58:55,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26573/203307 [30:13:06<200:58:49,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26573/203307 [30:13:06<200:58:49,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26574/203307 [30:13:11<200:58:46,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26574/203307 [30:13:11<200:58:46,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26575/203307 [30:13:14<200:58:39,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26575/203307 [30:13:14<200:58:39,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26576/203307 [30:13:18<200:58:33,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26576/203307 [30:13:18<200:58:33,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26577/203307 [30:13:23<200:58:31,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26577/203307 [30:13:23<200:58:31,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26578/203307 [30:13:26<200:58:24,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26578/203307 [30:13:26<200:58:24,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26579/203307 [30:13:31<200:58:22,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26579/203307 [30:13:31<200:58:22,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26580/203307 [30:13:34<200:58:16,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26580/203307 [30:13:34<200:58:16,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26581/203307 [30:13:39<200:58:13,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26581/203307 [30:13:39<200:58:13,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26582/203307 [30:13:43<200:58:11,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26582/203307 [30:13:43<200:58:11,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26583/203307 [30:13:47<200:58:08,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26583/203307 [30:13:47<200:58:08,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26584/203307 [30:13:51<200:58:01,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26584/203307 [30:13:51<200:58:01,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26585/203307 [30:13:55<200:57:54,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26585/203307 [30:13:55<200:57:54,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26586/203307 [30:13:59<200:57:52,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26586/203307 [30:13:59<200:57:52,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26587/203307 [30:14:03<200:57:45,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26587/203307 [30:14:03<200:57:45,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26588/203307 [30:14:07<200:57:43,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26588/203307 [30:14:07<200:57:43,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26589/203307 [30:14:11<200:57:39,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26589/203307 [30:14:11<200:57:39,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26590/203307 [30:14:15<200:57:36,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26590/203307 [30:14:15<200:57:36,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26591/203307 [30:14:20<200:57:33,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26591/203307 [30:14:20<200:57:33,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26592/203307 [30:14:24<200:57:27,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26592/203307 [30:14:24<200:57:27,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26593/203307 [30:14:27<200:57:20,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26593/203307 [30:14:27<200:57:20,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26594/203307 [30:14:32<200:57:18,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26594/203307 [30:14:32<200:57:18,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26595/203307 [30:14:35<200:57:12,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26595/203307 [30:14:35<200:57:12,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26596/203307 [30:14:39<200:57:05,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26596/203307 [30:14:39<200:57:05,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26597/203307 [30:14:44<200:57:03,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26597/203307 [30:14:44<200:57:03,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26598/203307 [30:14:47<200:56:57,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26598/203307 [30:14:47<200:56:57,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26599/203307 [30:14:52<200:56:53,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26599/203307 [30:14:52<200:56:53,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26600/203307 [30:14:56<200:56:51,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26600/203307 [30:14:56<200:56:51,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26601/203307 [30:14:59<200:56:44,  0.24it/s, v_num=t5e6, training/loss=0.0925]Epoch 0:  13%|█▎        | 26601/203307 [30:14:59<200:56:44,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26602/203307 [30:15:03<200:56:37,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26602/203307 [30:15:03<200:56:37,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26603/203307 [30:15:08<200:56:36,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26603/203307 [30:15:08<200:56:36,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26604/203307 [30:15:11<200:56:29,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26604/203307 [30:15:11<200:56:29,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26605/203307 [30:15:16<200:56:27,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26605/203307 [30:15:16<200:56:27,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26606/203307 [30:15:20<200:56:24,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26606/203307 [30:15:20<200:56:24,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26607/203307 [30:15:24<200:56:17,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26607/203307 [30:15:24<200:56:17,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26608/203307 [30:15:28<200:56:14,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26608/203307 [30:15:28<200:56:14,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26609/203307 [30:15:32<200:56:12,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26609/203307 [30:15:32<200:56:12,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26610/203307 [30:15:36<200:56:05,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26610/203307 [30:15:36<200:56:05,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26611/203307 [30:15:40<200:55:58,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26611/203307 [30:15:40<200:55:58,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26612/203307 [30:15:44<200:55:57,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26612/203307 [30:15:44<200:55:57,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26613/203307 [30:15:48<200:55:50,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26613/203307 [30:15:48<200:55:50,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26614/203307 [30:15:52<200:55:48,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26614/203307 [30:15:52<200:55:48,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26615/203307 [30:15:56<200:55:41,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26615/203307 [30:15:56<200:55:41,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26616/203307 [30:16:00<200:55:34,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26616/203307 [30:16:00<200:55:34,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26617/203307 [30:16:04<200:55:32,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26617/203307 [30:16:04<200:55:32,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26618/203307 [30:16:08<200:55:25,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26618/203307 [30:16:08<200:55:25,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26619/203307 [30:16:11<200:55:18,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26619/203307 [30:16:11<200:55:18,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26620/203307 [30:16:16<200:55:16,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26620/203307 [30:16:16<200:55:16,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26621/203307 [30:16:19<200:55:09,  0.24it/s, v_num=t5e6, training/loss=0.0962]Epoch 0:  13%|█▎        | 26621/203307 [30:16:19<200:55:10,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26622/203307 [30:16:24<200:55:06,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26622/203307 [30:16:24<200:55:06,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26623/203307 [30:16:28<200:55:04,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26623/203307 [30:16:28<200:55:04,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26624/203307 [30:16:32<200:54:57,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26624/203307 [30:16:32<200:54:57,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26625/203307 [30:16:35<200:54:50,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26625/203307 [30:16:35<200:54:50,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26626/203307 [30:16:40<200:54:48,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26626/203307 [30:16:40<200:54:48,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26627/203307 [30:16:43<200:54:40,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26627/203307 [30:16:43<200:54:40,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26628/203307 [30:16:47<200:54:33,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26628/203307 [30:16:47<200:54:34,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26629/203307 [30:16:51<200:54:32,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26629/203307 [30:16:51<200:54:32,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26630/203307 [30:16:55<200:54:24,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26630/203307 [30:16:55<200:54:24,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26631/203307 [30:16:59<200:54:22,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26631/203307 [30:16:59<200:54:22,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26632/203307 [30:17:03<200:54:15,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26632/203307 [30:17:03<200:54:15,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26633/203307 [30:17:07<200:54:08,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26633/203307 [30:17:07<200:54:08,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26634/203307 [30:17:11<200:54:06,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26634/203307 [30:17:11<200:54:06,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26635/203307 [30:17:16<200:54:04,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26635/203307 [30:17:16<200:54:04,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26636/203307 [30:17:19<200:53:58,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26636/203307 [30:17:19<200:53:58,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26637/203307 [30:17:23<200:53:52,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26637/203307 [30:17:23<200:53:52,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26638/203307 [30:17:28<200:53:50,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26638/203307 [30:17:28<200:53:50,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26639/203307 [30:17:32<200:53:47,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26639/203307 [30:17:32<200:53:47,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26640/203307 [30:17:36<200:53:45,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26640/203307 [30:17:36<200:53:45,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26641/203307 [30:17:40<200:53:39,  0.24it/s, v_num=t5e6, training/loss=0.0762]Epoch 0:  13%|█▎        | 26641/203307 [30:17:40<200:53:39,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26642/203307 [30:17:44<200:53:32,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26642/203307 [30:17:44<200:53:32,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26643/203307 [30:17:48<200:53:30,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26643/203307 [30:17:48<200:53:30,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26644/203307 [30:17:52<200:53:27,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26644/203307 [30:17:52<200:53:27,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26645/203307 [30:17:56<200:53:20,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26645/203307 [30:17:56<200:53:20,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26646/203307 [30:18:00<200:53:18,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26646/203307 [30:18:00<200:53:18,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26647/203307 [30:18:05<200:53:15,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26647/203307 [30:18:05<200:53:15,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26648/203307 [30:18:08<200:53:09,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26648/203307 [30:18:08<200:53:09,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26649/203307 [30:18:13<200:53:06,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26649/203307 [30:18:13<200:53:06,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26650/203307 [30:18:16<200:52:59,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26650/203307 [30:18:16<200:52:59,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26651/203307 [30:18:20<200:52:53,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26651/203307 [30:18:20<200:52:53,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26652/203307 [30:18:25<200:52:52,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26652/203307 [30:18:25<200:52:52,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26653/203307 [30:18:29<200:52:47,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26653/203307 [30:18:29<200:52:47,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26654/203307 [30:18:32<200:52:40,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26654/203307 [30:18:32<200:52:40,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26655/203307 [30:18:37<200:52:39,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26655/203307 [30:18:37<200:52:39,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26656/203307 [30:18:41<200:52:36,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26656/203307 [30:18:41<200:52:36,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26657/203307 [30:18:46<200:52:34,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26657/203307 [30:18:46<200:52:34,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26658/203307 [30:18:49<200:52:28,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26658/203307 [30:18:49<200:52:28,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26659/203307 [30:18:53<200:52:22,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26659/203307 [30:18:53<200:52:22,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26660/203307 [30:18:58<200:52:20,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26660/203307 [30:18:58<200:52:20,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26661/203307 [30:19:02<200:52:18,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  13%|█▎        | 26661/203307 [30:19:02<200:52:18,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26662/203307 [30:19:06<200:52:13,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26662/203307 [30:19:06<200:52:13,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26663/203307 [30:19:10<200:52:07,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26663/203307 [30:19:10<200:52:07,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26664/203307 [30:19:14<200:52:05,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26664/203307 [30:19:14<200:52:05,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26665/203307 [30:19:18<200:51:59,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26665/203307 [30:19:18<200:51:59,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26666/203307 [30:19:23<200:51:58,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26666/203307 [30:19:23<200:51:58,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26667/203307 [30:19:26<200:51:52,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26667/203307 [30:19:26<200:51:52,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26668/203307 [30:19:30<200:51:46,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26668/203307 [30:19:30<200:51:46,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26669/203307 [30:19:35<200:51:44,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26669/203307 [30:19:35<200:51:44,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26670/203307 [30:19:38<200:51:37,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26670/203307 [30:19:38<200:51:37,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26671/203307 [30:19:42<200:51:33,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26671/203307 [30:19:42<200:51:33,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26672/203307 [30:19:47<200:51:31,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26672/203307 [30:19:47<200:51:31,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26673/203307 [30:19:50<200:51:24,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26673/203307 [30:19:50<200:51:24,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26674/203307 [30:19:54<200:51:17,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26674/203307 [30:19:54<200:51:17,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26675/203307 [30:19:59<200:51:16,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26675/203307 [30:19:59<200:51:16,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26676/203307 [30:20:02<200:51:09,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26676/203307 [30:20:02<200:51:09,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26677/203307 [30:20:06<200:51:03,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26677/203307 [30:20:06<200:51:03,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26678/203307 [30:20:10<200:51:00,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26678/203307 [30:20:10<200:51:00,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26679/203307 [30:20:14<200:50:53,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26679/203307 [30:20:14<200:50:53,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26680/203307 [30:20:18<200:50:49,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26680/203307 [30:20:18<200:50:50,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26681/203307 [30:20:23<200:50:48,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 26681/203307 [30:20:23<200:50:48,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26682/203307 [30:20:26<200:50:41,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26682/203307 [30:20:26<200:50:41,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26683/203307 [30:20:31<200:50:39,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26683/203307 [30:20:31<200:50:39,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26684/203307 [30:20:35<200:50:33,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26684/203307 [30:20:35<200:50:33,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26685/203307 [30:20:38<200:50:26,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26685/203307 [30:20:38<200:50:26,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26686/203307 [30:20:43<200:50:24,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26686/203307 [30:20:43<200:50:24,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26687/203307 [30:20:47<200:50:21,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26687/203307 [30:20:47<200:50:21,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26688/203307 [30:20:51<200:50:15,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26688/203307 [30:20:51<200:50:15,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26689/203307 [30:20:55<200:50:12,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26689/203307 [30:20:55<200:50:12,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26690/203307 [30:20:59<200:50:10,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26690/203307 [30:20:59<200:50:10,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26691/203307 [30:21:03<200:50:04,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26691/203307 [30:21:03<200:50:04,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26692/203307 [30:21:08<200:50:02,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26692/203307 [30:21:08<200:50:02,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26693/203307 [30:21:11<200:49:55,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26693/203307 [30:21:11<200:49:55,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26694/203307 [30:21:15<200:49:48,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26694/203307 [30:21:15<200:49:48,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26695/203307 [30:21:19<200:49:45,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26695/203307 [30:21:19<200:49:45,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26696/203307 [30:21:23<200:49:38,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26696/203307 [30:21:23<200:49:38,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26697/203307 [30:21:27<200:49:35,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26697/203307 [30:21:27<200:49:35,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26698/203307 [30:21:31<200:49:33,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26698/203307 [30:21:31<200:49:33,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26699/203307 [30:21:35<200:49:26,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26699/203307 [30:21:35<200:49:26,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26700/203307 [30:21:39<200:49:19,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26700/203307 [30:21:39<200:49:19,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26701/203307 [30:21:43<200:49:17,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  13%|█▎        | 26701/203307 [30:21:43<200:49:17,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26702/203307 [30:21:47<200:49:10,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26702/203307 [30:21:47<200:49:10,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26703/203307 [30:21:51<200:49:03,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26703/203307 [30:21:51<200:49:03,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26704/203307 [30:21:55<200:49:01,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26704/203307 [30:21:55<200:49:01,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26705/203307 [30:21:59<200:48:54,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26705/203307 [30:21:59<200:48:54,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26706/203307 [30:22:03<200:48:51,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26706/203307 [30:22:03<200:48:51,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26707/203307 [30:22:07<200:48:49,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26707/203307 [30:22:07<200:48:49,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26708/203307 [30:22:11<200:48:42,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26708/203307 [30:22:11<200:48:42,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26709/203307 [30:22:15<200:48:40,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26709/203307 [30:22:15<200:48:40,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26710/203307 [30:22:19<200:48:34,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26710/203307 [30:22:19<200:48:34,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26711/203307 [30:22:23<200:48:27,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26711/203307 [30:22:23<200:48:27,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26712/203307 [30:22:27<200:48:25,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26712/203307 [30:22:27<200:48:25,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26713/203307 [30:22:32<200:48:23,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26713/203307 [30:22:32<200:48:23,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26714/203307 [30:22:36<200:48:19,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26714/203307 [30:22:36<200:48:19,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26715/203307 [30:22:39<200:48:13,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26715/203307 [30:22:39<200:48:13,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26716/203307 [30:22:44<200:48:11,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26716/203307 [30:22:44<200:48:11,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26717/203307 [30:22:48<200:48:05,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26717/203307 [30:22:48<200:48:05,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26718/203307 [30:22:52<200:48:03,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26718/203307 [30:22:52<200:48:03,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26719/203307 [30:22:56<200:47:56,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26719/203307 [30:22:56<200:47:56,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26720/203307 [30:23:00<200:47:50,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26720/203307 [30:23:00<200:47:50,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26721/203307 [30:23:04<200:47:48,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  13%|█▎        | 26721/203307 [30:23:04<200:47:48,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26722/203307 [30:23:08<200:47:44,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26722/203307 [30:23:08<200:47:44,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26723/203307 [30:23:12<200:47:38,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26723/203307 [30:23:12<200:47:38,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26724/203307 [30:23:16<200:47:36,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26724/203307 [30:23:16<200:47:36,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26725/203307 [30:23:21<200:47:33,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26725/203307 [30:23:21<200:47:33,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26726/203307 [30:23:24<200:47:26,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26726/203307 [30:23:24<200:47:26,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26727/203307 [30:23:29<200:47:24,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26727/203307 [30:23:29<200:47:24,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26728/203307 [30:23:32<200:47:18,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26728/203307 [30:23:32<200:47:18,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26729/203307 [30:23:36<200:47:11,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26729/203307 [30:23:36<200:47:11,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26730/203307 [30:23:41<200:47:09,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26730/203307 [30:23:41<200:47:09,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26731/203307 [30:23:45<200:47:06,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26731/203307 [30:23:45<200:47:06,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26732/203307 [30:23:49<200:47:00,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26732/203307 [30:23:49<200:47:00,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26733/203307 [30:23:53<200:46:58,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26733/203307 [30:23:53<200:46:59,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26734/203307 [30:23:57<200:46:55,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26734/203307 [30:23:57<200:46:55,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26735/203307 [30:24:02<200:46:52,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26735/203307 [30:24:02<200:46:52,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26736/203307 [30:24:05<200:46:46,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26736/203307 [30:24:05<200:46:46,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26737/203307 [30:24:09<200:46:39,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26737/203307 [30:24:09<200:46:39,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26738/203307 [30:24:13<200:46:36,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26738/203307 [30:24:13<200:46:36,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26739/203307 [30:24:17<200:46:33,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26739/203307 [30:24:18<200:46:33,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26740/203307 [30:24:21<200:46:26,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26740/203307 [30:24:21<200:46:26,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26741/203307 [30:24:25<200:46:20,  0.24it/s, v_num=t5e6, training/loss=0.0734]Epoch 0:  13%|█▎        | 26741/203307 [30:24:25<200:46:20,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26742/203307 [30:24:29<200:46:18,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26742/203307 [30:24:29<200:46:18,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26743/203307 [30:24:34<200:46:15,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26743/203307 [30:24:34<200:46:15,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26744/203307 [30:24:38<200:46:12,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26744/203307 [30:24:38<200:46:12,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26745/203307 [30:24:42<200:46:05,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26745/203307 [30:24:42<200:46:05,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26746/203307 [30:24:45<200:45:58,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26746/203307 [30:24:45<200:45:58,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26747/203307 [30:24:50<200:45:56,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26747/203307 [30:24:50<200:45:56,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26748/203307 [30:24:53<200:45:49,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26748/203307 [30:24:53<200:45:49,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26749/203307 [30:24:57<200:45:42,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26749/203307 [30:24:57<200:45:43,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26750/203307 [30:25:01<200:45:41,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26750/203307 [30:25:01<200:45:41,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26751/203307 [30:25:05<200:45:35,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26751/203307 [30:25:05<200:45:35,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26752/203307 [30:25:09<200:45:31,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26752/203307 [30:25:09<200:45:31,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26753/203307 [30:25:14<200:45:29,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26753/203307 [30:25:14<200:45:29,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26754/203307 [30:25:18<200:45:23,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26754/203307 [30:25:18<200:45:23,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26755/203307 [30:25:21<200:45:16,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26755/203307 [30:25:21<200:45:16,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26756/203307 [30:25:26<200:45:14,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26756/203307 [30:25:26<200:45:14,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26757/203307 [30:25:29<200:45:07,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26757/203307 [30:25:29<200:45:07,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26758/203307 [30:25:33<200:45:01,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26758/203307 [30:25:33<200:45:01,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26759/203307 [30:25:38<200:44:59,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26759/203307 [30:25:38<200:44:59,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26760/203307 [30:25:41<200:44:52,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26760/203307 [30:25:41<200:44:53,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26761/203307 [30:25:46<200:44:51,  0.24it/s, v_num=t5e6, training/loss=0.0922]Epoch 0:  13%|█▎        | 26761/203307 [30:25:46<200:44:51,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26762/203307 [30:25:49<200:44:44,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26762/203307 [30:25:49<200:44:44,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26763/203307 [30:25:53<200:44:37,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26763/203307 [30:25:53<200:44:37,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26764/203307 [30:25:57<200:44:34,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26764/203307 [30:25:57<200:44:34,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26765/203307 [30:26:02<200:44:32,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26765/203307 [30:26:02<200:44:32,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26766/203307 [30:26:05<200:44:25,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26766/203307 [30:26:05<200:44:25,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26767/203307 [30:26:09<200:44:18,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26767/203307 [30:26:09<200:44:18,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26768/203307 [30:26:14<200:44:17,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26768/203307 [30:26:14<200:44:17,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26769/203307 [30:26:17<200:44:10,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26769/203307 [30:26:17<200:44:10,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26770/203307 [30:26:22<200:44:09,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26770/203307 [30:26:22<200:44:09,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26771/203307 [30:26:26<200:44:03,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26771/203307 [30:26:26<200:44:03,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26772/203307 [30:26:30<200:44:00,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26772/203307 [30:26:30<200:44:00,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26773/203307 [30:26:34<200:43:57,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26773/203307 [30:26:34<200:43:57,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26774/203307 [30:26:38<200:43:51,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26774/203307 [30:26:38<200:43:51,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26775/203307 [30:26:42<200:43:44,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26775/203307 [30:26:42<200:43:44,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26776/203307 [30:26:46<200:43:43,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26776/203307 [30:26:46<200:43:43,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26777/203307 [30:26:50<200:43:36,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26777/203307 [30:26:50<200:43:36,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26778/203307 [30:26:54<200:43:30,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26778/203307 [30:26:54<200:43:30,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26779/203307 [30:26:58<200:43:29,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26779/203307 [30:26:58<200:43:29,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26780/203307 [30:27:02<200:43:22,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26780/203307 [30:27:02<200:43:22,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26781/203307 [30:27:06<200:43:20,  0.24it/s, v_num=t5e6, training/loss=0.0839]Epoch 0:  13%|█▎        | 26781/203307 [30:27:06<200:43:20,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26782/203307 [30:27:11<200:43:18,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26782/203307 [30:27:11<200:43:18,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26783/203307 [30:27:14<200:43:11,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26783/203307 [30:27:14<200:43:11,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26784/203307 [30:27:18<200:43:05,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26784/203307 [30:27:18<200:43:05,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26785/203307 [30:27:23<200:43:05,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26785/203307 [30:27:23<200:43:05,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26786/203307 [30:27:27<200:42:59,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26786/203307 [30:27:27<200:42:59,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26787/203307 [30:27:31<200:42:57,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26787/203307 [30:27:31<200:42:57,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26788/203307 [30:27:35<200:42:54,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26788/203307 [30:27:35<200:42:54,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26789/203307 [30:27:40<200:42:51,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26789/203307 [30:27:40<200:42:51,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26790/203307 [30:27:44<200:42:49,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26790/203307 [30:27:44<200:42:49,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26791/203307 [30:27:48<200:42:47,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26791/203307 [30:27:48<200:42:47,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26792/203307 [30:27:52<200:42:40,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26792/203307 [30:27:52<200:42:40,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26793/203307 [30:27:56<200:42:34,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26793/203307 [30:27:56<200:42:34,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26794/203307 [30:28:00<200:42:33,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26794/203307 [30:28:00<200:42:33,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26795/203307 [30:28:04<200:42:26,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26795/203307 [30:28:04<200:42:26,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26796/203307 [30:28:09<200:42:25,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26796/203307 [30:28:09<200:42:25,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26797/203307 [30:28:13<200:42:23,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26797/203307 [30:28:13<200:42:23,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26798/203307 [30:28:17<200:42:17,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26798/203307 [30:28:17<200:42:17,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26799/203307 [30:28:21<200:42:14,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26799/203307 [30:28:21<200:42:14,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26800/203307 [30:28:25<200:42:08,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26800/203307 [30:28:25<200:42:08,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26801/203307 [30:28:29<200:42:02,  0.24it/s, v_num=t5e6, training/loss=0.0755]Epoch 0:  13%|█▎        | 26801/203307 [30:28:29<200:42:02,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26802/203307 [30:28:33<200:42:01,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26802/203307 [30:28:33<200:42:01,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26803/203307 [30:28:37<200:41:54,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26803/203307 [30:28:37<200:41:54,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26804/203307 [30:28:41<200:41:47,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26804/203307 [30:28:41<200:41:47,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26805/203307 [30:28:45<200:41:46,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26805/203307 [30:28:45<200:41:46,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26806/203307 [30:28:49<200:41:43,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26806/203307 [30:28:49<200:41:43,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26807/203307 [30:28:53<200:41:36,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26807/203307 [30:28:53<200:41:37,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26808/203307 [30:28:57<200:41:34,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26808/203307 [30:28:57<200:41:34,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26809/203307 [30:29:01<200:41:28,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26809/203307 [30:29:01<200:41:28,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26810/203307 [30:29:05<200:41:21,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26810/203307 [30:29:05<200:41:21,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26811/203307 [30:29:09<200:41:20,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26811/203307 [30:29:09<200:41:20,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26812/203307 [30:29:13<200:41:13,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26812/203307 [30:29:13<200:41:13,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26813/203307 [30:29:18<200:41:12,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26813/203307 [30:29:18<200:41:12,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26814/203307 [30:29:22<200:41:09,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26814/203307 [30:29:22<200:41:09,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26815/203307 [30:29:26<200:41:07,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26815/203307 [30:29:26<200:41:07,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26816/203307 [30:29:31<200:41:04,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26816/203307 [30:29:31<200:41:04,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26817/203307 [30:29:35<200:41:01,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26817/203307 [30:29:35<200:41:01,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26818/203307 [30:29:39<200:40:55,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26818/203307 [30:29:39<200:40:55,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26819/203307 [30:29:42<200:40:48,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26819/203307 [30:29:42<200:40:48,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26820/203307 [30:29:47<200:40:46,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26820/203307 [30:29:47<200:40:46,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26821/203307 [30:29:50<200:40:40,  0.24it/s, v_num=t5e6, training/loss=0.0902]Epoch 0:  13%|█▎        | 26821/203307 [30:29:50<200:40:40,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26822/203307 [30:29:55<200:40:38,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26822/203307 [30:29:55<200:40:38,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26823/203307 [30:29:59<200:40:31,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26823/203307 [30:29:59<200:40:31,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26824/203307 [30:30:03<200:40:28,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26824/203307 [30:30:03<200:40:28,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26825/203307 [30:30:07<200:40:26,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26825/203307 [30:30:07<200:40:26,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26826/203307 [30:30:11<200:40:19,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26826/203307 [30:30:11<200:40:19,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26827/203307 [30:30:15<200:40:13,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26827/203307 [30:30:15<200:40:13,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26828/203307 [30:30:19<200:40:11,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26828/203307 [30:30:19<200:40:11,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26829/203307 [30:30:23<200:40:05,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26829/203307 [30:30:23<200:40:05,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26830/203307 [30:30:27<200:39:59,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26830/203307 [30:30:27<200:39:59,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26831/203307 [30:30:31<200:39:57,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26831/203307 [30:30:31<200:39:57,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26832/203307 [30:30:35<200:39:50,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26832/203307 [30:30:35<200:39:50,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26833/203307 [30:30:39<200:39:47,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26833/203307 [30:30:39<200:39:47,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26834/203307 [30:30:43<200:39:45,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26834/203307 [30:30:43<200:39:45,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26835/203307 [30:30:47<200:39:38,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26835/203307 [30:30:47<200:39:38,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26836/203307 [30:30:51<200:39:32,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26836/203307 [30:30:51<200:39:32,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26837/203307 [30:30:55<200:39:30,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26837/203307 [30:30:55<200:39:30,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26838/203307 [30:30:59<200:39:23,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26838/203307 [30:30:59<200:39:23,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26839/203307 [30:31:04<200:39:22,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26839/203307 [30:31:04<200:39:22,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26840/203307 [30:31:07<200:39:15,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26840/203307 [30:31:07<200:39:15,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26841/203307 [30:31:11<200:39:09,  0.24it/s, v_num=t5e6, training/loss=0.0729]Epoch 0:  13%|█▎        | 26841/203307 [30:31:11<200:39:09,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26842/203307 [30:31:15<200:39:06,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26842/203307 [30:31:15<200:39:06,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26843/203307 [30:31:20<200:39:04,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26843/203307 [30:31:20<200:39:04,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26844/203307 [30:31:24<200:38:58,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26844/203307 [30:31:24<200:38:58,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26845/203307 [30:31:27<200:38:52,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26845/203307 [30:31:27<200:38:52,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26846/203307 [30:31:32<200:38:51,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26846/203307 [30:31:32<200:38:51,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26847/203307 [30:31:36<200:38:49,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26847/203307 [30:31:36<200:38:49,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26848/203307 [30:31:41<200:38:47,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26848/203307 [30:31:41<200:38:48,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26849/203307 [30:31:44<200:38:41,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26849/203307 [30:31:45<200:38:41,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26850/203307 [30:31:48<200:38:35,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26850/203307 [30:31:48<200:38:35,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26851/203307 [30:31:53<200:38:33,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26851/203307 [30:31:53<200:38:33,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26852/203307 [30:31:57<200:38:27,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26852/203307 [30:31:57<200:38:27,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26853/203307 [30:32:00<200:38:21,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26853/203307 [30:32:00<200:38:21,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26854/203307 [30:32:05<200:38:20,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26854/203307 [30:32:05<200:38:20,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26855/203307 [30:32:09<200:38:14,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26855/203307 [30:32:09<200:38:14,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26856/203307 [30:32:13<200:38:12,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26856/203307 [30:32:13<200:38:12,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26857/203307 [30:32:17<200:38:10,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26857/203307 [30:32:17<200:38:10,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26858/203307 [30:32:21<200:38:04,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26858/203307 [30:32:21<200:38:04,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26859/203307 [30:32:25<200:37:57,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26859/203307 [30:32:25<200:37:57,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26860/203307 [30:32:29<200:37:55,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26860/203307 [30:32:29<200:37:55,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26861/203307 [30:32:33<200:37:49,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 26861/203307 [30:32:33<200:37:49,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26862/203307 [30:32:37<200:37:42,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26862/203307 [30:32:37<200:37:42,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26863/203307 [30:32:41<200:37:41,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26863/203307 [30:32:41<200:37:41,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26864/203307 [30:32:46<200:37:37,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26864/203307 [30:32:46<200:37:37,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26865/203307 [30:32:50<200:37:35,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26865/203307 [30:32:50<200:37:35,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26866/203307 [30:32:54<200:37:28,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26866/203307 [30:32:54<200:37:28,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26867/203307 [30:32:57<200:37:22,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26867/203307 [30:32:57<200:37:22,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26868/203307 [30:33:02<200:37:19,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26868/203307 [30:33:02<200:37:19,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26869/203307 [30:33:06<200:37:16,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26869/203307 [30:33:06<200:37:16,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26870/203307 [30:33:10<200:37:10,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26870/203307 [30:33:10<200:37:10,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26871/203307 [30:33:13<200:37:03,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26871/203307 [30:33:13<200:37:03,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26872/203307 [30:33:18<200:37:02,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26872/203307 [30:33:18<200:37:02,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26873/203307 [30:33:22<200:36:56,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26873/203307 [30:33:22<200:36:56,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26874/203307 [30:33:26<200:36:55,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26874/203307 [30:33:26<200:36:55,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26875/203307 [30:33:30<200:36:49,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26875/203307 [30:33:30<200:36:49,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26876/203307 [30:33:34<200:36:42,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26876/203307 [30:33:34<200:36:42,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26877/203307 [30:33:38<200:36:40,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26877/203307 [30:33:38<200:36:40,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26878/203307 [30:33:42<200:36:37,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26878/203307 [30:33:42<200:36:37,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26879/203307 [30:33:46<200:36:30,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26879/203307 [30:33:46<200:36:30,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26880/203307 [30:33:50<200:36:28,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26880/203307 [30:33:50<200:36:28,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26881/203307 [30:33:55<200:36:26,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  13%|█▎        | 26881/203307 [30:33:55<200:36:26,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26882/203307 [30:33:59<200:36:20,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26882/203307 [30:33:59<200:36:20,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26883/203307 [30:34:03<200:36:19,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26883/203307 [30:34:03<200:36:19,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26884/203307 [30:34:07<200:36:13,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26884/203307 [30:34:07<200:36:13,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26885/203307 [30:34:11<200:36:06,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26885/203307 [30:34:11<200:36:06,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26886/203307 [30:34:15<200:36:04,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26886/203307 [30:34:15<200:36:04,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26887/203307 [30:34:19<200:36:01,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26887/203307 [30:34:19<200:36:01,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26888/203307 [30:34:23<200:35:54,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26888/203307 [30:34:23<200:35:54,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26889/203307 [30:34:27<200:35:52,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26889/203307 [30:34:27<200:35:52,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26890/203307 [30:34:31<200:35:46,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26890/203307 [30:34:31<200:35:46,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26891/203307 [30:34:36<200:35:43,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26891/203307 [30:34:36<200:35:44,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26892/203307 [30:34:39<200:35:37,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26892/203307 [30:34:39<200:35:37,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26893/203307 [30:34:43<200:35:30,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26893/203307 [30:34:43<200:35:30,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26894/203307 [30:34:47<200:35:28,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26894/203307 [30:34:47<200:35:28,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26895/203307 [30:34:52<200:35:25,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26895/203307 [30:34:52<200:35:25,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26896/203307 [30:34:56<200:35:21,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26896/203307 [30:34:56<200:35:21,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26897/203307 [30:35:00<200:35:19,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26897/203307 [30:35:00<200:35:19,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26898/203307 [30:35:04<200:35:17,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26898/203307 [30:35:04<200:35:17,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26899/203307 [30:35:08<200:35:11,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26899/203307 [30:35:08<200:35:11,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26900/203307 [30:35:13<200:35:09,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26900/203307 [30:35:13<200:35:09,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26901/203307 [30:35:17<200:35:03,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  13%|█▎        | 26901/203307 [30:35:17<200:35:03,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26902/203307 [30:35:20<200:34:57,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26902/203307 [30:35:20<200:34:57,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26903/203307 [30:35:25<200:34:55,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26903/203307 [30:35:25<200:34:55,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26904/203307 [30:35:29<200:34:49,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26904/203307 [30:35:29<200:34:49,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26905/203307 [30:35:33<200:34:45,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26905/203307 [30:35:33<200:34:45,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26906/203307 [30:35:37<200:34:44,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26906/203307 [30:35:37<200:34:44,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26907/203307 [30:35:41<200:34:37,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26907/203307 [30:35:41<200:34:37,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26908/203307 [30:35:45<200:34:30,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26908/203307 [30:35:45<200:34:30,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26909/203307 [30:35:49<200:34:29,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26909/203307 [30:35:49<200:34:29,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26910/203307 [30:35:53<200:34:22,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26910/203307 [30:35:53<200:34:22,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26911/203307 [30:35:56<200:34:15,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26911/203307 [30:35:56<200:34:15,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26912/203307 [30:36:01<200:34:13,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26912/203307 [30:36:01<200:34:13,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26913/203307 [30:36:05<200:34:07,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26913/203307 [30:36:05<200:34:07,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26914/203307 [30:36:09<200:34:04,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26914/203307 [30:36:09<200:34:04,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26915/203307 [30:36:13<200:34:01,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26915/203307 [30:36:13<200:34:01,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26916/203307 [30:36:17<200:33:56,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26916/203307 [30:36:17<200:33:56,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26917/203307 [30:36:21<200:33:54,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26917/203307 [30:36:21<200:33:54,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26918/203307 [30:36:25<200:33:47,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26918/203307 [30:36:25<200:33:47,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26919/203307 [30:36:29<200:33:41,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26919/203307 [30:36:29<200:33:41,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26920/203307 [30:36:33<200:33:38,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26920/203307 [30:36:33<200:33:38,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26921/203307 [30:36:38<200:33:36,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  13%|█▎        | 26921/203307 [30:36:38<200:33:36,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26922/203307 [30:36:42<200:33:33,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26922/203307 [30:36:42<200:33:33,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26923/203307 [30:36:46<200:33:29,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26923/203307 [30:36:46<200:33:29,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26924/203307 [30:36:50<200:33:27,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26924/203307 [30:36:50<200:33:27,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26925/203307 [30:36:54<200:33:20,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26925/203307 [30:36:54<200:33:20,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26926/203307 [30:36:59<200:33:18,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26926/203307 [30:36:59<200:33:18,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26927/203307 [30:37:02<200:33:12,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26927/203307 [30:37:02<200:33:12,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26928/203307 [30:37:06<200:33:05,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26928/203307 [30:37:06<200:33:05,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26929/203307 [30:37:10<200:33:02,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26929/203307 [30:37:10<200:33:02,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26930/203307 [30:37:14<200:32:56,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26930/203307 [30:37:14<200:32:56,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26931/203307 [30:37:18<200:32:54,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26931/203307 [30:37:18<200:32:54,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26932/203307 [30:37:23<200:32:52,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26932/203307 [30:37:23<200:32:52,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26933/203307 [30:37:27<200:32:46,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26933/203307 [30:37:27<200:32:46,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26934/203307 [30:37:30<200:32:39,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26934/203307 [30:37:30<200:32:39,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26935/203307 [30:37:35<200:32:37,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26935/203307 [30:37:35<200:32:37,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26936/203307 [30:37:38<200:32:30,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26936/203307 [30:37:38<200:32:31,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26937/203307 [30:37:42<200:32:24,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26937/203307 [30:37:42<200:32:24,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26938/203307 [30:37:47<200:32:22,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26938/203307 [30:37:47<200:32:22,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26939/203307 [30:37:51<200:32:19,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26939/203307 [30:37:51<200:32:19,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26940/203307 [30:37:54<200:32:12,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26940/203307 [30:37:54<200:32:12,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26941/203307 [30:37:59<200:32:10,  0.24it/s, v_num=t5e6, training/loss=0.0877]Epoch 0:  13%|█▎        | 26941/203307 [30:37:59<200:32:10,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26942/203307 [30:38:03<200:32:04,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26942/203307 [30:38:03<200:32:04,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26943/203307 [30:38:07<200:32:01,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26943/203307 [30:38:07<200:32:02,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26944/203307 [30:38:11<200:31:55,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26944/203307 [30:38:11<200:31:55,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26945/203307 [30:38:14<200:31:48,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26945/203307 [30:38:14<200:31:48,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26946/203307 [30:38:19<200:31:46,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26946/203307 [30:38:19<200:31:46,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26947/203307 [30:38:23<200:31:43,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26947/203307 [30:38:23<200:31:43,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26948/203307 [30:38:27<200:31:37,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26948/203307 [30:38:27<200:31:37,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26949/203307 [30:38:31<200:31:30,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26949/203307 [30:38:31<200:31:30,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26950/203307 [30:38:35<200:31:28,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26950/203307 [30:38:35<200:31:28,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26951/203307 [30:38:39<200:31:21,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26951/203307 [30:38:39<200:31:21,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26952/203307 [30:38:43<200:31:19,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26952/203307 [30:38:43<200:31:19,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26953/203307 [30:38:47<200:31:12,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26953/203307 [30:38:47<200:31:12,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26954/203307 [30:38:50<200:31:05,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26954/203307 [30:38:50<200:31:05,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26955/203307 [30:38:55<200:31:03,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26955/203307 [30:38:55<200:31:03,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26956/203307 [30:38:59<200:31:00,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26956/203307 [30:38:59<200:31:00,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26957/203307 [30:39:03<200:30:54,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26957/203307 [30:39:03<200:30:54,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26958/203307 [30:39:07<200:30:52,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26958/203307 [30:39:07<200:30:52,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26959/203307 [30:39:11<200:30:48,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26959/203307 [30:39:11<200:30:48,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26960/203307 [30:39:15<200:30:41,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26960/203307 [30:39:15<200:30:41,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26961/203307 [30:39:19<200:30:40,  0.24it/s, v_num=t5e6, training/loss=0.0905]Epoch 0:  13%|█▎        | 26961/203307 [30:39:19<200:30:40,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26962/203307 [30:39:23<200:30:34,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26962/203307 [30:39:23<200:30:34,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26963/203307 [30:39:27<200:30:27,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26963/203307 [30:39:27<200:30:27,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26964/203307 [30:39:31<200:30:25,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26964/203307 [30:39:31<200:30:25,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26965/203307 [30:39:35<200:30:19,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26965/203307 [30:39:35<200:30:19,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26966/203307 [30:39:39<200:30:12,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26966/203307 [30:39:39<200:30:12,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26967/203307 [30:39:43<200:30:10,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26967/203307 [30:39:43<200:30:10,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26968/203307 [30:39:47<200:30:06,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26968/203307 [30:39:47<200:30:06,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26969/203307 [30:39:52<200:30:04,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26969/203307 [30:39:52<200:30:04,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26970/203307 [30:39:55<200:29:57,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26970/203307 [30:39:55<200:29:57,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26971/203307 [30:39:59<200:29:50,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26971/203307 [30:39:59<200:29:50,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26972/203307 [30:40:03<200:29:48,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26972/203307 [30:40:03<200:29:48,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26973/203307 [30:40:08<200:29:45,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26973/203307 [30:40:08<200:29:45,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26974/203307 [30:40:11<200:29:38,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26974/203307 [30:40:11<200:29:38,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26975/203307 [30:40:15<200:29:31,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26975/203307 [30:40:15<200:29:31,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26976/203307 [30:40:20<200:29:30,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26976/203307 [30:40:20<200:29:30,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26977/203307 [30:40:24<200:29:27,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26977/203307 [30:40:24<200:29:27,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26978/203307 [30:40:28<200:29:25,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26978/203307 [30:40:28<200:29:25,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26979/203307 [30:40:32<200:29:19,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26979/203307 [30:40:32<200:29:19,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26980/203307 [30:40:36<200:29:13,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26980/203307 [30:40:36<200:29:13,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26981/203307 [30:40:40<200:29:11,  0.24it/s, v_num=t5e6, training/loss=0.0798]Epoch 0:  13%|█▎        | 26981/203307 [30:40:40<200:29:11,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26982/203307 [30:40:44<200:29:05,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26982/203307 [30:40:44<200:29:05,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26983/203307 [30:40:48<200:28:59,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26983/203307 [30:40:48<200:28:59,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26984/203307 [30:40:52<200:28:57,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26984/203307 [30:40:52<200:28:57,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26985/203307 [30:40:56<200:28:51,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26985/203307 [30:40:56<200:28:51,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26986/203307 [30:41:00<200:28:48,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26986/203307 [30:41:00<200:28:48,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26987/203307 [30:41:05<200:28:46,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26987/203307 [30:41:05<200:28:46,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26988/203307 [30:41:08<200:28:40,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26988/203307 [30:41:08<200:28:40,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26989/203307 [30:41:13<200:28:37,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26989/203307 [30:41:13<200:28:37,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26990/203307 [30:41:17<200:28:34,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26990/203307 [30:41:17<200:28:34,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26991/203307 [30:41:21<200:28:28,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26991/203307 [30:41:21<200:28:28,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26992/203307 [30:41:25<200:28:21,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26992/203307 [30:41:25<200:28:22,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26993/203307 [30:41:29<200:28:21,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26993/203307 [30:41:29<200:28:21,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26994/203307 [30:41:33<200:28:14,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26994/203307 [30:41:33<200:28:14,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26995/203307 [30:41:37<200:28:12,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26995/203307 [30:41:37<200:28:12,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26996/203307 [30:41:41<200:28:05,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26996/203307 [30:41:41<200:28:05,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26997/203307 [30:41:45<200:28:02,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26997/203307 [30:41:45<200:28:02,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26998/203307 [30:41:50<200:28:00,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26998/203307 [30:41:50<200:28:00,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26999/203307 [30:41:54<200:27:57,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 26999/203307 [30:41:54<200:27:57,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 27000/203307 [30:41:58<200:27:50,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 27000/203307 [30:41:58<200:27:50,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 27001/203307 [30:42:01<200:27:44,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  13%|█▎        | 27001/203307 [30:42:01<200:27:44,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27002/203307 [30:42:06<200:27:43,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27002/203307 [30:42:06<200:27:43,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27003/203307 [30:42:10<200:27:36,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27003/203307 [30:42:10<200:27:36,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27004/203307 [30:42:14<200:27:34,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27004/203307 [30:42:14<200:27:34,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27005/203307 [30:42:18<200:27:27,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27005/203307 [30:42:18<200:27:27,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27006/203307 [30:42:22<200:27:25,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27006/203307 [30:42:22<200:27:25,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27007/203307 [30:42:26<200:27:22,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27007/203307 [30:42:26<200:27:22,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27008/203307 [30:42:30<200:27:15,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27008/203307 [30:42:30<200:27:15,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27009/203307 [30:42:34<200:27:09,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27009/203307 [30:42:34<200:27:09,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27010/203307 [30:42:38<200:27:07,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27010/203307 [30:42:38<200:27:07,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27011/203307 [30:42:42<200:27:00,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27011/203307 [30:42:42<200:27:00,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27012/203307 [30:42:46<200:26:54,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27012/203307 [30:42:46<200:26:54,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27013/203307 [30:42:50<200:26:52,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27013/203307 [30:42:50<200:26:52,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27014/203307 [30:42:54<200:26:49,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27014/203307 [30:42:54<200:26:49,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27015/203307 [30:42:58<200:26:43,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27015/203307 [30:42:58<200:26:43,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27016/203307 [30:43:02<200:26:40,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27016/203307 [30:43:02<200:26:40,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27017/203307 [30:43:06<200:26:34,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27017/203307 [30:43:06<200:26:34,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27018/203307 [30:43:10<200:26:27,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27018/203307 [30:43:10<200:26:27,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27019/203307 [30:43:14<200:26:26,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27019/203307 [30:43:14<200:26:26,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27020/203307 [30:43:18<200:26:20,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27020/203307 [30:43:18<200:26:20,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27021/203307 [30:43:22<200:26:17,  0.24it/s, v_num=t5e6, training/loss=0.0791]Epoch 0:  13%|█▎        | 27021/203307 [30:43:22<200:26:17,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27022/203307 [30:43:27<200:26:14,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27022/203307 [30:43:27<200:26:15,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27023/203307 [30:43:30<200:26:08,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27023/203307 [30:43:30<200:26:08,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27024/203307 [30:43:35<200:26:05,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27024/203307 [30:43:35<200:26:05,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27025/203307 [30:43:39<200:26:03,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27025/203307 [30:43:39<200:26:03,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27026/203307 [30:43:43<200:25:55,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27026/203307 [30:43:43<200:25:55,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27027/203307 [30:43:46<200:25:48,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27027/203307 [30:43:46<200:25:48,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27028/203307 [30:43:51<200:25:46,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27028/203307 [30:43:51<200:25:46,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27029/203307 [30:43:54<200:25:40,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27029/203307 [30:43:54<200:25:40,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27030/203307 [30:43:59<200:25:37,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27030/203307 [30:43:59<200:25:37,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27031/203307 [30:44:03<200:25:34,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27031/203307 [30:44:03<200:25:34,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27032/203307 [30:44:07<200:25:27,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27032/203307 [30:44:07<200:25:27,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27033/203307 [30:44:11<200:25:24,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27033/203307 [30:44:11<200:25:24,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27034/203307 [30:44:15<200:25:17,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27034/203307 [30:44:15<200:25:17,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27035/203307 [30:44:18<200:25:10,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27035/203307 [30:44:18<200:25:10,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27036/203307 [30:44:23<200:25:09,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27036/203307 [30:44:23<200:25:09,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27037/203307 [30:44:27<200:25:03,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27037/203307 [30:44:27<200:25:03,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27038/203307 [30:44:30<200:24:57,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27038/203307 [30:44:30<200:24:57,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27039/203307 [30:44:35<200:24:56,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27039/203307 [30:44:35<200:24:56,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27040/203307 [30:44:39<200:24:52,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27040/203307 [30:44:39<200:24:52,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27041/203307 [30:44:43<200:24:47,  0.24it/s, v_num=t5e6, training/loss=0.0831]Epoch 0:  13%|█▎        | 27041/203307 [30:44:43<200:24:47,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27042/203307 [30:44:47<200:24:45,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27042/203307 [30:44:47<200:24:45,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27043/203307 [30:44:51<200:24:38,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27043/203307 [30:44:51<200:24:39,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27044/203307 [30:44:55<200:24:32,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27044/203307 [30:44:55<200:24:32,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27045/203307 [30:44:59<200:24:31,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27045/203307 [30:44:59<200:24:31,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27046/203307 [30:45:03<200:24:25,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27046/203307 [30:45:03<200:24:25,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27047/203307 [30:45:08<200:24:23,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27047/203307 [30:45:08<200:24:23,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27048/203307 [30:45:12<200:24:18,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27048/203307 [30:45:12<200:24:18,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27049/203307 [30:45:16<200:24:14,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27049/203307 [30:45:16<200:24:14,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27050/203307 [30:45:20<200:24:11,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27050/203307 [30:45:20<200:24:12,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27051/203307 [30:45:24<200:24:09,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27051/203307 [30:45:24<200:24:09,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27052/203307 [30:45:28<200:24:02,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27052/203307 [30:45:28<200:24:02,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27053/203307 [30:45:32<200:23:55,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27053/203307 [30:45:32<200:23:55,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27054/203307 [30:45:36<200:23:54,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27054/203307 [30:45:36<200:23:54,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27055/203307 [30:45:40<200:23:48,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27055/203307 [30:45:40<200:23:48,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27056/203307 [30:45:44<200:23:46,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27056/203307 [30:45:44<200:23:46,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27057/203307 [30:45:48<200:23:39,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27057/203307 [30:45:48<200:23:39,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27058/203307 [30:45:52<200:23:36,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27058/203307 [30:45:52<200:23:36,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27059/203307 [30:45:57<200:23:33,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27059/203307 [30:45:57<200:23:33,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27060/203307 [30:46:00<200:23:27,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27060/203307 [30:46:00<200:23:27,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27061/203307 [30:46:04<200:23:20,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  13%|█▎        | 27061/203307 [30:46:04<200:23:20,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27062/203307 [30:46:09<200:23:19,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27062/203307 [30:46:09<200:23:19,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27063/203307 [30:46:12<200:23:12,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27063/203307 [30:46:12<200:23:12,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27064/203307 [30:46:17<200:23:09,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27064/203307 [30:46:17<200:23:09,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27065/203307 [30:46:21<200:23:07,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27065/203307 [30:46:21<200:23:07,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27066/203307 [30:46:25<200:23:03,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27066/203307 [30:46:25<200:23:03,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27067/203307 [30:46:29<200:22:59,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27067/203307 [30:46:29<200:22:59,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27068/203307 [30:46:34<200:22:57,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27068/203307 [30:46:34<200:22:57,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27069/203307 [30:46:37<200:22:50,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27069/203307 [30:46:37<200:22:50,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27070/203307 [30:46:41<200:22:44,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27070/203307 [30:46:41<200:22:44,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27071/203307 [30:46:46<200:22:42,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27071/203307 [30:46:46<200:22:42,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27072/203307 [30:46:50<200:22:39,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27072/203307 [30:46:50<200:22:39,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27073/203307 [30:46:54<200:22:37,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27073/203307 [30:46:54<200:22:37,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27074/203307 [30:46:58<200:22:31,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27074/203307 [30:46:58<200:22:31,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27075/203307 [30:47:02<200:22:24,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27075/203307 [30:47:02<200:22:24,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27076/203307 [30:47:06<200:22:22,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27076/203307 [30:47:06<200:22:22,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27077/203307 [30:47:10<200:22:20,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27077/203307 [30:47:10<200:22:20,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27078/203307 [30:47:14<200:22:13,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27078/203307 [30:47:14<200:22:13,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27079/203307 [30:47:18<200:22:06,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27079/203307 [30:47:18<200:22:06,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27080/203307 [30:47:22<200:22:06,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27080/203307 [30:47:22<200:22:06,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27081/203307 [30:47:27<200:22:04,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  13%|█▎        | 27081/203307 [30:47:27<200:22:04,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27082/203307 [30:47:31<200:22:02,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27082/203307 [30:47:31<200:22:02,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27083/203307 [30:47:35<200:21:55,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27083/203307 [30:47:35<200:21:55,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27084/203307 [30:47:39<200:21:49,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27084/203307 [30:47:39<200:21:49,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27085/203307 [30:47:43<200:21:47,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27085/203307 [30:47:43<200:21:47,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27086/203307 [30:47:47<200:21:41,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27086/203307 [30:47:47<200:21:41,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27087/203307 [30:47:51<200:21:34,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27087/203307 [30:47:51<200:21:34,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27088/203307 [30:47:55<200:21:32,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27088/203307 [30:47:55<200:21:32,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27089/203307 [30:47:59<200:21:29,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27089/203307 [30:47:59<200:21:29,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27090/203307 [30:48:03<200:21:23,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27090/203307 [30:48:03<200:21:23,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27091/203307 [30:48:08<200:21:22,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27091/203307 [30:48:08<200:21:22,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27092/203307 [30:48:11<200:21:15,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27092/203307 [30:48:11<200:21:15,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27093/203307 [30:48:15<200:21:09,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27093/203307 [30:48:15<200:21:09,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27094/203307 [30:48:19<200:21:07,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27094/203307 [30:48:19<200:21:07,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27095/203307 [30:48:23<200:21:00,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27095/203307 [30:48:23<200:21:01,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27096/203307 [30:48:27<200:20:54,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27096/203307 [30:48:27<200:20:54,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27097/203307 [30:48:31<200:20:52,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27097/203307 [30:48:31<200:20:52,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27098/203307 [30:48:35<200:20:45,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27098/203307 [30:48:35<200:20:46,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27099/203307 [30:48:39<200:20:43,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27099/203307 [30:48:39<200:20:43,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27100/203307 [30:48:43<200:20:37,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27100/203307 [30:48:43<200:20:37,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27101/203307 [30:48:47<200:20:31,  0.24it/s, v_num=t5e6, training/loss=0.0789]Epoch 0:  13%|█▎        | 27101/203307 [30:48:47<200:20:31,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27102/203307 [30:48:51<200:20:29,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27102/203307 [30:48:51<200:20:29,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27103/203307 [30:48:56<200:20:26,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27103/203307 [30:48:56<200:20:26,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27104/203307 [30:48:59<200:20:20,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27104/203307 [30:48:59<200:20:20,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27105/203307 [30:49:03<200:20:14,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27105/203307 [30:49:03<200:20:14,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27106/203307 [30:49:08<200:20:12,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27106/203307 [30:49:08<200:20:13,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27107/203307 [30:49:12<200:20:06,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27107/203307 [30:49:12<200:20:06,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27108/203307 [30:49:16<200:20:04,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27108/203307 [30:49:16<200:20:04,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27109/203307 [30:49:20<200:19:58,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27109/203307 [30:49:20<200:19:58,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27110/203307 [30:49:24<200:19:52,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27110/203307 [30:49:24<200:19:52,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27111/203307 [30:49:28<200:19:50,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27111/203307 [30:49:28<200:19:50,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27112/203307 [30:49:32<200:19:48,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27112/203307 [30:49:32<200:19:48,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27113/203307 [30:49:36<200:19:41,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27113/203307 [30:49:36<200:19:41,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27114/203307 [30:49:41<200:19:40,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27114/203307 [30:49:41<200:19:40,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27115/203307 [30:49:44<200:19:33,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27115/203307 [30:49:44<200:19:33,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27116/203307 [30:49:48<200:19:27,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27116/203307 [30:49:48<200:19:27,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27117/203307 [30:49:53<200:19:25,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27117/203307 [30:49:53<200:19:26,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27118/203307 [30:49:56<200:19:19,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27118/203307 [30:49:56<200:19:19,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27119/203307 [30:50:00<200:19:12,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27119/203307 [30:50:00<200:19:12,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27120/203307 [30:50:04<200:19:11,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27120/203307 [30:50:04<200:19:11,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27121/203307 [30:50:09<200:19:08,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  13%|█▎        | 27121/203307 [30:50:09<200:19:08,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27122/203307 [30:50:13<200:19:05,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27122/203307 [30:50:13<200:19:05,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27123/203307 [30:50:17<200:19:04,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27123/203307 [30:50:18<200:19:04,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27124/203307 [30:50:21<200:18:57,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27124/203307 [30:50:21<200:18:57,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27125/203307 [30:50:26<200:18:55,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27125/203307 [30:50:26<200:18:55,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27126/203307 [30:50:29<200:18:49,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27126/203307 [30:50:29<200:18:49,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27127/203307 [30:50:33<200:18:42,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27127/203307 [30:50:33<200:18:42,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27128/203307 [30:50:37<200:18:40,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27128/203307 [30:50:37<200:18:40,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27129/203307 [30:50:42<200:18:37,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27129/203307 [30:50:42<200:18:37,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27130/203307 [30:50:46<200:18:34,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27130/203307 [30:50:46<200:18:34,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27131/203307 [30:50:50<200:18:32,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27131/203307 [30:50:50<200:18:32,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27132/203307 [30:50:55<200:18:30,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27132/203307 [30:50:55<200:18:30,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27133/203307 [30:50:59<200:18:24,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27133/203307 [30:50:59<200:18:24,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27134/203307 [30:51:03<200:18:21,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27134/203307 [30:51:03<200:18:21,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27135/203307 [30:51:07<200:18:15,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27135/203307 [30:51:07<200:18:15,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27136/203307 [30:51:10<200:18:08,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27136/203307 [30:51:10<200:18:08,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27137/203307 [30:51:15<200:18:06,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27137/203307 [30:51:15<200:18:06,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27138/203307 [30:51:18<200:17:59,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27138/203307 [30:51:18<200:17:59,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27139/203307 [30:51:23<200:17:57,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27139/203307 [30:51:23<200:17:57,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27140/203307 [30:51:27<200:17:55,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27140/203307 [30:51:27<200:17:55,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27141/203307 [30:51:31<200:17:49,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  13%|█▎        | 27141/203307 [30:51:31<200:17:49,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27142/203307 [30:51:35<200:17:43,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27142/203307 [30:51:35<200:17:43,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27143/203307 [30:51:39<200:17:41,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27143/203307 [30:51:39<200:17:41,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27144/203307 [30:51:43<200:17:35,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27144/203307 [30:51:43<200:17:35,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27145/203307 [30:51:47<200:17:28,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27145/203307 [30:51:47<200:17:28,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27146/203307 [30:51:51<200:17:26,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27146/203307 [30:51:51<200:17:26,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27147/203307 [30:51:55<200:17:23,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27147/203307 [30:51:55<200:17:23,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27148/203307 [30:52:00<200:17:20,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27148/203307 [30:52:00<200:17:20,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27149/203307 [30:52:04<200:17:18,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27149/203307 [30:52:04<200:17:18,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27150/203307 [30:52:08<200:17:12,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27150/203307 [30:52:08<200:17:12,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27151/203307 [30:52:12<200:17:10,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27151/203307 [30:52:12<200:17:10,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27152/203307 [30:52:16<200:17:04,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27152/203307 [30:52:16<200:17:04,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27153/203307 [30:52:20<200:16:57,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27153/203307 [30:52:20<200:16:57,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27154/203307 [30:52:24<200:16:55,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27154/203307 [30:52:24<200:16:55,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27155/203307 [30:52:28<200:16:52,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27155/203307 [30:52:28<200:16:52,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27156/203307 [30:52:33<200:16:49,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27156/203307 [30:52:33<200:16:49,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27157/203307 [30:52:37<200:16:46,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27157/203307 [30:52:37<200:16:46,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27158/203307 [30:52:41<200:16:43,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27158/203307 [30:52:41<200:16:44,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27159/203307 [30:52:45<200:16:37,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27159/203307 [30:52:45<200:16:37,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27160/203307 [30:52:49<200:16:34,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27160/203307 [30:52:49<200:16:34,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27161/203307 [30:52:53<200:16:27,  0.24it/s, v_num=t5e6, training/loss=0.0855]Epoch 0:  13%|█▎        | 27161/203307 [30:52:53<200:16:27,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27162/203307 [30:52:57<200:16:20,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27162/203307 [30:52:57<200:16:20,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27163/203307 [30:53:01<200:16:18,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27163/203307 [30:53:01<200:16:18,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27164/203307 [30:53:05<200:16:15,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27164/203307 [30:53:05<200:16:15,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27165/203307 [30:53:09<200:16:09,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27165/203307 [30:53:09<200:16:09,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27166/203307 [30:53:13<200:16:06,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27166/203307 [30:53:13<200:16:07,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27167/203307 [30:53:17<200:16:01,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27167/203307 [30:53:17<200:16:01,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27168/203307 [30:53:21<200:15:54,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27168/203307 [30:53:21<200:15:54,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27169/203307 [30:53:25<200:15:53,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27169/203307 [30:53:25<200:15:53,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27170/203307 [30:53:29<200:15:46,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27170/203307 [30:53:29<200:15:46,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27171/203307 [30:53:33<200:15:40,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27171/203307 [30:53:33<200:15:40,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27172/203307 [30:53:37<200:15:38,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27172/203307 [30:53:37<200:15:38,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27173/203307 [30:53:41<200:15:31,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27173/203307 [30:53:41<200:15:32,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27174/203307 [30:53:45<200:15:25,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27174/203307 [30:53:45<200:15:25,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27175/203307 [30:53:49<200:15:23,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27175/203307 [30:53:49<200:15:23,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27176/203307 [30:53:53<200:15:17,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27176/203307 [30:53:53<200:15:17,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27177/203307 [30:53:57<200:15:15,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27177/203307 [30:53:57<200:15:15,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27178/203307 [30:54:01<200:15:08,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27178/203307 [30:54:01<200:15:08,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27179/203307 [30:54:05<200:15:02,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27179/203307 [30:54:05<200:15:02,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27180/203307 [30:54:09<200:15:00,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27180/203307 [30:54:09<200:15:00,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27181/203307 [30:54:14<200:14:57,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  13%|█▎        | 27181/203307 [30:54:14<200:14:57,  0.24it/s, v_num=t5e6, training/loss=0.079] Epoch 0:  13%|█▎        | 27182/203307 [30:54:17<200:14:50,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27182/203307 [30:54:17<200:14:51,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27183/203307 [30:54:21<200:14:44,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27183/203307 [30:54:21<200:14:44,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27184/203307 [30:54:25<200:14:42,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27184/203307 [30:54:25<200:14:42,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27185/203307 [30:54:29<200:14:35,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27185/203307 [30:54:29<200:14:35,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27186/203307 [30:54:33<200:14:33,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27186/203307 [30:54:33<200:14:33,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27187/203307 [30:54:37<200:14:26,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27187/203307 [30:54:37<200:14:26,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27188/203307 [30:54:41<200:14:19,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27188/203307 [30:54:41<200:14:19,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27189/203307 [30:54:45<200:14:16,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27189/203307 [30:54:45<200:14:16,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27190/203307 [30:54:49<200:14:10,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27190/203307 [30:54:49<200:14:10,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27191/203307 [30:54:52<200:14:03,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27191/203307 [30:54:52<200:14:03,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27192/203307 [30:54:57<200:14:01,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27192/203307 [30:54:57<200:14:01,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27193/203307 [30:55:01<200:13:58,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27193/203307 [30:55:01<200:13:58,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27194/203307 [30:55:05<200:13:51,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27194/203307 [30:55:05<200:13:51,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27195/203307 [30:55:09<200:13:48,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27195/203307 [30:55:09<200:13:48,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27196/203307 [30:55:13<200:13:41,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27196/203307 [30:55:13<200:13:42,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27197/203307 [30:55:17<200:13:38,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27197/203307 [30:55:17<200:13:38,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27198/203307 [30:55:21<200:13:35,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27198/203307 [30:55:21<200:13:35,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27199/203307 [30:55:25<200:13:28,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27199/203307 [30:55:25<200:13:28,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27200/203307 [30:55:28<200:13:22,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27200/203307 [30:55:29<200:13:22,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27201/203307 [30:55:33<200:13:20,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  13%|█▎        | 27201/203307 [30:55:33<200:13:20,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27202/203307 [30:55:37<200:13:16,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27202/203307 [30:55:37<200:13:16,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27203/203307 [30:55:41<200:13:14,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27203/203307 [30:55:41<200:13:14,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27204/203307 [30:55:45<200:13:07,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27204/203307 [30:55:45<200:13:07,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27205/203307 [30:55:49<200:13:00,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27205/203307 [30:55:49<200:13:00,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27206/203307 [30:55:53<200:12:57,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27206/203307 [30:55:53<200:12:57,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27207/203307 [30:55:57<200:12:54,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27207/203307 [30:55:57<200:12:55,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27208/203307 [30:56:01<200:12:48,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27208/203307 [30:56:01<200:12:48,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27209/203307 [30:56:05<200:12:41,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27209/203307 [30:56:05<200:12:41,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27210/203307 [30:56:09<200:12:39,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27210/203307 [30:56:09<200:12:39,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27211/203307 [30:56:13<200:12:36,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27211/203307 [30:56:13<200:12:36,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27212/203307 [30:56:18<200:12:34,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27212/203307 [30:56:18<200:12:34,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27213/203307 [30:56:22<200:12:28,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27213/203307 [30:56:22<200:12:28,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27214/203307 [30:56:26<200:12:24,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27214/203307 [30:56:26<200:12:24,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27215/203307 [30:56:30<200:12:22,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27215/203307 [30:56:30<200:12:22,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27216/203307 [30:56:34<200:12:15,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27216/203307 [30:56:34<200:12:15,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27217/203307 [30:56:38<200:12:08,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27217/203307 [30:56:38<200:12:08,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27218/203307 [30:56:42<200:12:06,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27218/203307 [30:56:42<200:12:06,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27219/203307 [30:56:46<200:12:00,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27219/203307 [30:56:46<200:12:00,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27220/203307 [30:56:50<200:11:56,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27220/203307 [30:56:50<200:11:56,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27221/203307 [30:56:54<200:11:54,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  13%|█▎        | 27221/203307 [30:56:54<200:11:54,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27222/203307 [30:56:58<200:11:50,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27222/203307 [30:56:58<200:11:50,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27223/203307 [30:57:02<200:11:43,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27223/203307 [30:57:02<200:11:43,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27224/203307 [30:57:06<200:11:40,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27224/203307 [30:57:06<200:11:40,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27225/203307 [30:57:10<200:11:33,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27225/203307 [30:57:10<200:11:33,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27226/203307 [30:57:14<200:11:26,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27226/203307 [30:57:14<200:11:27,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27227/203307 [30:57:18<200:11:24,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27227/203307 [30:57:18<200:11:25,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27228/203307 [30:57:22<200:11:18,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27228/203307 [30:57:22<200:11:18,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27229/203307 [30:57:26<200:11:16,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27229/203307 [30:57:26<200:11:16,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27230/203307 [30:57:30<200:11:09,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27230/203307 [30:57:30<200:11:09,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27231/203307 [30:57:34<200:11:06,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27231/203307 [30:57:34<200:11:06,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27232/203307 [30:57:38<200:11:04,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27232/203307 [30:57:38<200:11:04,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27233/203307 [30:57:43<200:11:01,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27233/203307 [30:57:43<200:11:01,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27234/203307 [30:57:46<200:10:54,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27234/203307 [30:57:46<200:10:54,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27235/203307 [30:57:50<200:10:48,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27235/203307 [30:57:50<200:10:48,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27236/203307 [30:57:55<200:10:46,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27236/203307 [30:57:55<200:10:46,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27237/203307 [30:57:58<200:10:40,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27237/203307 [30:57:58<200:10:40,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27238/203307 [30:58:03<200:10:38,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27238/203307 [30:58:03<200:10:38,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27239/203307 [30:58:07<200:10:34,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27239/203307 [30:58:07<200:10:34,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27240/203307 [30:58:11<200:10:28,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27240/203307 [30:58:11<200:10:28,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27241/203307 [30:58:15<200:10:26,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  13%|█▎        | 27241/203307 [30:58:15<200:10:26,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27242/203307 [30:58:19<200:10:20,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27242/203307 [30:58:19<200:10:20,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27243/203307 [30:58:23<200:10:13,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27243/203307 [30:58:23<200:10:13,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27244/203307 [30:58:27<200:10:12,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27244/203307 [30:58:27<200:10:12,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27245/203307 [30:58:31<200:10:05,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27245/203307 [30:58:31<200:10:05,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27246/203307 [30:58:34<200:09:58,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27246/203307 [30:58:34<200:09:58,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27247/203307 [30:58:39<200:09:57,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27247/203307 [30:58:39<200:09:57,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27248/203307 [30:58:43<200:09:51,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27248/203307 [30:58:43<200:09:51,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27249/203307 [30:58:47<200:09:45,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27249/203307 [30:58:47<200:09:45,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27250/203307 [30:58:51<200:09:43,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27250/203307 [30:58:51<200:09:43,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27251/203307 [30:58:55<200:09:36,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27251/203307 [30:58:55<200:09:36,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27252/203307 [30:58:58<200:09:30,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27252/203307 [30:58:58<200:09:30,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27253/203307 [30:59:03<200:09:29,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27253/203307 [30:59:03<200:09:29,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27254/203307 [30:59:07<200:09:23,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27254/203307 [30:59:07<200:09:23,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27255/203307 [30:59:11<200:09:21,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27255/203307 [30:59:11<200:09:21,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27256/203307 [30:59:16<200:09:18,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27256/203307 [30:59:16<200:09:19,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27257/203307 [30:59:19<200:09:12,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27257/203307 [30:59:19<200:09:12,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27258/203307 [30:59:24<200:09:10,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27258/203307 [30:59:24<200:09:10,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27259/203307 [30:59:28<200:09:08,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27259/203307 [30:59:28<200:09:08,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27260/203307 [30:59:32<200:09:01,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27260/203307 [30:59:32<200:09:01,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27261/203307 [30:59:36<200:08:56,  0.24it/s, v_num=t5e6, training/loss=0.0858]Epoch 0:  13%|█▎        | 27261/203307 [30:59:36<200:08:56,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27262/203307 [30:59:40<200:08:55,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27262/203307 [30:59:40<200:08:55,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27263/203307 [30:59:44<200:08:49,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27263/203307 [30:59:44<200:08:49,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27264/203307 [30:59:49<200:08:47,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27264/203307 [30:59:49<200:08:47,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27265/203307 [30:59:53<200:08:44,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27265/203307 [30:59:53<200:08:44,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27266/203307 [30:59:57<200:08:38,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27266/203307 [30:59:57<200:08:38,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27267/203307 [31:00:01<200:08:36,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27267/203307 [31:00:01<200:08:36,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27268/203307 [31:00:05<200:08:30,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27268/203307 [31:00:05<200:08:30,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27269/203307 [31:00:09<200:08:24,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27269/203307 [31:00:09<200:08:24,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27270/203307 [31:00:13<200:08:22,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27270/203307 [31:00:13<200:08:22,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27271/203307 [31:00:17<200:08:17,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27271/203307 [31:00:17<200:08:17,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27272/203307 [31:00:21<200:08:14,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27272/203307 [31:00:21<200:08:14,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27273/203307 [31:00:26<200:08:12,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27273/203307 [31:00:26<200:08:12,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27274/203307 [31:00:30<200:08:08,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27274/203307 [31:00:30<200:08:08,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27275/203307 [31:00:34<200:08:02,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27275/203307 [31:00:34<200:08:02,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27276/203307 [31:00:38<200:07:59,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27276/203307 [31:00:38<200:07:59,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27277/203307 [31:00:42<200:07:53,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27277/203307 [31:00:42<200:07:53,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27278/203307 [31:00:45<200:07:46,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27278/203307 [31:00:45<200:07:46,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27279/203307 [31:00:50<200:07:45,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27279/203307 [31:00:50<200:07:45,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27280/203307 [31:00:53<200:07:38,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27280/203307 [31:00:53<200:07:38,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27281/203307 [31:00:58<200:07:36,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  13%|█▎        | 27281/203307 [31:00:58<200:07:36,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27282/203307 [31:01:02<200:07:30,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27282/203307 [31:01:02<200:07:30,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27283/203307 [31:01:06<200:07:27,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27283/203307 [31:01:06<200:07:27,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27284/203307 [31:01:10<200:07:24,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27284/203307 [31:01:10<200:07:24,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27285/203307 [31:01:14<200:07:21,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27285/203307 [31:01:14<200:07:21,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27286/203307 [31:01:18<200:07:15,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27286/203307 [31:01:18<200:07:15,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27287/203307 [31:01:22<200:07:09,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27287/203307 [31:01:22<200:07:09,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27288/203307 [31:01:26<200:07:07,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27288/203307 [31:01:26<200:07:07,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27289/203307 [31:01:31<200:07:04,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27289/203307 [31:01:31<200:07:04,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27290/203307 [31:01:35<200:07:02,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27290/203307 [31:01:35<200:07:02,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27291/203307 [31:01:39<200:06:55,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27291/203307 [31:01:39<200:06:55,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27292/203307 [31:01:43<200:06:52,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27292/203307 [31:01:43<200:06:52,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27293/203307 [31:01:47<200:06:49,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27293/203307 [31:01:47<200:06:49,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27294/203307 [31:01:51<200:06:43,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27294/203307 [31:01:51<200:06:43,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27295/203307 [31:01:55<200:06:36,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27295/203307 [31:01:55<200:06:36,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27296/203307 [31:01:59<200:06:34,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27296/203307 [31:01:59<200:06:34,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27297/203307 [31:02:03<200:06:31,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27297/203307 [31:02:03<200:06:31,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27298/203307 [31:02:07<200:06:24,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27298/203307 [31:02:07<200:06:24,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27299/203307 [31:02:11<200:06:22,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27299/203307 [31:02:12<200:06:22,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27300/203307 [31:02:15<200:06:15,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27300/203307 [31:02:15<200:06:15,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27301/203307 [31:02:19<200:06:12,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  13%|█▎        | 27301/203307 [31:02:19<200:06:12,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27302/203307 [31:02:24<200:06:09,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27302/203307 [31:02:24<200:06:09,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27303/203307 [31:02:27<200:06:03,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27303/203307 [31:02:27<200:06:03,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27304/203307 [31:02:31<200:05:56,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27304/203307 [31:02:31<200:05:56,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27305/203307 [31:02:36<200:05:54,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27305/203307 [31:02:36<200:05:54,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27306/203307 [31:02:40<200:05:50,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27306/203307 [31:02:40<200:05:50,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27307/203307 [31:02:44<200:05:48,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27307/203307 [31:02:44<200:05:48,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27308/203307 [31:02:48<200:05:41,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27308/203307 [31:02:48<200:05:41,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27309/203307 [31:02:51<200:05:34,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27309/203307 [31:02:51<200:05:34,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27310/203307 [31:02:56<200:05:32,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27310/203307 [31:02:56<200:05:32,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27311/203307 [31:03:00<200:05:28,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27311/203307 [31:03:00<200:05:28,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27312/203307 [31:03:04<200:05:21,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27312/203307 [31:03:04<200:05:21,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27313/203307 [31:03:07<200:05:14,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27313/203307 [31:03:07<200:05:15,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27314/203307 [31:03:12<200:05:13,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27314/203307 [31:03:12<200:05:13,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27315/203307 [31:03:15<200:05:06,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27315/203307 [31:03:15<200:05:06,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27316/203307 [31:03:20<200:05:04,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27316/203307 [31:03:20<200:05:04,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27317/203307 [31:03:24<200:04:58,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27317/203307 [31:03:24<200:04:58,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27318/203307 [31:03:27<200:04:51,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27318/203307 [31:03:27<200:04:51,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27319/203307 [31:03:32<200:04:49,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27319/203307 [31:03:32<200:04:49,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27320/203307 [31:03:35<200:04:43,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27320/203307 [31:03:35<200:04:43,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27321/203307 [31:03:39<200:04:36,  0.24it/s, v_num=t5e6, training/loss=0.0759]Epoch 0:  13%|█▎        | 27321/203307 [31:03:39<200:04:36,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27322/203307 [31:03:43<200:04:34,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27322/203307 [31:03:43<200:04:34,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27323/203307 [31:03:47<200:04:27,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27323/203307 [31:03:47<200:04:27,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27324/203307 [31:03:51<200:04:21,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27324/203307 [31:03:51<200:04:21,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27325/203307 [31:03:55<200:04:19,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27325/203307 [31:03:55<200:04:19,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27326/203307 [31:03:59<200:04:12,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27326/203307 [31:03:59<200:04:12,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27327/203307 [31:04:03<200:04:05,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27327/203307 [31:04:03<200:04:05,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27328/203307 [31:04:07<200:04:03,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27328/203307 [31:04:07<200:04:03,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27329/203307 [31:04:11<200:03:56,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27329/203307 [31:04:11<200:03:56,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27330/203307 [31:04:14<200:03:49,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27330/203307 [31:04:14<200:03:49,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27331/203307 [31:04:19<200:03:48,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27331/203307 [31:04:19<200:03:48,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27332/203307 [31:04:22<200:03:41,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27332/203307 [31:04:22<200:03:41,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27333/203307 [31:04:27<200:03:38,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27333/203307 [31:04:27<200:03:38,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27334/203307 [31:04:31<200:03:32,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27334/203307 [31:04:31<200:03:32,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27335/203307 [31:04:34<200:03:25,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27335/203307 [31:04:34<200:03:25,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27336/203307 [31:04:39<200:03:22,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27336/203307 [31:04:39<200:03:22,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27337/203307 [31:04:43<200:03:20,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27337/203307 [31:04:43<200:03:20,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27338/203307 [31:04:47<200:03:13,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27338/203307 [31:04:47<200:03:13,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27339/203307 [31:04:51<200:03:09,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27339/203307 [31:04:51<200:03:10,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27340/203307 [31:04:55<200:03:07,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27340/203307 [31:04:55<200:03:07,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27341/203307 [31:04:59<200:03:01,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  13%|█▎        | 27341/203307 [31:04:59<200:03:01,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27342/203307 [31:05:03<200:02:58,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27342/203307 [31:05:03<200:02:58,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27343/203307 [31:05:07<200:02:51,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27343/203307 [31:05:07<200:02:51,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27344/203307 [31:05:10<200:02:44,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27344/203307 [31:05:10<200:02:44,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27345/203307 [31:05:15<200:02:42,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27345/203307 [31:05:15<200:02:42,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27346/203307 [31:05:19<200:02:38,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27346/203307 [31:05:19<200:02:38,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27347/203307 [31:05:23<200:02:35,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27347/203307 [31:05:23<200:02:35,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27348/203307 [31:05:28<200:02:32,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27348/203307 [31:05:28<200:02:32,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27349/203307 [31:05:31<200:02:26,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27349/203307 [31:05:31<200:02:26,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27350/203307 [31:05:35<200:02:19,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27350/203307 [31:05:35<200:02:19,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27351/203307 [31:05:39<200:02:17,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27351/203307 [31:05:39<200:02:17,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27352/203307 [31:05:43<200:02:10,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27352/203307 [31:05:43<200:02:10,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27353/203307 [31:05:47<200:02:04,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27353/203307 [31:05:47<200:02:04,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27354/203307 [31:05:51<200:02:02,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27354/203307 [31:05:51<200:02:02,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27355/203307 [31:05:55<200:01:58,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27355/203307 [31:05:55<200:01:58,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27356/203307 [31:06:00<200:01:55,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27356/203307 [31:06:00<200:01:55,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27357/203307 [31:06:04<200:01:53,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27357/203307 [31:06:04<200:01:53,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27358/203307 [31:06:08<200:01:47,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27358/203307 [31:06:08<200:01:47,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27359/203307 [31:06:12<200:01:44,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27359/203307 [31:06:12<200:01:44,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27360/203307 [31:06:16<200:01:38,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27360/203307 [31:06:16<200:01:38,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27361/203307 [31:06:20<200:01:32,  0.24it/s, v_num=t5e6, training/loss=0.0859]Epoch 0:  13%|█▎        | 27361/203307 [31:06:20<200:01:32,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27362/203307 [31:06:24<200:01:29,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27362/203307 [31:06:24<200:01:30,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27363/203307 [31:06:28<200:01:27,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27363/203307 [31:06:28<200:01:27,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27364/203307 [31:06:32<200:01:23,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27364/203307 [31:06:32<200:01:23,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27365/203307 [31:06:36<200:01:17,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27365/203307 [31:06:36<200:01:17,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27366/203307 [31:06:41<200:01:15,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27366/203307 [31:06:41<200:01:15,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27367/203307 [31:06:44<200:01:08,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27367/203307 [31:06:44<200:01:08,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27368/203307 [31:06:49<200:01:06,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27368/203307 [31:06:49<200:01:06,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27369/203307 [31:06:52<200:00:59,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27369/203307 [31:06:52<200:00:59,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27370/203307 [31:06:56<200:00:52,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27370/203307 [31:06:56<200:00:52,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27371/203307 [31:07:00<200:00:50,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27371/203307 [31:07:00<200:00:50,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27372/203307 [31:07:05<200:00:47,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27372/203307 [31:07:05<200:00:47,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27373/203307 [31:07:09<200:00:43,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27373/203307 [31:07:09<200:00:44,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27374/203307 [31:07:13<200:00:41,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27374/203307 [31:07:13<200:00:41,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27375/203307 [31:07:17<200:00:34,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27375/203307 [31:07:17<200:00:34,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27376/203307 [31:07:21<200:00:28,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27376/203307 [31:07:21<200:00:28,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27377/203307 [31:07:25<200:00:27,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27377/203307 [31:07:25<200:00:27,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27378/203307 [31:07:29<200:00:20,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27378/203307 [31:07:29<200:00:20,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27379/203307 [31:07:33<200:00:14,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27379/203307 [31:07:33<200:00:14,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27380/203307 [31:07:37<200:00:11,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27380/203307 [31:07:37<200:00:11,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27381/203307 [31:07:41<200:00:09,  0.24it/s, v_num=t5e6, training/loss=0.0863]Epoch 0:  13%|█▎        | 27381/203307 [31:07:41<200:00:09,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27382/203307 [31:07:45<200:00:05,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27382/203307 [31:07:45<200:00:05,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27383/203307 [31:07:50<200:00:03,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27383/203307 [31:07:50<200:00:03,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27384/203307 [31:07:54<199:59:57,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27384/203307 [31:07:54<199:59:57,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27385/203307 [31:07:58<199:59:55,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27385/203307 [31:07:58<199:59:55,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27386/203307 [31:08:02<199:59:49,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27386/203307 [31:08:02<199:59:49,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27387/203307 [31:08:05<199:59:42,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27387/203307 [31:08:05<199:59:42,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27388/203307 [31:08:10<199:59:40,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27388/203307 [31:08:10<199:59:40,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27389/203307 [31:08:14<199:59:38,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27389/203307 [31:08:14<199:59:38,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27390/203307 [31:08:18<199:59:32,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27390/203307 [31:08:18<199:59:32,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27391/203307 [31:08:22<199:59:28,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27391/203307 [31:08:22<199:59:28,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27392/203307 [31:08:27<199:59:26,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27392/203307 [31:08:27<199:59:26,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27393/203307 [31:08:30<199:59:20,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27393/203307 [31:08:30<199:59:20,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27394/203307 [31:08:35<199:59:18,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27394/203307 [31:08:35<199:59:18,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27395/203307 [31:08:39<199:59:11,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27395/203307 [31:08:39<199:59:11,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27396/203307 [31:08:42<199:59:05,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27396/203307 [31:08:42<199:59:05,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27397/203307 [31:08:47<199:59:03,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27397/203307 [31:08:47<199:59:03,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27398/203307 [31:08:50<199:58:57,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27398/203307 [31:08:50<199:58:57,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27399/203307 [31:08:54<199:58:50,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27399/203307 [31:08:54<199:58:50,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27400/203307 [31:08:59<199:58:49,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27400/203307 [31:08:59<199:58:49,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27401/203307 [31:09:02<199:58:42,  0.24it/s, v_num=t5e6, training/loss=0.0767]Epoch 0:  13%|█▎        | 27401/203307 [31:09:02<199:58:42,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27402/203307 [31:09:06<199:58:36,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27402/203307 [31:09:06<199:58:36,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27403/203307 [31:09:11<199:58:34,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27403/203307 [31:09:11<199:58:34,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27404/203307 [31:09:14<199:58:28,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27404/203307 [31:09:14<199:58:28,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27405/203307 [31:09:18<199:58:22,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27405/203307 [31:09:18<199:58:22,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27406/203307 [31:09:23<199:58:20,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27406/203307 [31:09:23<199:58:20,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27407/203307 [31:09:26<199:58:13,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27407/203307 [31:09:26<199:58:13,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27408/203307 [31:09:30<199:58:07,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27408/203307 [31:09:30<199:58:07,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27409/203307 [31:09:34<199:58:05,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27409/203307 [31:09:34<199:58:05,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27410/203307 [31:09:38<199:57:59,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27410/203307 [31:09:38<199:57:59,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27411/203307 [31:09:43<199:57:56,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27411/203307 [31:09:43<199:57:56,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27412/203307 [31:09:46<199:57:50,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27412/203307 [31:09:46<199:57:50,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27413/203307 [31:09:50<199:57:43,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27413/203307 [31:09:50<199:57:43,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27414/203307 [31:09:54<199:57:41,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27414/203307 [31:09:54<199:57:41,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27415/203307 [31:09:59<199:57:38,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27415/203307 [31:09:59<199:57:38,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27416/203307 [31:10:02<199:57:32,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27416/203307 [31:10:02<199:57:32,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27417/203307 [31:10:06<199:57:25,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27417/203307 [31:10:06<199:57:25,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27418/203307 [31:10:11<199:57:24,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27418/203307 [31:10:11<199:57:24,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27419/203307 [31:10:14<199:57:17,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27419/203307 [31:10:14<199:57:17,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27420/203307 [31:10:19<199:57:16,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27420/203307 [31:10:19<199:57:16,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27421/203307 [31:10:23<199:57:11,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  13%|█▎        | 27421/203307 [31:10:23<199:57:11,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27422/203307 [31:10:27<199:57:08,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27422/203307 [31:10:27<199:57:08,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27423/203307 [31:10:31<199:57:05,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27423/203307 [31:10:31<199:57:05,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27424/203307 [31:10:35<199:56:59,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27424/203307 [31:10:35<199:56:59,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27425/203307 [31:10:39<199:56:53,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27425/203307 [31:10:39<199:56:53,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27426/203307 [31:10:43<199:56:52,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27426/203307 [31:10:43<199:56:52,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27427/203307 [31:10:48<199:56:48,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27427/203307 [31:10:48<199:56:48,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27428/203307 [31:10:51<199:56:42,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27428/203307 [31:10:51<199:56:42,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27429/203307 [31:10:56<199:56:40,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27429/203307 [31:10:56<199:56:40,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27430/203307 [31:11:00<199:56:34,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27430/203307 [31:11:00<199:56:34,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27431/203307 [31:11:04<199:56:31,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27431/203307 [31:11:04<199:56:31,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27432/203307 [31:11:08<199:56:29,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27432/203307 [31:11:08<199:56:29,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27433/203307 [31:11:12<199:56:22,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27433/203307 [31:11:12<199:56:22,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27434/203307 [31:11:16<199:56:16,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27434/203307 [31:11:16<199:56:16,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27435/203307 [31:11:20<199:56:14,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27435/203307 [31:11:20<199:56:14,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27436/203307 [31:11:24<199:56:10,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27436/203307 [31:11:24<199:56:10,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27437/203307 [31:11:28<199:56:07,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27437/203307 [31:11:28<199:56:07,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27438/203307 [31:11:32<199:56:01,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27438/203307 [31:11:32<199:56:01,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27439/203307 [31:11:36<199:55:57,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27439/203307 [31:11:36<199:55:57,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27440/203307 [31:11:41<199:55:54,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27440/203307 [31:11:41<199:55:54,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27441/203307 [31:11:45<199:55:51,  0.24it/s, v_num=t5e6, training/loss=0.0866]Epoch 0:  13%|█▎        | 27441/203307 [31:11:45<199:55:51,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 27442/203307 [31:11:49<199:55:44,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 27442/203307 [31:11:49<199:55:44,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 27443/203307 [31:11:52<199:55:37,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 27443/203307 [31:11:52<199:55:37,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 27444/203307 [31:11:57<199:55:36,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 27444/203307 [31:11:57<199:55:36,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 27445/203307 [31:12:01<199:55:32,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 27445/203307 [31:12:01<199:55:32,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 27446/203307 [31:12:05<199:55:29,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  13%|█▎        | 27446/203307 [31:12:05<199:55:29,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  14%|█▎        | 27447/203307 [31:12:09<199:55:25,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  14%|█▎        | 27447/203307 [31:12:09<199:55:25,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  14%|█▎        | 27448/203307 [31:12:13<199:55:19,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  14%|█▎        | 27448/203307 [31:12:13<199:55:19,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  14%|█▎        | 27449/203307 [31:12:17<199:55:16,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  14%|█▎        | 27449/203307 [31:12:17<199:55:16,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  14%|█▎        | 27450/203307 [31:12:21<199:55:10,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  14%|█▎        | 27450/203307 [31:12:21<199:55:10,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  14%|█▎        | 27451/203307 [31:12:25<199:55:03,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  14%|█▎        | 27451/203307 [31:12:25<199:55:03,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  14%|█▎        | 27452/203307 [31:12:29<199:55:02,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  14%|█▎        | 27452/203307 [31:12:29<199:55:02,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  14%|█▎        | 27453/203307 [31:12:33<199:54:55,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  14%|█▎        | 27453/203307 [31:12:33<199:54:55,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  14%|█▎        | 27454/203307 [31:12:37<199:54:52,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  14%|█▎        | 27454/203307 [31:12:37<199:54:52,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  14%|█▎        | 27455/203307 [31:12:42<199:54:50,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  14%|█▎        | 27455/203307 [31:12:42<199:54:50,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  14%|█▎        | 27456/203307 [31:12:46<199:54:47,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  14%|█▎        | 27456/203307 [31:12:46<199:54:47,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  14%|█▎        | 27457/203307 [31:12:50<199:54:40,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  14%|█▎        | 27457/203307 [31:12:50<199:54:40,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  14%|█▎        | 27458/203307 [31:12:54<199:54:38,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  14%|█▎        | 27458/203307 [31:12:54<199:54:38,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  14%|█▎        | 27459/203307 [31:12:58<199:54:31,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  14%|█▎        | 27459/203307 [31:12:58<199:54:31,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  14%|█▎        | 27460/203307 [31:13:01<199:54:25,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  14%|█▎        | 27460/203307 [31:13:01<199:54:25,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  14%|█▎        | 27461/203307 [31:13:06<199:54:23,  0.24it/s, v_num=t5e6, training/loss=0.0784]Epoch 0:  14%|█▎        | 27461/203307 [31:13:06<199:54:23,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27462/203307 [31:13:10<199:54:17,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27462/203307 [31:13:10<199:54:17,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27463/203307 [31:13:14<199:54:15,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27463/203307 [31:13:14<199:54:15,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27464/203307 [31:13:18<199:54:12,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27464/203307 [31:13:18<199:54:12,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27465/203307 [31:13:22<199:54:06,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27465/203307 [31:13:22<199:54:06,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27466/203307 [31:13:26<199:54:03,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27466/203307 [31:13:26<199:54:03,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27467/203307 [31:13:31<199:54:01,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27467/203307 [31:13:31<199:54:01,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27468/203307 [31:13:34<199:53:54,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27468/203307 [31:13:34<199:53:54,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27469/203307 [31:13:38<199:53:48,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27469/203307 [31:13:38<199:53:48,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27470/203307 [31:13:43<199:53:47,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27470/203307 [31:13:43<199:53:48,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27471/203307 [31:13:47<199:53:41,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27471/203307 [31:13:47<199:53:41,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27472/203307 [31:13:51<199:53:40,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27472/203307 [31:13:51<199:53:40,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27473/203307 [31:13:55<199:53:34,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27473/203307 [31:13:55<199:53:34,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27474/203307 [31:13:59<199:53:28,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27474/203307 [31:13:59<199:53:28,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27475/203307 [31:14:03<199:53:25,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27475/203307 [31:14:03<199:53:25,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27476/203307 [31:14:07<199:53:20,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27476/203307 [31:14:07<199:53:20,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27477/203307 [31:14:11<199:53:13,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27477/203307 [31:14:11<199:53:13,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27478/203307 [31:14:15<199:53:12,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27478/203307 [31:14:15<199:53:12,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27479/203307 [31:14:19<199:53:05,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27479/203307 [31:14:19<199:53:05,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27480/203307 [31:14:23<199:52:59,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27480/203307 [31:14:23<199:52:59,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27481/203307 [31:14:27<199:52:57,  0.24it/s, v_num=t5e6, training/loss=0.0876]Epoch 0:  14%|█▎        | 27481/203307 [31:14:27<199:52:57,  0.24it/s, v_num=t5e6, training/loss=0.092] Epoch 0:  14%|█▎        | 27482/203307 [31:14:31<199:52:51,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27482/203307 [31:14:31<199:52:51,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27483/203307 [31:14:34<199:52:44,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27483/203307 [31:14:34<199:52:44,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27484/203307 [31:14:39<199:52:43,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27484/203307 [31:14:39<199:52:43,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27485/203307 [31:14:43<199:52:36,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27485/203307 [31:14:43<199:52:36,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27486/203307 [31:14:46<199:52:30,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27486/203307 [31:14:46<199:52:30,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27487/203307 [31:14:51<199:52:28,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27487/203307 [31:14:51<199:52:28,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27488/203307 [31:14:55<199:52:22,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27488/203307 [31:14:55<199:52:22,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27489/203307 [31:14:59<199:52:20,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27489/203307 [31:14:59<199:52:20,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27490/203307 [31:15:04<199:52:18,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27490/203307 [31:15:04<199:52:18,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27491/203307 [31:15:07<199:52:12,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27491/203307 [31:15:07<199:52:12,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27492/203307 [31:15:12<199:52:09,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27492/203307 [31:15:12<199:52:09,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27493/203307 [31:15:16<199:52:07,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27493/203307 [31:15:16<199:52:07,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27494/203307 [31:15:20<199:52:00,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27494/203307 [31:15:20<199:52:00,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27495/203307 [31:15:23<199:51:54,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27495/203307 [31:15:23<199:51:54,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27496/203307 [31:15:28<199:51:52,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27496/203307 [31:15:28<199:51:52,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27497/203307 [31:15:32<199:51:49,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27497/203307 [31:15:32<199:51:49,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27498/203307 [31:15:36<199:51:47,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27498/203307 [31:15:36<199:51:47,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27499/203307 [31:15:41<199:51:43,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27499/203307 [31:15:41<199:51:43,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27500/203307 [31:15:44<199:51:37,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27500/203307 [31:15:44<199:51:37,  0.24it/s, v_num=t5e6, training/loss=0.092]
Validation: |          | 0/? [00:00<?, ?it/s][A
Validation:   0%|          | 0/1 [00:00<?, ?it/s][A


Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s][A[A

Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:24,  1.17it/s][A[A

Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:24,  1.15it/s][A[A

Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:24,  1.15it/s][A[A

Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:23,  1.15it/s][A[A

Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:23,  1.14it/s][A[A

Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:22,  1.14it/s][A[A

Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:21,  1.14it/s][A[A

Sampling (mamba memory):  54%|█████▍    | 108/200 [00:06<01:20,  1.14it/s][A[A

Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:20,  1.14it/s][A[A

Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:18,  1.15it/s][A[A

Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:27,  1.14it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:24,  1.15it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:23,  1.16it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:23,  1.14it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:23,  1.14it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:22,  1.14it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:21,  1.14it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:21,  1.13it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:20,  1.12it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:20,  1.12it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:19,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:26,  1.14it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:24,  1.16it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:24,  1.15it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:23,  1.15it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:22,  1.15it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:22,  1.15it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:21,  1.14it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:06<01:20,  1.14it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:20,  1.14it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:19,  1.14it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:18,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:26,  1.15it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:26,  1.14it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:25,  1.13it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:25,  1.13it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:24,  1.13it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:22,  1.13it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:22,  1.13it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:21,  1.13it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:20,  1.13it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:19,  1.13it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:18,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:27,  1.13it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:26,  1.14it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:25,  1.14it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:24,  1.13it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:23,  1.13it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:22,  1.13it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:22,  1.13it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:21,  1.13it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:20,  1.12it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:20,  1.12it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:19,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:27,  1.13it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:27,  1.13it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:26,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:25,  1.13it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:23,  1.13it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:22,  1.14it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:21,  1.13it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:21,  1.13it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:20,  1.13it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:19,  1.13it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:18,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:31,  1.08it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:29,  1.10it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:28,  1.10it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:27,  1.10it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:25,  1.11it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:24,  1.11it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:23,  1.11it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:23,  1.10it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:22,  1.10it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:09<01:21,  1.10it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:21,  1.1Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:16,  1.16it/s][A[A

Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:01<01:41,  1.02s/it]Sampling (mamba memory):  51%|█████     | 102/200 [00:02<01:39,  1.02s/it]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:03<01:38,  1.02s/it]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:04<01:37,  1.02s/it]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:05<01:36,  1.02s/it]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:06<01:35,  1.02s/it]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:07<01:34,  1.02s/it]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:08<01:31,  1.01it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:27,  1.04it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:09<01:25,  1.06it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:10<01:23,  1.0Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:15,  1.17it/s][A[A

Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:14,  1.17it/s][A[A

Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:13,  1.17it/s][A[A

Sampling (mamba memory):  57%|█████▊    | 115/200 [00:12<01:12,  1.17it/s][A[A

Sampling (mamba memory):  58%|█████▊    | 116/200 [00:13<01:11,  1.17it/s][A[A

Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:11,  1.17it/s][A[A

Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:10,  1.16it/s][A[A

Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:09,  1.16it/s][A[A

Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:09,  1.16it/s][A[A

Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:08,  1.15it/s][A[A

Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:08,  1.14it/s][A[A

3it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:17,  1.13it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:16,  1.13it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:16,  1.13it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:15,  1.13it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:14,  1.13it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:13,  1.12it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:13,  1.12it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:12,  1.12it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:11,  1.12it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:10,  1.11it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:10,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 123/Sampling (mamba memory):  62%|██████▏   | 123/200 [00:19<01:07,  1.14it/s][A[A

2it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:18,  1.12it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:17,  1.12it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:17,  1.11it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:16,  1.11it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:15,  1.11it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:14,  1.11it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:14,  1.10it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:13,  1.10it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:12,  1.10it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:11,  1.10it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:11,  1.09it/s]Sampling (mamba memory):  62%|██████▏   | 123/2it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:18,  1.12it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:17,  1.12it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:17,  1.11it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:16,  1.11it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:15,  1.11it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:14,  1.11it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:14,  1.10it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:13,  1.10it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:12,  1.10it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:11,  1.10it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:11,  1.10it/s]Sampling (mamba memory):  62%|██████▏   | 123/3it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:18,  1.13it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:17,  1.12it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:16,  1.12it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:16,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:15,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:14,  1.11it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:14,  1.11it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:13,  1.10it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:13,  1.09it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:12,  1.09it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:11,  1.09it/s]Sampling (mamba memory):  62%|██████▏   | 123/3it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:18,  1.13it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:17,  1.12it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:16,  1.12it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:16,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:15,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:14,  1.11it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:13,  1.11it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:13,  1.10it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:12,  1.10it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:12,  1.09it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:11,  1.09it/s]Sampling (mamba memory):  62%|██████▏   | 123/0it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:20,  1.10it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:19,  1.09it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:18,  1.09it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:17,  1.09it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:17,  1.09it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:16,  1.09it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:15,  1.08it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:14,  1.08it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:13,  1.08it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:19<01:13,  1.08it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:20<01:12,  1.08it/s]Sampling (mamba memory):  62%|██████▏   | 123/Sampling (mamba memory):  62%|██████▏   | 124/200 [00:20<01:06,  1.14it/s][A[A

7it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:11<01:21,  1.08it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:12<01:20,  1.08it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:13<01:20,  1.07it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:14<01:19,  1.07it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:15<01:19,  1.06it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:16<01:18,  1.06it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:17<01:19,  1.03it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:18<01:19,  1.02it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:19<01:17,  1.03it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:20<01:15,  1.04it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:21<01:14,  1.05it/s]Sampling (mamba memory):  62%|██████▏   | 123/Sampling (mamba memory):  62%|██████▎   | 125/200 [00:21<01:05,  1.14it/s][A[A

Sampling (mamba memory):  63%|██████▎   | 126/200 [00:22<01:04,  1.14it/s][A[A

Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:04,  1.14it/s][A[A

Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:03,  1.14it/s][A[A

Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:02,  1.14it/s][A[A

Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:01,  1.14it/s][A[A

Sampling (mamba memory):  66%|██████▌   | 131/200 [00:26<01:00,  1.14it/s][A[A

Sampling (mamba memory):  66%|██████▌   | 132/200 [00:27<00:59,  1.14it/s][A[A

Sampling (mamba memory):  66%|██████▋   | 133/200 [00:28<00:58,  1.14it/s][A[A

Sampling (mamba memory):  67%|██████▋   | 134/200 [00:29<00:57,  1.14it/s][A[A

Sampling (mamba memory):  68%|██████▊   | 135/200 [00:30<00:57,  1.14it/s][A[A

200 [00:20<01:08,  1.12it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:07,  1.12it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:06,  1.12it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:05,  1.13it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:04,  1.12it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:03,  1.13it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:03,  1.13it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:02,  1.12it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:02,  1.11it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:01,  1.10it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:00,  1.10it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<00:59,  1.10it/s]Sampling (mamba 200 [00:20<01:10,  1.10it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:09,  1.10it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:08,  1.10it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:07,  1.10it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:06,  1.10it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:05,  1.10it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:04,  1.11it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:03,  1.10it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:02,  1.10it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:01,  1.10it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:01,  1.10it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:00,  1.10it/s]Sampling (mamba 200 [00:20<01:10,  1.09it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:09,  1.10it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:08,  1.09it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:07,  1.09it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:07,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:06,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:05,  1.09it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:04,  1.08it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:03,  1.08it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:03,  1.08it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:02,  1.08it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:01,  1.08it/s]Sampling (mamba 200 [00:20<01:10,  1.09it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:09,  1.09it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:08,  1.09it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:07,  1.09it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:06,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:05,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:05,  1.09it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:04,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:03,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:02,  1.08it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:01,  1.08it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:01,  1.08it/s]Sampling (mamba Sampling (mamba memory):  68%|██████▊   | 136/200 [00:31<00:56,  1.14it/s][A[A

200 [00:20<01:10,  1.09it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:10,  1.09it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:09,  1.08it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:08,  1.08it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:07,  1.08it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:06,  1.08it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:05,  1.08it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:05,  1.08it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:04,  1.07it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:03,  1.07it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:02,  1.07it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:02,  1.06it/s]Sampling (mamba 200 [00:21<01:11,  1.08it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:22<01:10,  1.07it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:10,  1.07it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:09,  1.07it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:08,  1.06it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:07,  1.06it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:06,  1.06it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:06,  1.06it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:05,  1.06it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:04,  1.06it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:03,  1.06it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<01:02,  1.06it/s]Sampling (mamba Sampling (mamba memory):  68%|██████▊   | 137/200 [00:32<00:55,  1.13it/s][A[A

200 [00:22<01:12,  1.06it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:23<01:11,  1.06it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:24<01:10,  1.06it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:25<01:09,  1.06it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:25<01:09,  1.06it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:26<01:08,  1.05it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:27<01:07,  1.05it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:28<01:06,  1.05it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:29<01:05,  1.05it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:30<01:04,  1.05it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:31<01:03,  1.05it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:32<01:02,  1.06it/s]Sampling (mamba Sampling (mamba memory):  69%|██████▉   | 138/200 [00:33<00:54,  1.13it/s][A[A

Sampling (mamba memory):  70%|██████▉   | 139/200 [00:33<00:54,  1.13it/s][A[A

Sampling (mamba memory):  70%|███████   | 140/200 [00:34<00:53,  1.13it/s][A[A

Sampling (mamba memory):  70%|███████   | 141/200 [00:35<00:52,  1.12it/s][A[A

Sampling (mamba memory):  71%|███████   | 142/200 [00:36<00:51,  1.12it/s][A[A

Sampling (mamba memory):  72%|███████▏  | 143/200 [00:37<00:51,  1.11it/s][A[A

Sampling (mamba memory):  72%|███████▏  | 144/200 [00:38<00:50,  1.11it/s][A[A

Sampling (mamba memory):  72%|███████▎  | 145/200 [00:39<00:49,  1.11it/s][A[A

Sampling (mamba memory):  73%|███████▎  | 146/200 [00:40<00:48,  1.11it/s][A[A

memory):  68%|██████▊   | 135/200 [00:31<00:59,  1.10it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:58,  1.10it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:57,  1.09it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:33<00:56,  1.09it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:34<00:55,  1.09it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:35<00:55,  1.09it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:36<00:54,  1.09it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:37<00:53,  1.09it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:38<00:52,  1.08it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:51,  1.08it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:50,  1.08it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▎  | 147/200 [00:41<00:47,  1.11it/s][A[A

memory):  68%|██████▊   | 135/200 [00:31<00:59,  1.10it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:58,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:57,  1.09it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:57,  1.08it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:56,  1.08it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:55,  1.08it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:54,  1.08it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:53,  1.08it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:38<00:53,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:52,  1.07it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:51,  1.07it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:31<01:00,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:59,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:58,  1.07it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:57,  1.07it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:57,  1.07it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:56,  1.07it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:55,  1.07it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:54,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:53,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:52,  1.06it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:51,  1.06it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:31<01:00,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:59,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:58,  1.08it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:57,  1.08it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:56,  1.07it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:55,  1.07it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:55,  1.07it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:54,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:53,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:52,  1.07it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:51,  1.07it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:31<01:01,  1.06it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<01:00,  1.06it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:59,  1.06it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:58,  1.06it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:57,  1.06it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:56,  1.05it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:56,  1.05it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:55,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:54,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:53,  1.05it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:52,  1.04it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▍  | 148/200 [00:42<00:46,  1.11it/s][A[A

memory):  68%|██████▊   | 135/200 [00:32<01:01,  1.06it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:33<01:00,  1.06it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:34<00:59,  1.06it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:35<00:58,  1.06it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:36<00:58,  1.05it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:37<00:56,  1.05it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:38<00:56,  1.05it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:39<00:55,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:40<00:54,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:53,  1.05it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:52,  1.04it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▍  | 149/200 [00:43<00:45,  1.11it/s][A[A

memory):  68%|██████▊   | 135/200 [00:33<01:01,  1.05it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:34<01:00,  1.06it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:35<00:59,  1.05it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:36<00:59,  1.05it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:37<00:58,  1.05it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:38<00:57,  1.05it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:39<00:56,  1.04it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:40<00:55,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:41<00:54,  1.04it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:42<00:53,  1.04it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:43<00:52,  1.04it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  75%|███████▌  | 150/200 [00:43<00:45,  1.11it/s][A[A

Sampling (mamba memory):  76%|███████▌  | 151/200 [00:44<00:44,  1.10it/s][A[A

Sampling (mamba memory):  76%|███████▌  | 152/200 [00:45<00:43,  1.10it/s][A[A

Sampling (mamba memory):  76%|███████▋  | 153/200 [00:46<00:42,  1.10it/s][A[A

Sampling (mamba memory):  77%|███████▋  | 154/200 [00:47<00:42,  1.09it/s][A[A

Sampling (mamba memory):  78%|███████▊  | 155/200 [00:48<00:41,  1.09it/s][A[A

Sampling (mamba memory):  78%|███████▊  | 156/200 [00:49<00:40,  1.08it/s][A[A

Sampling (mamba memory):  78%|███████▊  | 157/200 [00:50<00:39,  1.09it/s][A[A

 | 146/200 [00:41<00:49,  1.08it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:49,  1.08it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:48,  1.08it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:47,  1.07it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:46,  1.07it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:45<00:45,  1.07it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:46<00:45,  1.07it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:47<00:44,  1.06it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:48<00:43,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:49<00:42,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:50<00:41,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:51<00:40Sampling (mamba memory):  79%|███████▉  | 158/200 [00:51<00:38,  1.09it/s][A[A

 | 146/200 [00:41<00:50,  1.07it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:49,  1.07it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:48,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:47,  1.06it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:47,  1.06it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:46,  1.06it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:45,  1.06it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:44,  1.05it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:43,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:42,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:42,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:41 | 146/200 [00:41<00:50,  1.07it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:49,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:49,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:48,  1.05it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:47,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:46,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:45,  1.05it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:44,  1.05it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:43,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:42,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:42,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:41 | 146/200 [00:42<00:50,  1.06it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:50,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:49,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:48,  1.05it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:47,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:46,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:45,  1.04it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:45,  1.04it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:44,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:43,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:42,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:41Sampling (mamba memory):  80%|███████▉  | 159/200 [00:52<00:37,  1.09it/s][A[A

 | 146/200 [00:42<00:51,  1.04it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:51,  1.04it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:50,  1.04it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:49,  1.03it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:48,  1.03it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:47,  1.03it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:48<00:46,  1.03it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:49<00:45,  1.03it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:50<00:44,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:51<00:43,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:52<00:42,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:53<00:41Sampling (mamba memory):  80%|████████  | 160/200 [00:53<00:36,  1.10it/s][A[A

 | 146/200 [00:42<00:51,  1.04it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:51,  1.04it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:50,  1.03it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:49,  1.03it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:48,  1.03it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:47,  1.03it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:48<00:47,  1.02it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:49<00:46,  1.02it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:50<00:45,  1.02it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:51<00:44,  1.02it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:52<00:42,  1.02it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:53<00:42Sampling (mamba memory):  80%|████████  | 161/200 [00:53<00:35,  1.10it/s][A[A

 | 146/200 [00:44<00:52,  1.04it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:45<00:51,  1.03it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:46<00:50,  1.03it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:47<00:49,  1.03it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:48<00:48,  1.03it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:49<00:47,  1.03it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:49<00:46,  1.03it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:50<00:45,  1.03it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:51<00:44,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:52<00:43,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:53<00:42,  1.02it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:54<00:41Sampling (mamba memory):  81%|████████  | 162/200 [00:54<00:34,  1.09it/s][A[A

Sampling (mamba memory):  82%|████████▏ | 163/200 [00:55<00:33,  1.09it/s][A[A

Sampling (mamba memory):  82%|████████▏ | 164/200 [00:56<00:33,  1.09it/s][A[A

Sampling (mamba memory):  82%|████████▎ | 165/200 [00:57<00:32,  1.09it/s][A[A

Sampling (mamba memory):  83%|████████▎ | 166/200 [00:58<00:31,  1.09it/s][A[A

Sampling (mamba memory):  84%|████████▎ | 167/200 [00:59<00:30,  1.08it/s][A[A

Sampling (mamba memory):  84%|████████▍ | 168/200 [01:00<00:29,  1.08it/s][A[A

Sampling (mamba memory):  84%|████████▍ | 169/200 [01:01<00:28,  1.08it/s][A[A

,  1.06it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:52<00:39,  1.06it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:53<00:38,  1.06it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:54<00:37,  1.05it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:55<00:37,  1.05it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:56<00:36,  1.05it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:57<00:35,  1.05it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:58<00:34,  1.04it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [00:59<00:33,  1.04it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:00<00:32,  1.04it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:01<00:31,  1.04it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:02<00:30,  1.04it/sSampling (mamba memory):  85%|████████▌ | 170/200 [01:02<00:27,  1.08it/s][A[A

,  1.05it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:53<00:40,  1.05it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:54<00:39,  1.04it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:55<00:38,  1.04it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:56<00:37,  1.03it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:57<00:36,  1.03it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:35,  1.03it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:34,  1.03it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:34,  1.03it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:33,  1.03it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:01<00:32,  1.02it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:02<00:31,  1.02it/s,  1.05it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:53<00:40,  1.05it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:54<00:39,  1.04it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:55<00:38,  1.04it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:56<00:37,  1.04it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:57<00:36,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:35,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:34,  1.04it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:33,  1.04it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:32,  1.03it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:02<00:32,  1.03it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:03<00:31,  1.03it/s,  1.04it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:53<00:40,  1.03it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:54<00:39,  1.03it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:55<00:38,  1.03it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:56<00:38,  1.02it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:57<00:37,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:36,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:35,  1.02it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:34,  1.01it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:33,  1.01it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:02<00:32,  1.01it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:03<00:31,  1.01it/sSampling (mamba memory):  86%|████████▌ | 171/200 [01:03<00:27,  1.07it/s][A[A

,  1.03it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:54<00:40,  1.03it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:55<00:40,  1.02it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:56<00:39,  1.02it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:57<00:38,  1.02it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:57<00:37,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:36,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:35,  1.02it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:34,  1.02it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:33,  1.02it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:02<00:32,  1.01it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:03<00:31,  1.01it/s,  1.02it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:54<00:41,  1.02it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:55<00:40,  1.02it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:56<00:39,  1.01it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:57<00:38,  1.02it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:58<00:37,  1.01it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:59<00:36,  1.01it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:00<00:35,  1.01it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:01<00:34,  1.01it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:02<00:33,  1.00it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:03<00:32,  1.00it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:04<00:31,  1.00it/sSampling (mamba memory):  86%|████████▌ | 172/200 [01:04<00:26,  1.06it/s][A[A

Sampling (mamba memory):  86%|████████▋ | 173/200 [01:05<00:25,  1.05it/s][A[A

,  1.02it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:55<00:41,  1.02it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:56<00:40,  1.02it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:57<00:39,  1.02it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:58<00:38,  1.02it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:59<00:37,  1.01it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [01:00<00:36,  1.01it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:01<00:35,  1.01it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:02<00:35,  1.00s/it]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:03<00:34,  1.01s/it]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:04<00:33,  1.01s/it]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:05<00:32,  1.02s/itSampling (mamba memory):  87%|████████▋ | 174/200 [01:06<00:24,  1.05it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 175/200 [01:07<00:23,  1.05it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 176/200 [01:08<00:22,  1.05it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 177/200 [01:09<00:21,  1.05it/s][A[A

Sampling (mamba memory):  89%|████████▉ | 178/200 [01:09<00:21,  1.04it/s][A[A

Sampling (mamba memory):  90%|████████▉ | 179/200 [01:10<00:20,  1.04it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:11<00:19,  1.03it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:03<00:29,  1.03it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:04<00:29,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:05<00:28,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:06<00:27,  1.03it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:07<00:26,  1.02it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:08<00:25,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:09<00:24,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:10<00:23,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:11<00:22,  1.02it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:12<00:21,  1.02it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:13<00:20,  1.02it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:12<00:18,  1.03it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:03<00:30,  1.02it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:04<00:29,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:05<00:28,  1.01it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:06<00:27,  1.01it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:07<00:26,  1.01it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:08<00:25,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:09<00:24,  1.00it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:10<00:23,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:11<00:22,  1.00it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:12<00:21,  1.00it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:13<00:20,  1.00it/s]]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:04<00:30,  1.02it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:05<00:29,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:06<00:28,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:07<00:27,  1.02it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:08<00:26,  1.02it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:09<00:25,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:10<00:24,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:11<00:23,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:12<00:22,  1.00it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:13<00:21,  1.00it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:14<00:21,  1.00s/it]]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:04<00:30,  1.01it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:05<00:29,  1.00it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:06<00:29,  1.00s/it]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:07<00:28,  1.00s/it]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:08<00:27,  1.00s/it]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:09<00:26,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:10<00:25,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:11<00:24,  1.00s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:12<00:23,  1.01s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:13<00:22,  1.01s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:14<00:21,  1.01s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:13<00:17,  1.03it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:04<00:30,  1.01it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:05<00:29,  1.01it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:06<00:28,  1.01it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:07<00:27,  1.01it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:08<00:26,  1.01it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:09<00:25,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:10<00:24,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:11<00:23,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:12<00:22,  1.01it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:13<00:21,  1.00it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:14<00:20,  1.00it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:14<00:16,  1.03it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:05<00:31,  1.00s/it]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:06<00:30,  1.01s/it]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:07<00:29,  1.01s/it]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:08<00:28,  1.01s/it]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:09<00:27,  1.01s/it]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:10<00:26,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:11<00:25,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:12<00:24,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:13<00:23,  1.02s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:14<00:22,  1.01s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:15<00:21,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:15<00:15,  1.02it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:06<00:31,  1.02s/it]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:07<00:30,  1.02s/it]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:08<00:29,  1.02s/it]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:09<00:28,  1.02s/it]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:11<00:27,  1.03s/it]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:12<00:26,  1.03s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:13<00:25,  1.03s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:14<00:24,  1.03s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:15<00:23,  1.04s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:16<00:22,  1.04s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:17<00:21,  1.04s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:16<00:14,  1.02it/s][A[A

Sampling (mamba memory):  93%|█████████▎| 186/200 [01:17<00:13,  1.02it/s][A[A

Sampling (mamba memory):  94%|█████████▎| 187/200 [01:18<00:12,  1.02it/s][A[A

Sampling (mamba memory):  94%|█████████▍| 188/200 [01:19<00:11,  1.02it/s][A[A

Sampling (mamba memory):  94%|█████████▍| 189/200 [01:20<00:10,  1.02it/s][A[A

Sampling (mamba memory):  95%|█████████▌| 190/200 [01:21<00:09,  1.02it/s][A[A

Sampling (mamba memory):  96%|█████████▌| 191/200 [01:22<00:08,  1.02it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:14<00:19,  1.02it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:14<00:18,  1.02it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:15<00:17,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:16<00:16,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:17<00:15,  1.01it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:18<00:14,  1.01it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:19<00:13,  1.00it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:20<00:12,  1.00it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:21<00:11,  1.00it/s]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:22<00:10,  1.00it/s]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:23<00Sampling (mamba memory):  96%|█████████▌| 192/200 [01:23<00:07,  1.02it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:14<00:19,  1.00it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:15<00:18,  1.00it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:16<00:18,  1.00s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:17<00:17,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:18<00:16,  1.01s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:19<00:15,  1.01s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:21<00:14,  1.01s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:22<00:13,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:23<00:12,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:24<00:11,  1.02s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:25<00Sampling (mamba memory):  90%|█████████ | 180/200 [01:15<00:20,  1.00s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:16<00:19,  1.01s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:17<00:18,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:18<00:17,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:19<00:16,  1.01s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:20<00:15,  1.01s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:21<00:14,  1.02s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:22<00:13,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:23<00:12,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:24<00:11,  1.01s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:25<00Sampling (mamba memory):  96%|█████████▋| 193/200 [01:24<00:06,  1.02it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:15<00:20,  1.01s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:16<00:19,  1.01s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:17<00:18,  1.02s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:18<00:17,  1.02s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:19<00:16,  1.02s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:20<00:15,  1.02s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:21<00:14,  1.02s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:22<00:13,  1.02s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:23<00:12,  1.03s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:24<00:11,  1.03s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:25<00Sampling (mamba memory):  90%|█████████ | 180/200 [01:15<00:20,  1.00s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:16<00:19,  1.01s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:17<00:18,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:18<00:17,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:19<00:16,  1.01s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:20<00:15,  1.01s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:21<00:14,  1.01s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:22<00:13,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:23<00:12,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:24<00:11,  1.01s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:25<00Sampling (mamba memory):  97%|█████████▋| 194/200 [01:25<00:05,  1.02it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:16<00:20,  1.02s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:17<00:19,  1.02s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:18<00:18,  1.02s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:19<00:17,  1.02s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:20<00:16,  1.03s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:21<00:15,  1.03s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:22<00:14,  1.03s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:23<00:13,  1.03s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:25<00:12,  1.04s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:26<00:11,  1.04s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:27<00Sampling (mamba memory):  98%|█████████▊| 195/200 [01:26<00:04,  1.02it/s][A[A

Sampling (mamba memory):  98%|█████████▊| 196/200 [01:27<00:03,  1.02it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:18<00:20,  1.04s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:19<00:19,  1.04s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:20<00:18,  1.05s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:21<00:17,  1.04s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:22<00:16,  1.04s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:23<00:15,  1.04s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:24<00:14,  1.04s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:25<00:13,  1.04s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:26<00:12,  1.04s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:27<00:11,  1.04s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:28<00Sampling (mamba memory):  98%|█████████▊| 197/200 [01:28<00:02,  1.02it/s][A[A

Sampling (mamba memory):  99%|█████████▉| 198/200 [01:29<00:01,  1.01it/s][A[A

Sampling (mamba memory): 100%|█████████▉| 199/200 [01:30<00:00,  1.01it/s][A[A

Sampling (mamba memory): 100%|██████████| 200/200 [01:31<00:00,  1.01it/s][A[ASampling (mamba memory): 100%|██████████| 200/200 [01:36<00:00,  1.04it/s]
Validation DataLoader 0:   0%|          | 0/1 [00:00<?, ?it/s][A
:09,  1.00it/s]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:24<00:08,  1.00it/s]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:25<00:07,  1.01it/s]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:26<00:06,  1.01it/s]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:27<00:05,  1.00it/s]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:28<00:04,  1.00it/s]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:29<00:03,  1.00it/s]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:30<00:03,  1.00s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:31<00:02,  1.00s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:32<00:00,  1.00it/s]Sampling (mamba memory): 100%|██████████| 200/200 [01:33<00:00,  1.00it/s]Sampling (mamba memory): 100%|██████████| 200/200 [01:38<00:00,  1.01it/s]
:10,  1.01s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:26<00:09,  1.01s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:27<00:08,  1.01s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:28<00:07,  1.01s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:29<00:06,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:30<00:05,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:31<00:04,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:32<00:03,  1.02s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:33<00:02,  1.02s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:34<00:01,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:35<00:00,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:40<00:00,  1.00s/it]
:10,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:26<00:09,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:27<00:08,  1.02s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:28<00:07,  1.02s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:29<00:06,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:30<00:05,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:31<00:04,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:32<00:03,  1.03s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:33<00:02,  1.03s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:34<00:01,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:35<00:00,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:40<00:00,  1.00s/it]
:10,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:26<00:09,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:27<00:08,  1.03s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:28<00:07,  1.03s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:29<00:06,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:30<00:05,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:31<00:04,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:33<00:03,  1.02s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:34<00:02,  1.02s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:35<00:01,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:36<00:00,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:40<00:00,  1.01s/it]
:10,  1.01s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:26<00:09,  1.01s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:27<00:08,  1.01s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:28<00:07,  1.01s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:29<00:06,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:31<00:05,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:32<00:04,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:33<00:03,  1.02s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:34<00:02,  1.03s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:35<00:01,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:36<00:00,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:41<00:00,  1.01s/it]
:10,  1.04s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:28<00:09,  1.04s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:29<00:08,  1.04s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:30<00:07,  1.04s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:31<00:06,  1.05s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:32<00:05,  1.05s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:33<00:04,  1.05s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:34<00:03,  1.05s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:35<00:02,  1.06s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:36<00:01,  1.05s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:37<00:00,  1.05s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:42<00:00,  1.02s/it]
:10,  1.04s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:29<00:09,  1.04s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:30<00:08,  1.05s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:31<00:07,  1.05s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:32<00:06,  1.05s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:33<00:05,  1.05s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:35<00:04,  1.06s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:36<00:03,  1.06s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:37<00:02,  1.05s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:38<00:01,  1.05s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:39<00:00,  1.06s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:43<00:00,  1.04s/it]
Validation DataLoader 0: 100%|██████████| 1/1 [01:36<00:00,  0.01it/s][A
                                                                      [AEpoch 0:  14%|█▎        | 27500/203307 [31:17:41<200:03:59,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27501/203307 [31:17:45<200:04:00,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▎        | 27501/203307 [31:17:45<200:04:00,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27502/203307 [31:17:49<200:03:53,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27502/203307 [31:17:49<200:03:53,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27503/203307 [31:17:53<200:03:47,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27503/203307 [31:17:53<200:03:47,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27504/203307 [31:17:57<200:03:42,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27504/203307 [31:17:57<200:03:42,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27505/203307 [31:18:01<200:03:42,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27505/203307 [31:18:01<200:03:42,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27506/203307 [31:18:05<200:03:36,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27506/203307 [31:18:05<200:03:36,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27507/203307 [31:18:10<200:03:34,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27507/203307 [31:18:10<200:03:34,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27508/203307 [31:18:13<200:03:26,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27508/203307 [31:18:13<200:03:26,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27509/203307 [31:18:18<200:03:24,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27509/203307 [31:18:18<200:03:24,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27510/203307 [31:18:21<200:03:18,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27510/203307 [31:18:21<200:03:18,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27511/203307 [31:18:26<200:03:16,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27511/203307 [31:18:26<200:03:16,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27512/203307 [31:18:30<200:03:10,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27512/203307 [31:18:30<200:03:10,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27513/203307 [31:18:34<200:03:08,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27513/203307 [31:18:34<200:03:08,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27514/203307 [31:18:38<200:03:05,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27514/203307 [31:18:38<200:03:05,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27515/203307 [31:18:42<200:02:59,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27515/203307 [31:18:42<200:02:59,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27516/203307 [31:18:47<200:02:58,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27516/203307 [31:18:47<200:02:58,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27517/203307 [31:18:51<200:02:55,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27517/203307 [31:18:51<200:02:55,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27518/203307 [31:18:55<200:02:49,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27518/203307 [31:18:55<200:02:49,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27519/203307 [31:18:59<200:02:46,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27519/203307 [31:18:59<200:02:47,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27520/203307 [31:19:03<200:02:40,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27520/203307 [31:19:03<200:02:40,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27521/203307 [31:19:07<200:02:37,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  14%|█▎        | 27521/203307 [31:19:07<200:02:37,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27522/203307 [31:19:12<200:02:35,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27522/203307 [31:19:12<200:02:35,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27523/203307 [31:19:15<200:02:29,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27523/203307 [31:19:15<200:02:29,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27524/203307 [31:19:20<200:02:27,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27524/203307 [31:19:20<200:02:27,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27525/203307 [31:19:23<200:02:20,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27525/203307 [31:19:23<200:02:20,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27526/203307 [31:19:28<200:02:17,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27526/203307 [31:19:28<200:02:17,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27527/203307 [31:19:32<200:02:14,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27527/203307 [31:19:32<200:02:14,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27528/203307 [31:19:36<200:02:07,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27528/203307 [31:19:36<200:02:08,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27529/203307 [31:19:39<200:02:01,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27529/203307 [31:19:39<200:02:01,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27530/203307 [31:19:44<200:01:58,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27530/203307 [31:19:44<200:01:58,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27531/203307 [31:19:48<200:01:56,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27531/203307 [31:19:48<200:01:56,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27532/203307 [31:19:52<200:01:54,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27532/203307 [31:19:52<200:01:54,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27533/203307 [31:19:56<200:01:47,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27533/203307 [31:19:56<200:01:47,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27534/203307 [31:20:00<200:01:44,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27534/203307 [31:20:00<200:01:44,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27535/203307 [31:20:05<200:01:41,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27535/203307 [31:20:05<200:01:41,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27536/203307 [31:20:09<200:01:38,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27536/203307 [31:20:09<200:01:38,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27537/203307 [31:20:13<200:01:31,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27537/203307 [31:20:13<200:01:31,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27538/203307 [31:20:17<200:01:28,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27538/203307 [31:20:17<200:01:28,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27539/203307 [31:20:21<200:01:27,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27539/203307 [31:20:21<200:01:27,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27540/203307 [31:20:25<200:01:21,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27540/203307 [31:20:25<200:01:21,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27541/203307 [31:20:30<200:01:19,  0.24it/s, v_num=t5e6, training/loss=0.0946]Epoch 0:  14%|█▎        | 27541/203307 [31:20:30<200:01:19,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27542/203307 [31:20:33<200:01:13,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27542/203307 [31:20:33<200:01:13,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27543/203307 [31:20:38<200:01:10,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27543/203307 [31:20:38<200:01:10,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27544/203307 [31:20:42<200:01:08,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27544/203307 [31:20:42<200:01:08,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27545/203307 [31:20:46<200:01:04,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27545/203307 [31:20:46<200:01:04,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27546/203307 [31:20:51<200:01:01,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27546/203307 [31:20:51<200:01:01,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27547/203307 [31:20:55<200:00:59,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27547/203307 [31:20:55<200:00:59,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27548/203307 [31:20:59<200:00:53,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27548/203307 [31:20:59<200:00:53,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27549/203307 [31:21:03<200:00:51,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27549/203307 [31:21:03<200:00:51,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27550/203307 [31:21:07<200:00:47,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27550/203307 [31:21:07<200:00:47,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27551/203307 [31:21:11<200:00:39,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27551/203307 [31:21:11<200:00:39,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27552/203307 [31:21:15<200:00:37,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27552/203307 [31:21:15<200:00:37,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27553/203307 [31:21:20<200:00:34,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27553/203307 [31:21:20<200:00:34,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27554/203307 [31:21:23<200:00:28,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27554/203307 [31:21:23<200:00:28,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27555/203307 [31:21:28<200:00:25,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27555/203307 [31:21:28<200:00:25,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27556/203307 [31:21:32<200:00:23,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27556/203307 [31:21:32<200:00:23,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27557/203307 [31:21:36<200:00:16,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27557/203307 [31:21:36<200:00:16,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27558/203307 [31:21:40<200:00:14,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27558/203307 [31:21:40<200:00:14,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27559/203307 [31:21:44<200:00:08,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27559/203307 [31:21:44<200:00:08,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27560/203307 [31:21:48<200:00:05,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27560/203307 [31:21:48<200:00:05,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27561/203307 [31:21:52<199:59:59,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27561/203307 [31:21:52<199:59:59,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27562/203307 [31:21:56<199:59:57,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27562/203307 [31:21:56<199:59:57,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27563/203307 [31:22:01<199:59:54,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27563/203307 [31:22:01<199:59:54,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27564/203307 [31:22:05<199:59:52,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27564/203307 [31:22:05<199:59:52,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27565/203307 [31:22:09<199:59:45,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27565/203307 [31:22:09<199:59:45,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27566/203307 [31:22:12<199:59:38,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27566/203307 [31:22:12<199:59:38,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27567/203307 [31:22:17<199:59:36,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27567/203307 [31:22:17<199:59:36,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27568/203307 [31:22:20<199:59:29,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27568/203307 [31:22:20<199:59:29,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27569/203307 [31:22:25<199:59:27,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27569/203307 [31:22:25<199:59:27,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27570/203307 [31:22:29<199:59:23,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27570/203307 [31:22:29<199:59:23,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27571/203307 [31:22:33<199:59:20,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27571/203307 [31:22:33<199:59:20,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27572/203307 [31:22:37<199:59:17,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27572/203307 [31:22:37<199:59:17,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27573/203307 [31:22:42<199:59:14,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27573/203307 [31:22:42<199:59:14,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27574/203307 [31:22:45<199:59:07,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27574/203307 [31:22:45<199:59:07,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27575/203307 [31:22:50<199:59:04,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27575/203307 [31:22:50<199:59:04,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27576/203307 [31:22:53<199:58:58,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27576/203307 [31:22:53<199:58:58,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27577/203307 [31:22:57<199:58:51,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27577/203307 [31:22:57<199:58:51,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27578/203307 [31:23:01<199:58:48,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27578/203307 [31:23:01<199:58:48,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27579/203307 [31:23:06<199:58:45,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27579/203307 [31:23:06<199:58:45,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27580/203307 [31:23:10<199:58:41,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27580/203307 [31:23:10<199:58:41,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27581/203307 [31:23:14<199:58:38,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▎        | 27581/203307 [31:23:14<199:58:38,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27582/203307 [31:23:18<199:58:36,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27582/203307 [31:23:18<199:58:36,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27583/203307 [31:23:22<199:58:30,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27583/203307 [31:23:22<199:58:30,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27584/203307 [31:23:27<199:58:28,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27584/203307 [31:23:27<199:58:28,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27585/203307 [31:23:30<199:58:21,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27585/203307 [31:23:30<199:58:21,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27586/203307 [31:23:35<199:58:18,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27586/203307 [31:23:35<199:58:18,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27587/203307 [31:23:38<199:58:12,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27587/203307 [31:23:38<199:58:12,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27588/203307 [31:23:43<199:58:10,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27588/203307 [31:23:43<199:58:10,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27589/203307 [31:23:46<199:58:03,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27589/203307 [31:23:46<199:58:03,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27590/203307 [31:23:51<199:58:01,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27590/203307 [31:23:51<199:58:01,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27591/203307 [31:23:54<199:57:54,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27591/203307 [31:23:54<199:57:54,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27592/203307 [31:23:58<199:57:47,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27592/203307 [31:23:58<199:57:47,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27593/203307 [31:24:03<199:57:45,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27593/203307 [31:24:03<199:57:45,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27594/203307 [31:24:06<199:57:39,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27594/203307 [31:24:06<199:57:39,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27595/203307 [31:24:11<199:57:36,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27595/203307 [31:24:11<199:57:36,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27596/203307 [31:24:15<199:57:33,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27596/203307 [31:24:15<199:57:33,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27597/203307 [31:24:19<199:57:26,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27597/203307 [31:24:19<199:57:27,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27598/203307 [31:24:22<199:57:21,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27598/203307 [31:24:22<199:57:21,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27599/203307 [31:24:27<199:57:19,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27599/203307 [31:24:27<199:57:19,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27600/203307 [31:24:31<199:57:13,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27600/203307 [31:24:31<199:57:13,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27601/203307 [31:24:35<199:57:11,  0.24it/s, v_num=t5e6, training/loss=0.0811]Epoch 0:  14%|█▎        | 27601/203307 [31:24:35<199:57:11,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27602/203307 [31:24:39<199:57:05,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27602/203307 [31:24:39<199:57:05,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27603/203307 [31:24:43<199:56:58,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27603/203307 [31:24:43<199:56:58,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27604/203307 [31:24:47<199:56:56,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27604/203307 [31:24:47<199:56:56,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27605/203307 [31:24:51<199:56:53,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27605/203307 [31:24:51<199:56:53,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27606/203307 [31:24:55<199:56:46,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27606/203307 [31:24:55<199:56:46,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27607/203307 [31:24:59<199:56:40,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27607/203307 [31:24:59<199:56:40,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27608/203307 [31:25:03<199:56:38,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27608/203307 [31:25:03<199:56:38,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27609/203307 [31:25:07<199:56:32,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27609/203307 [31:25:07<199:56:32,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27610/203307 [31:25:11<199:56:30,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27610/203307 [31:25:11<199:56:30,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27611/203307 [31:25:15<199:56:24,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27611/203307 [31:25:15<199:56:24,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27612/203307 [31:25:19<199:56:21,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27612/203307 [31:25:19<199:56:21,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27613/203307 [31:25:24<199:56:18,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27613/203307 [31:25:24<199:56:18,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27614/203307 [31:25:28<199:56:15,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27614/203307 [31:25:28<199:56:15,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27615/203307 [31:25:32<199:56:08,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27615/203307 [31:25:32<199:56:08,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27616/203307 [31:25:36<199:56:06,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27616/203307 [31:25:36<199:56:06,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27617/203307 [31:25:40<199:56:02,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27617/203307 [31:25:40<199:56:02,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27618/203307 [31:25:44<199:55:56,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27618/203307 [31:25:44<199:55:56,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27619/203307 [31:25:48<199:55:54,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27619/203307 [31:25:48<199:55:54,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27620/203307 [31:25:52<199:55:47,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27620/203307 [31:25:52<199:55:47,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27621/203307 [31:25:56<199:55:44,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▎        | 27621/203307 [31:25:56<199:55:44,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27622/203307 [31:26:01<199:55:41,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27622/203307 [31:26:01<199:55:41,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27623/203307 [31:26:04<199:55:34,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27623/203307 [31:26:04<199:55:34,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27624/203307 [31:26:08<199:55:28,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27624/203307 [31:26:08<199:55:28,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27625/203307 [31:26:13<199:55:27,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27625/203307 [31:26:13<199:55:27,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27626/203307 [31:26:17<199:55:23,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27626/203307 [31:26:17<199:55:23,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27627/203307 [31:26:21<199:55:21,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27627/203307 [31:26:21<199:55:21,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27628/203307 [31:26:25<199:55:15,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27628/203307 [31:26:25<199:55:15,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27629/203307 [31:26:29<199:55:08,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27629/203307 [31:26:29<199:55:08,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27630/203307 [31:26:33<199:55:07,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27630/203307 [31:26:33<199:55:07,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27631/203307 [31:26:37<199:55:04,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27631/203307 [31:26:37<199:55:04,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27632/203307 [31:26:41<199:54:58,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27632/203307 [31:26:41<199:54:58,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27633/203307 [31:26:45<199:54:51,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27633/203307 [31:26:45<199:54:51,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27634/203307 [31:26:49<199:54:50,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27634/203307 [31:26:49<199:54:50,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27635/203307 [31:26:54<199:54:46,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27635/203307 [31:26:54<199:54:46,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27636/203307 [31:26:58<199:54:45,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27636/203307 [31:26:58<199:54:45,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27637/203307 [31:27:02<199:54:38,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27637/203307 [31:27:02<199:54:38,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27638/203307 [31:27:06<199:54:35,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27638/203307 [31:27:06<199:54:35,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27639/203307 [31:27:10<199:54:29,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27639/203307 [31:27:10<199:54:29,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27640/203307 [31:27:14<199:54:26,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27640/203307 [31:27:14<199:54:26,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27641/203307 [31:27:18<199:54:20,  0.24it/s, v_num=t5e6, training/loss=0.0806]Epoch 0:  14%|█▎        | 27641/203307 [31:27:18<199:54:20,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27642/203307 [31:27:22<199:54:18,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27642/203307 [31:27:22<199:54:18,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27643/203307 [31:27:26<199:54:13,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27643/203307 [31:27:26<199:54:13,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27644/203307 [31:27:30<199:54:09,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27644/203307 [31:27:30<199:54:09,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27645/203307 [31:27:35<199:54:07,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27645/203307 [31:27:35<199:54:07,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27646/203307 [31:27:39<199:54:04,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27646/203307 [31:27:39<199:54:04,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27647/203307 [31:27:43<199:54:01,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27647/203307 [31:27:43<199:54:01,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27648/203307 [31:27:48<199:53:58,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27648/203307 [31:27:48<199:53:58,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27649/203307 [31:27:51<199:53:52,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27649/203307 [31:27:51<199:53:52,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27650/203307 [31:27:55<199:53:45,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27650/203307 [31:27:55<199:53:45,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27651/203307 [31:28:00<199:53:44,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27651/203307 [31:28:00<199:53:44,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27652/203307 [31:28:03<199:53:37,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27652/203307 [31:28:03<199:53:37,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27653/203307 [31:28:08<199:53:34,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27653/203307 [31:28:08<199:53:34,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27654/203307 [31:28:11<199:53:28,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27654/203307 [31:28:11<199:53:28,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27655/203307 [31:28:16<199:53:25,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27655/203307 [31:28:16<199:53:25,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27656/203307 [31:28:20<199:53:22,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27656/203307 [31:28:20<199:53:22,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27657/203307 [31:28:24<199:53:19,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27657/203307 [31:28:24<199:53:19,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27658/203307 [31:28:28<199:53:13,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27658/203307 [31:28:28<199:53:13,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27659/203307 [31:28:32<199:53:06,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27659/203307 [31:28:32<199:53:06,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27660/203307 [31:28:36<199:53:05,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27660/203307 [31:28:36<199:53:05,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27661/203307 [31:28:40<199:52:58,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  14%|█▎        | 27661/203307 [31:28:40<199:52:58,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27662/203307 [31:28:44<199:52:56,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27662/203307 [31:28:44<199:52:56,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27663/203307 [31:28:48<199:52:52,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27663/203307 [31:28:48<199:52:52,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27664/203307 [31:28:53<199:52:50,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27664/203307 [31:28:53<199:52:50,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27665/203307 [31:28:56<199:52:43,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27665/203307 [31:28:56<199:52:43,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27666/203307 [31:29:01<199:52:40,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27666/203307 [31:29:01<199:52:40,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27667/203307 [31:29:04<199:52:34,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27667/203307 [31:29:04<199:52:34,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27668/203307 [31:29:09<199:52:32,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27668/203307 [31:29:09<199:52:32,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27669/203307 [31:29:13<199:52:25,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27669/203307 [31:29:13<199:52:25,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27670/203307 [31:29:16<199:52:19,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27670/203307 [31:29:16<199:52:19,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27671/203307 [31:29:21<199:52:17,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27671/203307 [31:29:21<199:52:17,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27672/203307 [31:29:25<199:52:11,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27672/203307 [31:29:25<199:52:11,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27673/203307 [31:29:29<199:52:09,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27673/203307 [31:29:29<199:52:09,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27674/203307 [31:29:33<199:52:06,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27674/203307 [31:29:33<199:52:06,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27675/203307 [31:29:37<199:52:00,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27675/203307 [31:29:37<199:52:00,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27676/203307 [31:29:41<199:51:53,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27676/203307 [31:29:41<199:51:54,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27677/203307 [31:29:45<199:51:52,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27677/203307 [31:29:45<199:51:52,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27678/203307 [31:29:49<199:51:45,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27678/203307 [31:29:49<199:51:45,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27679/203307 [31:29:53<199:51:43,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27679/203307 [31:29:53<199:51:43,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27680/203307 [31:29:58<199:51:40,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27680/203307 [31:29:58<199:51:40,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27681/203307 [31:30:01<199:51:34,  0.24it/s, v_num=t5e6, training/loss=0.0881]Epoch 0:  14%|█▎        | 27681/203307 [31:30:01<199:51:34,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27682/203307 [31:30:06<199:51:31,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27682/203307 [31:30:06<199:51:31,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27683/203307 [31:30:10<199:51:29,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27683/203307 [31:30:10<199:51:29,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27684/203307 [31:30:14<199:51:22,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27684/203307 [31:30:14<199:51:22,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27685/203307 [31:30:18<199:51:17,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27685/203307 [31:30:18<199:51:17,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27686/203307 [31:30:22<199:51:15,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27686/203307 [31:30:22<199:51:15,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27687/203307 [31:30:26<199:51:08,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27687/203307 [31:30:26<199:51:08,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27688/203307 [31:30:30<199:51:06,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27688/203307 [31:30:30<199:51:06,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27689/203307 [31:30:34<199:51:02,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27689/203307 [31:30:34<199:51:02,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27690/203307 [31:30:39<199:50:59,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27690/203307 [31:30:39<199:50:59,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27691/203307 [31:30:42<199:50:53,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27691/203307 [31:30:42<199:50:53,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27692/203307 [31:30:47<199:50:49,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27692/203307 [31:30:47<199:50:49,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27693/203307 [31:30:50<199:50:43,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27693/203307 [31:30:50<199:50:43,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27694/203307 [31:30:55<199:50:41,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27694/203307 [31:30:55<199:50:41,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27695/203307 [31:30:58<199:50:34,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27695/203307 [31:30:58<199:50:34,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27696/203307 [31:31:03<199:50:31,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27696/203307 [31:31:03<199:50:31,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27697/203307 [31:31:07<199:50:29,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27697/203307 [31:31:07<199:50:29,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27698/203307 [31:31:11<199:50:26,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27698/203307 [31:31:11<199:50:26,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27699/203307 [31:31:16<199:50:23,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27699/203307 [31:31:16<199:50:23,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27700/203307 [31:31:20<199:50:20,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27700/203307 [31:31:20<199:50:20,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27701/203307 [31:31:23<199:50:13,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▎        | 27701/203307 [31:31:23<199:50:13,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27702/203307 [31:31:27<199:50:07,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27702/203307 [31:31:27<199:50:07,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27703/203307 [31:31:32<199:50:05,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27703/203307 [31:31:32<199:50:05,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27704/203307 [31:31:35<199:49:58,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27704/203307 [31:31:35<199:49:58,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27705/203307 [31:31:40<199:49:56,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27705/203307 [31:31:40<199:49:56,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27706/203307 [31:31:44<199:49:50,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27706/203307 [31:31:44<199:49:50,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27707/203307 [31:31:48<199:49:47,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27707/203307 [31:31:48<199:49:47,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27708/203307 [31:31:52<199:49:43,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27708/203307 [31:31:52<199:49:43,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27709/203307 [31:31:56<199:49:41,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27709/203307 [31:31:56<199:49:41,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27710/203307 [31:32:00<199:49:34,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27710/203307 [31:32:00<199:49:34,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27711/203307 [31:32:04<199:49:27,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27711/203307 [31:32:04<199:49:27,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27712/203307 [31:32:08<199:49:26,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27712/203307 [31:32:08<199:49:26,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27713/203307 [31:32:13<199:49:23,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27713/203307 [31:32:13<199:49:23,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27714/203307 [31:32:17<199:49:21,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27714/203307 [31:32:17<199:49:21,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27715/203307 [31:32:21<199:49:15,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27715/203307 [31:32:21<199:49:15,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27716/203307 [31:32:25<199:49:13,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27716/203307 [31:32:25<199:49:13,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27717/203307 [31:32:29<199:49:07,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27717/203307 [31:32:29<199:49:07,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27718/203307 [31:32:33<199:49:04,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27718/203307 [31:32:33<199:49:04,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27719/203307 [31:32:37<199:48:58,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27719/203307 [31:32:37<199:48:58,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27720/203307 [31:32:42<199:48:56,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27720/203307 [31:32:42<199:48:56,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27721/203307 [31:32:46<199:48:54,  0.24it/s, v_num=t5e6, training/loss=0.0787]Epoch 0:  14%|█▎        | 27721/203307 [31:32:46<199:48:54,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27722/203307 [31:32:50<199:48:48,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27722/203307 [31:32:50<199:48:48,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27723/203307 [31:32:54<199:48:46,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27723/203307 [31:32:54<199:48:46,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27724/203307 [31:32:58<199:48:39,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27724/203307 [31:32:58<199:48:40,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27725/203307 [31:33:02<199:48:37,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27725/203307 [31:33:02<199:48:37,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27726/203307 [31:33:06<199:48:34,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27726/203307 [31:33:06<199:48:34,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27727/203307 [31:33:10<199:48:27,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27727/203307 [31:33:10<199:48:27,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27728/203307 [31:33:14<199:48:21,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27728/203307 [31:33:14<199:48:21,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27729/203307 [31:33:19<199:48:20,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27729/203307 [31:33:19<199:48:20,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27730/203307 [31:33:23<199:48:18,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27730/203307 [31:33:23<199:48:18,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27731/203307 [31:33:27<199:48:16,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27731/203307 [31:33:27<199:48:16,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27732/203307 [31:33:31<199:48:10,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27732/203307 [31:33:31<199:48:10,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27733/203307 [31:33:35<199:48:03,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27733/203307 [31:33:35<199:48:03,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27734/203307 [31:33:39<199:48:01,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27734/203307 [31:33:39<199:48:01,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27735/203307 [31:33:44<199:47:59,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27735/203307 [31:33:44<199:47:59,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27736/203307 [31:33:47<199:47:52,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27736/203307 [31:33:47<199:47:52,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27737/203307 [31:33:51<199:47:46,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27737/203307 [31:33:51<199:47:46,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27738/203307 [31:33:56<199:47:44,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27738/203307 [31:33:56<199:47:44,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27739/203307 [31:33:59<199:47:38,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27739/203307 [31:33:59<199:47:38,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27740/203307 [31:34:04<199:47:36,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27740/203307 [31:34:04<199:47:36,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27741/203307 [31:34:08<199:47:30,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  14%|█▎        | 27741/203307 [31:34:08<199:47:30,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27742/203307 [31:34:12<199:47:27,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27742/203307 [31:34:12<199:47:27,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27743/203307 [31:34:16<199:47:24,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27743/203307 [31:34:16<199:47:24,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27744/203307 [31:34:20<199:47:22,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27744/203307 [31:34:20<199:47:22,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27745/203307 [31:34:24<199:47:16,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27745/203307 [31:34:24<199:47:16,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27746/203307 [31:34:29<199:47:14,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27746/203307 [31:34:29<199:47:14,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27747/203307 [31:34:32<199:47:08,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27747/203307 [31:34:32<199:47:08,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27748/203307 [31:34:36<199:47:02,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27748/203307 [31:34:36<199:47:02,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27749/203307 [31:34:41<199:47:00,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27749/203307 [31:34:41<199:47:00,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27750/203307 [31:34:44<199:46:53,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27750/203307 [31:34:44<199:46:53,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27751/203307 [31:34:49<199:46:51,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27751/203307 [31:34:49<199:46:51,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27752/203307 [31:34:53<199:46:48,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27752/203307 [31:34:53<199:46:48,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27753/203307 [31:34:57<199:46:41,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27753/203307 [31:34:57<199:46:41,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27754/203307 [31:35:00<199:46:34,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27754/203307 [31:35:00<199:46:34,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27755/203307 [31:35:05<199:46:33,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27755/203307 [31:35:05<199:46:33,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27756/203307 [31:35:09<199:46:26,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27756/203307 [31:35:09<199:46:26,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27757/203307 [31:35:13<199:46:24,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27757/203307 [31:35:13<199:46:24,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27758/203307 [31:35:17<199:46:17,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27758/203307 [31:35:17<199:46:17,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27759/203307 [31:35:20<199:46:11,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27759/203307 [31:35:20<199:46:11,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27760/203307 [31:35:25<199:46:09,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27760/203307 [31:35:25<199:46:09,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27761/203307 [31:35:29<199:46:07,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▎        | 27761/203307 [31:35:29<199:46:07,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27762/203307 [31:35:33<199:46:00,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27762/203307 [31:35:33<199:46:00,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27763/203307 [31:35:37<199:45:57,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27763/203307 [31:35:37<199:45:57,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27764/203307 [31:35:42<199:45:55,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27764/203307 [31:35:42<199:45:55,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27765/203307 [31:35:45<199:45:49,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27765/203307 [31:35:45<199:45:49,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27766/203307 [31:35:50<199:45:47,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27766/203307 [31:35:50<199:45:47,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27767/203307 [31:35:54<199:45:40,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27767/203307 [31:35:54<199:45:40,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27768/203307 [31:35:58<199:45:37,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27768/203307 [31:35:58<199:45:37,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27769/203307 [31:36:02<199:45:31,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27769/203307 [31:36:02<199:45:31,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27770/203307 [31:36:06<199:45:29,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27770/203307 [31:36:06<199:45:29,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27771/203307 [31:36:10<199:45:26,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27771/203307 [31:36:10<199:45:26,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27772/203307 [31:36:15<199:45:24,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27772/203307 [31:36:15<199:45:24,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27773/203307 [31:36:19<199:45:19,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27773/203307 [31:36:19<199:45:19,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27774/203307 [31:36:22<199:45:12,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27774/203307 [31:36:22<199:45:12,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27775/203307 [31:36:27<199:45:11,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27775/203307 [31:36:27<199:45:11,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27776/203307 [31:36:31<199:45:05,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27776/203307 [31:36:31<199:45:05,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27777/203307 [31:36:35<199:45:02,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27777/203307 [31:36:35<199:45:02,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27778/203307 [31:36:39<199:44:59,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27778/203307 [31:36:39<199:44:59,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27779/203307 [31:36:43<199:44:55,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27779/203307 [31:36:43<199:44:55,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27780/203307 [31:36:48<199:44:53,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27780/203307 [31:36:48<199:44:53,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27781/203307 [31:36:52<199:44:51,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▎        | 27781/203307 [31:36:52<199:44:51,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27782/203307 [31:36:56<199:44:44,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27782/203307 [31:36:56<199:44:44,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27783/203307 [31:37:00<199:44:42,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27783/203307 [31:37:00<199:44:42,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27784/203307 [31:37:04<199:44:35,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27784/203307 [31:37:04<199:44:35,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27785/203307 [31:37:08<199:44:29,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27785/203307 [31:37:08<199:44:29,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27786/203307 [31:37:12<199:44:26,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27786/203307 [31:37:12<199:44:26,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27787/203307 [31:37:16<199:44:24,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27787/203307 [31:37:16<199:44:24,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27788/203307 [31:37:21<199:44:21,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27788/203307 [31:37:21<199:44:21,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27789/203307 [31:37:25<199:44:16,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27789/203307 [31:37:25<199:44:16,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27790/203307 [31:37:29<199:44:13,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27790/203307 [31:37:29<199:44:13,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27791/203307 [31:37:33<199:44:07,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27791/203307 [31:37:33<199:44:07,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27792/203307 [31:37:37<199:44:06,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27792/203307 [31:37:37<199:44:06,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27793/203307 [31:37:41<199:43:59,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27793/203307 [31:37:41<199:43:59,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27794/203307 [31:37:45<199:43:57,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27794/203307 [31:37:45<199:43:57,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27795/203307 [31:37:49<199:43:50,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27795/203307 [31:37:49<199:43:50,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27796/203307 [31:37:53<199:43:49,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27796/203307 [31:37:53<199:43:49,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27797/203307 [31:37:58<199:43:45,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27797/203307 [31:37:58<199:43:45,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27798/203307 [31:38:02<199:43:43,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27798/203307 [31:38:02<199:43:43,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27799/203307 [31:38:06<199:43:37,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27799/203307 [31:38:06<199:43:37,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27800/203307 [31:38:10<199:43:31,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27800/203307 [31:38:10<199:43:31,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27801/203307 [31:38:14<199:43:29,  0.24it/s, v_num=t5e6, training/loss=0.0911]Epoch 0:  14%|█▎        | 27801/203307 [31:38:14<199:43:29,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27802/203307 [31:38:18<199:43:24,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27802/203307 [31:38:18<199:43:24,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27803/203307 [31:38:22<199:43:21,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27803/203307 [31:38:22<199:43:22,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27804/203307 [31:38:27<199:43:19,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27804/203307 [31:38:27<199:43:19,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27805/203307 [31:38:31<199:43:16,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27805/203307 [31:38:31<199:43:16,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27806/203307 [31:38:35<199:43:12,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27806/203307 [31:38:35<199:43:12,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27807/203307 [31:38:40<199:43:11,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27807/203307 [31:38:40<199:43:11,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27808/203307 [31:38:43<199:43:05,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27808/203307 [31:38:43<199:43:05,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27809/203307 [31:38:48<199:43:03,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27809/203307 [31:38:48<199:43:03,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27810/203307 [31:38:52<199:42:57,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27810/203307 [31:38:52<199:42:57,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27811/203307 [31:38:55<199:42:50,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27811/203307 [31:38:55<199:42:50,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27812/203307 [31:39:00<199:42:48,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27812/203307 [31:39:00<199:42:48,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27813/203307 [31:39:04<199:42:46,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27813/203307 [31:39:04<199:42:46,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27814/203307 [31:39:08<199:42:39,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27814/203307 [31:39:08<199:42:39,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27815/203307 [31:39:12<199:42:35,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27815/203307 [31:39:12<199:42:36,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27816/203307 [31:39:17<199:42:35,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27816/203307 [31:39:17<199:42:35,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27817/203307 [31:39:20<199:42:28,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27817/203307 [31:39:20<199:42:28,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27818/203307 [31:39:25<199:42:27,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27818/203307 [31:39:25<199:42:27,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27819/203307 [31:39:29<199:42:20,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27819/203307 [31:39:29<199:42:20,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27820/203307 [31:39:33<199:42:17,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27820/203307 [31:39:33<199:42:17,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27821/203307 [31:39:37<199:42:14,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27821/203307 [31:39:37<199:42:14,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27822/203307 [31:39:41<199:42:11,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27822/203307 [31:39:41<199:42:11,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27823/203307 [31:39:45<199:42:04,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27823/203307 [31:39:45<199:42:04,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27824/203307 [31:39:50<199:42:02,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27824/203307 [31:39:50<199:42:02,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27825/203307 [31:39:53<199:41:56,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27825/203307 [31:39:53<199:41:56,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27826/203307 [31:39:57<199:41:49,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27826/203307 [31:39:57<199:41:49,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27827/203307 [31:40:01<199:41:48,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27827/203307 [31:40:01<199:41:48,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27828/203307 [31:40:05<199:41:41,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27828/203307 [31:40:05<199:41:41,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27829/203307 [31:40:09<199:41:39,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27829/203307 [31:40:09<199:41:39,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27830/203307 [31:40:14<199:41:36,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27830/203307 [31:40:14<199:41:36,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27831/203307 [31:40:18<199:41:30,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27831/203307 [31:40:18<199:41:30,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27832/203307 [31:40:21<199:41:23,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27832/203307 [31:40:21<199:41:23,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27833/203307 [31:40:26<199:41:22,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27833/203307 [31:40:26<199:41:22,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27834/203307 [31:40:29<199:41:15,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27834/203307 [31:40:29<199:41:15,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27835/203307 [31:40:34<199:41:13,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27835/203307 [31:40:34<199:41:13,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27836/203307 [31:40:38<199:41:06,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27836/203307 [31:40:38<199:41:06,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27837/203307 [31:40:41<199:41:00,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27837/203307 [31:40:41<199:41:00,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27838/203307 [31:40:46<199:40:57,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27838/203307 [31:40:46<199:40:57,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27839/203307 [31:40:50<199:40:55,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27839/203307 [31:40:50<199:40:55,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27840/203307 [31:40:54<199:40:48,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27840/203307 [31:40:54<199:40:48,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27841/203307 [31:40:57<199:40:41,  0.24it/s, v_num=t5e6, training/loss=0.0978]Epoch 0:  14%|█▎        | 27841/203307 [31:40:57<199:40:41,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27842/203307 [31:41:02<199:40:39,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27842/203307 [31:41:02<199:40:39,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27843/203307 [31:41:06<199:40:33,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27843/203307 [31:41:06<199:40:33,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27844/203307 [31:41:10<199:40:31,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27844/203307 [31:41:10<199:40:31,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27845/203307 [31:41:14<199:40:24,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27845/203307 [31:41:14<199:40:24,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27846/203307 [31:41:18<199:40:21,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27846/203307 [31:41:18<199:40:22,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27847/203307 [31:41:22<199:40:15,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27847/203307 [31:41:22<199:40:15,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27848/203307 [31:41:26<199:40:12,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27848/203307 [31:41:26<199:40:12,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27849/203307 [31:41:30<199:40:06,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27849/203307 [31:41:30<199:40:06,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27850/203307 [31:41:34<199:40:04,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27850/203307 [31:41:34<199:40:04,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27851/203307 [31:41:38<199:40:01,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27851/203307 [31:41:38<199:40:01,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27852/203307 [31:41:42<199:39:54,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27852/203307 [31:41:42<199:39:54,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27853/203307 [31:41:47<199:39:52,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27853/203307 [31:41:47<199:39:52,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27854/203307 [31:41:50<199:39:46,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27854/203307 [31:41:50<199:39:46,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27855/203307 [31:41:54<199:39:43,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27855/203307 [31:41:54<199:39:43,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27856/203307 [31:41:59<199:39:39,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27856/203307 [31:41:59<199:39:39,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27857/203307 [31:42:02<199:39:32,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27857/203307 [31:42:02<199:39:33,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27858/203307 [31:42:06<199:39:26,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27858/203307 [31:42:06<199:39:26,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27859/203307 [31:42:11<199:39:25,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27859/203307 [31:42:11<199:39:25,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27860/203307 [31:42:15<199:39:21,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27860/203307 [31:42:15<199:39:21,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27861/203307 [31:42:19<199:39:19,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▎        | 27861/203307 [31:42:19<199:39:19,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27862/203307 [31:42:23<199:39:12,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27862/203307 [31:42:23<199:39:12,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27863/203307 [31:42:27<199:39:09,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27863/203307 [31:42:27<199:39:09,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27864/203307 [31:42:31<199:39:06,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27864/203307 [31:42:31<199:39:06,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27865/203307 [31:42:36<199:39:04,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27865/203307 [31:42:36<199:39:04,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27866/203307 [31:42:39<199:38:57,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27866/203307 [31:42:39<199:38:57,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27867/203307 [31:42:43<199:38:51,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27867/203307 [31:42:43<199:38:51,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27868/203307 [31:42:48<199:38:49,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27868/203307 [31:42:48<199:38:49,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27869/203307 [31:42:52<199:38:46,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27869/203307 [31:42:52<199:38:46,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27870/203307 [31:42:56<199:38:43,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27870/203307 [31:42:56<199:38:43,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27871/203307 [31:43:00<199:38:40,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27871/203307 [31:43:00<199:38:40,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27872/203307 [31:43:05<199:38:37,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27872/203307 [31:43:05<199:38:37,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27873/203307 [31:43:09<199:38:31,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27873/203307 [31:43:09<199:38:31,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27874/203307 [31:43:13<199:38:28,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27874/203307 [31:43:13<199:38:28,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27875/203307 [31:43:17<199:38:22,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27875/203307 [31:43:17<199:38:22,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27876/203307 [31:43:21<199:38:20,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27876/203307 [31:43:21<199:38:20,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27877/203307 [31:43:25<199:38:14,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27877/203307 [31:43:25<199:38:14,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27878/203307 [31:43:29<199:38:11,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27878/203307 [31:43:29<199:38:11,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27879/203307 [31:43:34<199:38:09,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27879/203307 [31:43:34<199:38:09,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27880/203307 [31:43:38<199:38:06,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27880/203307 [31:43:38<199:38:06,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27881/203307 [31:43:42<199:38:03,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▎        | 27881/203307 [31:43:42<199:38:03,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27882/203307 [31:43:46<199:38:00,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27882/203307 [31:43:46<199:38:00,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27883/203307 [31:43:50<199:37:53,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27883/203307 [31:43:50<199:37:53,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27884/203307 [31:43:54<199:37:47,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27884/203307 [31:43:54<199:37:47,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27885/203307 [31:43:58<199:37:45,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27885/203307 [31:43:58<199:37:45,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27886/203307 [31:44:02<199:37:39,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27886/203307 [31:44:02<199:37:39,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27887/203307 [31:44:06<199:37:37,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27887/203307 [31:44:06<199:37:37,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27888/203307 [31:44:11<199:37:34,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27888/203307 [31:44:11<199:37:34,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27889/203307 [31:44:14<199:37:28,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27889/203307 [31:44:14<199:37:28,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27890/203307 [31:44:19<199:37:25,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27890/203307 [31:44:19<199:37:25,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27891/203307 [31:44:23<199:37:23,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27891/203307 [31:44:23<199:37:23,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27892/203307 [31:44:27<199:37:16,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27892/203307 [31:44:27<199:37:16,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27893/203307 [31:44:31<199:37:10,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27893/203307 [31:44:31<199:37:10,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27894/203307 [31:44:35<199:37:08,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27894/203307 [31:44:35<199:37:08,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27895/203307 [31:44:39<199:37:02,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27895/203307 [31:44:39<199:37:02,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27896/203307 [31:44:43<199:37:00,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27896/203307 [31:44:43<199:37:00,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27897/203307 [31:44:47<199:36:53,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27897/203307 [31:44:47<199:36:53,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27898/203307 [31:44:51<199:36:51,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27898/203307 [31:44:51<199:36:51,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27899/203307 [31:44:55<199:36:44,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27899/203307 [31:44:55<199:36:44,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27900/203307 [31:44:59<199:36:41,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27900/203307 [31:44:59<199:36:41,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27901/203307 [31:45:03<199:36:35,  0.24it/s, v_num=t5e6, training/loss=0.0942]Epoch 0:  14%|█▎        | 27901/203307 [31:45:03<199:36:35,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27902/203307 [31:45:07<199:36:33,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27902/203307 [31:45:07<199:36:33,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27903/203307 [31:45:11<199:36:26,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27903/203307 [31:45:11<199:36:26,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27904/203307 [31:45:15<199:36:20,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27904/203307 [31:45:15<199:36:20,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27905/203307 [31:45:19<199:36:19,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27905/203307 [31:45:19<199:36:19,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27906/203307 [31:45:23<199:36:13,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27906/203307 [31:45:23<199:36:13,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27907/203307 [31:45:28<199:36:11,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27907/203307 [31:45:28<199:36:11,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27908/203307 [31:45:32<199:36:08,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27908/203307 [31:45:32<199:36:08,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27909/203307 [31:45:36<199:36:01,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27909/203307 [31:45:36<199:36:01,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27910/203307 [31:45:39<199:35:55,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27910/203307 [31:45:39<199:35:55,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27911/203307 [31:45:44<199:35:54,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27911/203307 [31:45:44<199:35:54,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27912/203307 [31:45:48<199:35:48,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27912/203307 [31:45:48<199:35:48,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27913/203307 [31:45:52<199:35:46,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27913/203307 [31:45:52<199:35:46,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27914/203307 [31:45:57<199:35:43,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27914/203307 [31:45:57<199:35:43,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27915/203307 [31:46:00<199:35:36,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27915/203307 [31:46:00<199:35:36,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27916/203307 [31:46:05<199:35:34,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27916/203307 [31:46:05<199:35:34,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27917/203307 [31:46:09<199:35:31,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27917/203307 [31:46:09<199:35:31,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27918/203307 [31:46:13<199:35:25,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27918/203307 [31:46:13<199:35:25,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27919/203307 [31:46:16<199:35:19,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27919/203307 [31:46:16<199:35:19,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27920/203307 [31:46:21<199:35:17,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27920/203307 [31:46:21<199:35:17,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27921/203307 [31:46:25<199:35:14,  0.24it/s, v_num=t5e6, training/loss=0.0816]Epoch 0:  14%|█▎        | 27921/203307 [31:46:25<199:35:14,  0.24it/s, v_num=t5e6, training/loss=0.093] Epoch 0:  14%|█▎        | 27922/203307 [31:46:30<199:35:12,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27922/203307 [31:46:30<199:35:12,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27923/203307 [31:46:34<199:35:09,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27923/203307 [31:46:34<199:35:09,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27924/203307 [31:46:38<199:35:07,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27924/203307 [31:46:38<199:35:07,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27925/203307 [31:46:42<199:35:01,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27925/203307 [31:46:42<199:35:01,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27926/203307 [31:46:46<199:34:58,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27926/203307 [31:46:46<199:34:58,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27927/203307 [31:46:50<199:34:51,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27927/203307 [31:46:50<199:34:51,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27928/203307 [31:46:54<199:34:49,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27928/203307 [31:46:54<199:34:49,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27929/203307 [31:46:58<199:34:43,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27929/203307 [31:46:58<199:34:43,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27930/203307 [31:47:02<199:34:40,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27930/203307 [31:47:02<199:34:40,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27931/203307 [31:47:07<199:34:38,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27931/203307 [31:47:07<199:34:38,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27932/203307 [31:47:11<199:34:35,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27932/203307 [31:47:11<199:34:35,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27933/203307 [31:47:15<199:34:32,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27933/203307 [31:47:15<199:34:32,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27934/203307 [31:47:20<199:34:29,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27934/203307 [31:47:20<199:34:29,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27935/203307 [31:47:23<199:34:23,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27935/203307 [31:47:23<199:34:23,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27936/203307 [31:47:27<199:34:16,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27936/203307 [31:47:27<199:34:16,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27937/203307 [31:47:32<199:34:15,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27937/203307 [31:47:32<199:34:15,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27938/203307 [31:47:36<199:34:12,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27938/203307 [31:47:36<199:34:12,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27939/203307 [31:47:40<199:34:10,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27939/203307 [31:47:40<199:34:10,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27940/203307 [31:47:44<199:34:04,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27940/203307 [31:47:44<199:34:04,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27941/203307 [31:47:48<199:34:01,  0.24it/s, v_num=t5e6, training/loss=0.093]Epoch 0:  14%|█▎        | 27941/203307 [31:47:48<199:34:01,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▎        | 27942/203307 [31:47:53<199:33:59,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▎        | 27942/203307 [31:47:53<199:33:59,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▎        | 27943/203307 [31:47:57<199:33:56,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▎        | 27943/203307 [31:47:57<199:33:56,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▎        | 27944/203307 [31:48:01<199:33:50,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▎        | 27944/203307 [31:48:01<199:33:50,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▎        | 27945/203307 [31:48:05<199:33:43,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▎        | 27945/203307 [31:48:05<199:33:43,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▎        | 27946/203307 [31:48:09<199:33:41,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▎        | 27946/203307 [31:48:09<199:33:41,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▎        | 27947/203307 [31:48:13<199:33:35,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▎        | 27947/203307 [31:48:13<199:33:35,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▎        | 27948/203307 [31:48:17<199:33:34,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▎        | 27948/203307 [31:48:17<199:33:34,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▎        | 27949/203307 [31:48:21<199:33:28,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▎        | 27949/203307 [31:48:21<199:33:28,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▎        | 27950/203307 [31:48:26<199:33:25,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▎        | 27950/203307 [31:48:26<199:33:25,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▎        | 27951/203307 [31:48:29<199:33:19,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▎        | 27951/203307 [31:48:29<199:33:19,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▎        | 27952/203307 [31:48:34<199:33:17,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▎        | 27952/203307 [31:48:34<199:33:17,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▎        | 27953/203307 [31:48:37<199:33:11,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▎        | 27953/203307 [31:48:38<199:33:11,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▎        | 27954/203307 [31:48:42<199:33:09,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▎        | 27954/203307 [31:48:42<199:33:09,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 27955/203307 [31:48:46<199:33:07,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 27955/203307 [31:48:46<199:33:07,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 27956/203307 [31:48:50<199:33:00,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 27956/203307 [31:48:50<199:33:00,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 27957/203307 [31:48:54<199:32:58,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 27957/203307 [31:48:54<199:32:58,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 27958/203307 [31:48:58<199:32:51,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 27958/203307 [31:48:58<199:32:51,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 27959/203307 [31:49:03<199:32:49,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 27959/203307 [31:49:03<199:32:49,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 27960/203307 [31:49:07<199:32:46,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 27960/203307 [31:49:07<199:32:46,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 27961/203307 [31:49:11<199:32:40,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 27961/203307 [31:49:11<199:32:40,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27962/203307 [31:49:14<199:32:34,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27962/203307 [31:49:14<199:32:34,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27963/203307 [31:49:19<199:32:32,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27963/203307 [31:49:19<199:32:32,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27964/203307 [31:49:23<199:32:26,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27964/203307 [31:49:23<199:32:26,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27965/203307 [31:49:27<199:32:25,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27965/203307 [31:49:27<199:32:25,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27966/203307 [31:49:31<199:32:19,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27966/203307 [31:49:31<199:32:19,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27967/203307 [31:49:35<199:32:12,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27967/203307 [31:49:35<199:32:12,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27968/203307 [31:49:39<199:32:10,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27968/203307 [31:49:39<199:32:10,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27969/203307 [31:49:43<199:32:08,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27969/203307 [31:49:43<199:32:08,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27970/203307 [31:49:47<199:32:01,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27970/203307 [31:49:47<199:32:01,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27971/203307 [31:49:52<199:31:59,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27971/203307 [31:49:52<199:31:59,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27972/203307 [31:49:56<199:31:57,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27972/203307 [31:49:56<199:31:57,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27973/203307 [31:50:00<199:31:50,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27973/203307 [31:50:00<199:31:50,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27974/203307 [31:50:04<199:31:48,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27974/203307 [31:50:04<199:31:48,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27975/203307 [31:50:08<199:31:42,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27975/203307 [31:50:08<199:31:42,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27976/203307 [31:50:12<199:31:39,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27976/203307 [31:50:12<199:31:39,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27977/203307 [31:50:16<199:31:36,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27977/203307 [31:50:16<199:31:36,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27978/203307 [31:50:21<199:31:34,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27978/203307 [31:50:21<199:31:34,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27979/203307 [31:50:24<199:31:27,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27979/203307 [31:50:24<199:31:27,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27980/203307 [31:50:29<199:31:25,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27980/203307 [31:50:29<199:31:25,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27981/203307 [31:50:33<199:31:19,  0.24it/s, v_num=t5e6, training/loss=0.0887]Epoch 0:  14%|█▍        | 27981/203307 [31:50:33<199:31:19,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27982/203307 [31:50:36<199:31:13,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27982/203307 [31:50:36<199:31:13,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27983/203307 [31:50:41<199:31:12,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27983/203307 [31:50:41<199:31:12,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27984/203307 [31:50:45<199:31:05,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27984/203307 [31:50:45<199:31:05,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27985/203307 [31:50:49<199:31:03,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27985/203307 [31:50:49<199:31:03,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27986/203307 [31:50:53<199:31:00,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27986/203307 [31:50:53<199:31:00,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27987/203307 [31:50:57<199:30:55,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27987/203307 [31:50:57<199:30:55,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27988/203307 [31:51:02<199:30:52,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27988/203307 [31:51:02<199:30:52,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27989/203307 [31:51:06<199:30:50,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27989/203307 [31:51:06<199:30:50,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27990/203307 [31:51:10<199:30:43,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27990/203307 [31:51:10<199:30:43,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27991/203307 [31:51:14<199:30:41,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27991/203307 [31:51:14<199:30:41,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27992/203307 [31:51:18<199:30:35,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27992/203307 [31:51:18<199:30:35,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27993/203307 [31:51:22<199:30:28,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27993/203307 [31:51:22<199:30:28,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27994/203307 [31:51:26<199:30:27,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27994/203307 [31:51:26<199:30:27,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27995/203307 [31:51:30<199:30:24,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27995/203307 [31:51:30<199:30:24,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27996/203307 [31:51:35<199:30:21,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27996/203307 [31:51:35<199:30:21,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27997/203307 [31:51:38<199:30:14,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27997/203307 [31:51:38<199:30:14,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27998/203307 [31:51:43<199:30:13,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27998/203307 [31:51:43<199:30:13,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27999/203307 [31:51:47<199:30:06,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 27999/203307 [31:51:47<199:30:06,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 28000/203307 [31:51:51<199:30:05,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 28000/203307 [31:51:51<199:30:05,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 28001/203307 [31:51:55<199:29:59,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  14%|█▍        | 28001/203307 [31:51:55<199:29:59,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28002/203307 [31:51:59<199:29:56,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28002/203307 [31:51:59<199:29:56,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28003/203307 [31:52:03<199:29:50,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28003/203307 [31:52:03<199:29:50,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28004/203307 [31:52:07<199:29:47,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28004/203307 [31:52:07<199:29:47,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28005/203307 [31:52:12<199:29:44,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28005/203307 [31:52:12<199:29:44,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28006/203307 [31:52:16<199:29:42,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28006/203307 [31:52:16<199:29:42,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28007/203307 [31:52:20<199:29:36,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28007/203307 [31:52:20<199:29:36,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28008/203307 [31:52:23<199:29:29,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28008/203307 [31:52:23<199:29:29,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28009/203307 [31:52:28<199:29:27,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28009/203307 [31:52:28<199:29:27,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28010/203307 [31:52:31<199:29:19,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28010/203307 [31:52:31<199:29:20,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28011/203307 [31:52:36<199:29:16,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28011/203307 [31:52:36<199:29:16,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28012/203307 [31:52:40<199:29:13,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28012/203307 [31:52:40<199:29:13,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28013/203307 [31:52:44<199:29:09,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28013/203307 [31:52:44<199:29:09,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28014/203307 [31:52:48<199:29:02,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28014/203307 [31:52:48<199:29:02,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28015/203307 [31:52:52<199:29:00,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28015/203307 [31:52:52<199:29:00,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28016/203307 [31:52:56<199:28:53,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28016/203307 [31:52:56<199:28:53,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28017/203307 [31:53:00<199:28:51,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28017/203307 [31:53:00<199:28:51,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28018/203307 [31:53:04<199:28:44,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28018/203307 [31:53:04<199:28:44,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28019/203307 [31:53:07<199:28:36,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28019/203307 [31:53:07<199:28:37,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28020/203307 [31:53:12<199:28:34,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28020/203307 [31:53:12<199:28:34,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28021/203307 [31:53:16<199:28:31,  0.24it/s, v_num=t5e6, training/loss=0.0815]Epoch 0:  14%|█▍        | 28021/203307 [31:53:16<199:28:31,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28022/203307 [31:53:20<199:28:28,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28022/203307 [31:53:20<199:28:28,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28023/203307 [31:53:24<199:28:22,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28023/203307 [31:53:24<199:28:22,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28024/203307 [31:53:28<199:28:20,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28024/203307 [31:53:28<199:28:20,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28025/203307 [31:53:32<199:28:13,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28025/203307 [31:53:32<199:28:13,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28026/203307 [31:53:37<199:28:12,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28026/203307 [31:53:37<199:28:12,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28027/203307 [31:53:40<199:28:05,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28027/203307 [31:53:40<199:28:05,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28028/203307 [31:53:45<199:28:02,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28028/203307 [31:53:45<199:28:02,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28029/203307 [31:53:48<199:27:56,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28029/203307 [31:53:48<199:27:56,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28030/203307 [31:53:53<199:27:53,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28030/203307 [31:53:53<199:27:53,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28031/203307 [31:53:57<199:27:50,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28031/203307 [31:53:57<199:27:50,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28032/203307 [31:54:01<199:27:47,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28032/203307 [31:54:01<199:27:47,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28033/203307 [31:54:05<199:27:41,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28033/203307 [31:54:05<199:27:41,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28034/203307 [31:54:09<199:27:35,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28034/203307 [31:54:09<199:27:35,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28035/203307 [31:54:13<199:27:33,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28035/203307 [31:54:13<199:27:33,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28036/203307 [31:54:17<199:27:27,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28036/203307 [31:54:17<199:27:27,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28037/203307 [31:54:21<199:27:25,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28037/203307 [31:54:21<199:27:25,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28038/203307 [31:54:26<199:27:22,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28038/203307 [31:54:26<199:27:22,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28039/203307 [31:54:29<199:27:16,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28039/203307 [31:54:29<199:27:16,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28040/203307 [31:54:34<199:27:13,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28040/203307 [31:54:34<199:27:13,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28041/203307 [31:54:38<199:27:11,  0.24it/s, v_num=t5e6, training/loss=0.0916]Epoch 0:  14%|█▍        | 28041/203307 [31:54:38<199:27:11,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28042/203307 [31:54:42<199:27:04,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28042/203307 [31:54:42<199:27:04,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28043/203307 [31:54:46<199:27:02,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28043/203307 [31:54:46<199:27:02,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28044/203307 [31:54:50<199:26:55,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28044/203307 [31:54:50<199:26:55,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28045/203307 [31:54:54<199:26:49,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28045/203307 [31:54:54<199:26:49,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28046/203307 [31:54:58<199:26:46,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28046/203307 [31:54:58<199:26:46,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28047/203307 [31:55:02<199:26:44,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28047/203307 [31:55:02<199:26:44,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28048/203307 [31:55:06<199:26:37,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28048/203307 [31:55:06<199:26:37,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28049/203307 [31:55:10<199:26:34,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28049/203307 [31:55:10<199:26:34,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28050/203307 [31:55:15<199:26:32,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28050/203307 [31:55:15<199:26:32,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28051/203307 [31:55:18<199:26:26,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28051/203307 [31:55:18<199:26:26,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28052/203307 [31:55:23<199:26:23,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28052/203307 [31:55:23<199:26:23,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28053/203307 [31:55:26<199:26:17,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28053/203307 [31:55:26<199:26:17,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28054/203307 [31:55:31<199:26:14,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28054/203307 [31:55:31<199:26:14,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28055/203307 [31:55:35<199:26:11,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28055/203307 [31:55:35<199:26:11,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28056/203307 [31:55:39<199:26:08,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28056/203307 [31:55:39<199:26:08,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28057/203307 [31:55:43<199:26:01,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28057/203307 [31:55:43<199:26:01,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28058/203307 [31:55:47<199:25:59,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28058/203307 [31:55:47<199:25:59,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28059/203307 [31:55:51<199:25:52,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28059/203307 [31:55:51<199:25:52,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28060/203307 [31:55:55<199:25:45,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28060/203307 [31:55:55<199:25:45,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28061/203307 [31:55:59<199:25:43,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28061/203307 [31:55:59<199:25:43,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28062/203307 [31:56:03<199:25:36,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28062/203307 [31:56:03<199:25:36,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28063/203307 [31:56:07<199:25:34,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28063/203307 [31:56:07<199:25:34,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28064/203307 [31:56:11<199:25:31,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28064/203307 [31:56:11<199:25:31,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28065/203307 [31:56:15<199:25:24,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28065/203307 [31:56:15<199:25:24,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28066/203307 [31:56:19<199:25:18,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28066/203307 [31:56:19<199:25:18,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28067/203307 [31:56:23<199:25:16,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28067/203307 [31:56:23<199:25:16,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28068/203307 [31:56:27<199:25:09,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28068/203307 [31:56:27<199:25:09,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28069/203307 [31:56:31<199:25:07,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28069/203307 [31:56:31<199:25:07,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28070/203307 [31:56:35<199:25:01,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28070/203307 [31:56:35<199:25:01,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28071/203307 [31:56:39<199:24:58,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28071/203307 [31:56:39<199:24:58,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28072/203307 [31:56:44<199:24:55,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28072/203307 [31:56:44<199:24:55,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28073/203307 [31:56:48<199:24:53,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28073/203307 [31:56:48<199:24:53,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28074/203307 [31:56:52<199:24:46,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28074/203307 [31:56:52<199:24:46,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28075/203307 [31:56:56<199:24:40,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28075/203307 [31:56:56<199:24:40,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28076/203307 [31:57:00<199:24:38,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28076/203307 [31:57:00<199:24:38,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28077/203307 [31:57:04<199:24:31,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28077/203307 [31:57:04<199:24:31,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28078/203307 [31:57:08<199:24:29,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28078/203307 [31:57:08<199:24:29,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28079/203307 [31:57:12<199:24:23,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28079/203307 [31:57:12<199:24:23,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28080/203307 [31:57:16<199:24:20,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28080/203307 [31:57:16<199:24:20,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28081/203307 [31:57:20<199:24:14,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28081/203307 [31:57:20<199:24:14,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28082/203307 [31:57:24<199:24:11,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28082/203307 [31:57:24<199:24:11,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28083/203307 [31:57:28<199:24:05,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28083/203307 [31:57:28<199:24:05,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28084/203307 [31:57:32<199:24:03,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28084/203307 [31:57:32<199:24:03,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28085/203307 [31:57:37<199:23:59,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28085/203307 [31:57:37<199:23:59,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28086/203307 [31:57:40<199:23:53,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28086/203307 [31:57:40<199:23:53,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28087/203307 [31:57:45<199:23:51,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28087/203307 [31:57:45<199:23:51,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28088/203307 [31:57:49<199:23:47,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28088/203307 [31:57:49<199:23:47,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28089/203307 [31:57:53<199:23:44,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28089/203307 [31:57:53<199:23:44,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28090/203307 [31:57:57<199:23:41,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28090/203307 [31:57:57<199:23:41,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28091/203307 [31:58:01<199:23:35,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28091/203307 [31:58:01<199:23:35,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28092/203307 [31:58:05<199:23:28,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28092/203307 [31:58:05<199:23:28,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28093/203307 [31:58:09<199:23:26,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28093/203307 [31:58:09<199:23:26,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28094/203307 [31:58:14<199:23:23,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28094/203307 [31:58:14<199:23:23,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28095/203307 [31:58:18<199:23:20,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28095/203307 [31:58:18<199:23:20,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28096/203307 [31:58:22<199:23:17,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28096/203307 [31:58:22<199:23:17,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28097/203307 [31:58:26<199:23:11,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28097/203307 [31:58:26<199:23:11,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28098/203307 [31:58:30<199:23:09,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28098/203307 [31:58:30<199:23:09,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28099/203307 [31:58:35<199:23:06,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28099/203307 [31:58:35<199:23:06,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28100/203307 [31:58:38<199:23:00,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28100/203307 [31:58:38<199:23:00,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28101/203307 [31:58:42<199:22:53,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28101/203307 [31:58:42<199:22:53,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28102/203307 [31:58:46<199:22:51,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28102/203307 [31:58:46<199:22:51,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28103/203307 [31:58:51<199:22:47,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28103/203307 [31:58:51<199:22:47,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28104/203307 [31:58:55<199:22:46,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28104/203307 [31:58:55<199:22:46,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28105/203307 [31:58:59<199:22:43,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28105/203307 [31:58:59<199:22:43,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28106/203307 [31:59:04<199:22:39,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28106/203307 [31:59:04<199:22:39,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28107/203307 [31:59:07<199:22:33,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28107/203307 [31:59:07<199:22:33,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28108/203307 [31:59:12<199:22:31,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28108/203307 [31:59:12<199:22:31,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28109/203307 [31:59:16<199:22:25,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28109/203307 [31:59:16<199:22:25,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28110/203307 [31:59:20<199:22:23,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28110/203307 [31:59:20<199:22:23,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28111/203307 [31:59:24<199:22:17,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28111/203307 [31:59:24<199:22:17,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28112/203307 [31:59:28<199:22:14,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28112/203307 [31:59:28<199:22:14,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28113/203307 [31:59:32<199:22:12,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28113/203307 [31:59:32<199:22:12,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28114/203307 [31:59:36<199:22:06,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28114/203307 [31:59:36<199:22:06,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28115/203307 [31:59:41<199:22:03,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28115/203307 [31:59:41<199:22:03,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28116/203307 [31:59:45<199:22:01,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28116/203307 [31:59:45<199:22:01,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28117/203307 [31:59:49<199:21:55,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28117/203307 [31:59:49<199:21:55,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28118/203307 [31:59:52<199:21:48,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28118/203307 [31:59:52<199:21:48,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28119/203307 [31:59:57<199:21:47,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28119/203307 [31:59:57<199:21:47,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28120/203307 [32:00:01<199:21:40,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28120/203307 [32:00:01<199:21:40,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28121/203307 [32:00:05<199:21:39,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28121/203307 [32:00:05<199:21:39,  0.24it/s, v_num=t5e6, training/loss=0.084] Epoch 0:  14%|█▍        | 28122/203307 [32:00:09<199:21:32,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28122/203307 [32:00:09<199:21:32,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28123/203307 [32:00:13<199:21:26,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28123/203307 [32:00:13<199:21:26,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28124/203307 [32:00:17<199:21:24,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28124/203307 [32:00:17<199:21:24,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28125/203307 [32:00:21<199:21:22,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28125/203307 [32:00:21<199:21:22,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28126/203307 [32:00:25<199:21:15,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28126/203307 [32:00:25<199:21:15,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28127/203307 [32:00:29<199:21:09,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28127/203307 [32:00:29<199:21:09,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28128/203307 [32:00:34<199:21:08,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28128/203307 [32:00:34<199:21:08,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28129/203307 [32:00:37<199:21:02,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28129/203307 [32:00:37<199:21:02,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28130/203307 [32:00:42<199:21:01,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28130/203307 [32:00:42<199:21:01,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28131/203307 [32:00:46<199:20:55,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28131/203307 [32:00:46<199:20:55,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28132/203307 [32:00:50<199:20:52,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28132/203307 [32:00:50<199:20:52,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28133/203307 [32:00:54<199:20:45,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28133/203307 [32:00:54<199:20:46,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28134/203307 [32:00:58<199:20:43,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28134/203307 [32:00:58<199:20:43,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28135/203307 [32:01:02<199:20:37,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28135/203307 [32:01:02<199:20:37,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28136/203307 [32:01:06<199:20:36,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28136/203307 [32:01:06<199:20:36,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28137/203307 [32:01:10<199:20:30,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28137/203307 [32:01:10<199:20:30,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28138/203307 [32:01:14<199:20:27,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28138/203307 [32:01:14<199:20:27,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28139/203307 [32:01:19<199:20:25,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28139/203307 [32:01:19<199:20:25,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28140/203307 [32:01:23<199:20:19,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28140/203307 [32:01:23<199:20:19,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28141/203307 [32:01:27<199:20:17,  0.24it/s, v_num=t5e6, training/loss=0.084]Epoch 0:  14%|█▍        | 28141/203307 [32:01:27<199:20:17,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28142/203307 [32:01:31<199:20:13,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28142/203307 [32:01:31<199:20:13,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28143/203307 [32:01:35<199:20:07,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28143/203307 [32:01:35<199:20:07,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28144/203307 [32:01:39<199:20:01,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28144/203307 [32:01:39<199:20:01,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28145/203307 [32:01:43<199:19:59,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28145/203307 [32:01:43<199:19:59,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28146/203307 [32:01:48<199:19:56,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28146/203307 [32:01:48<199:19:56,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28147/203307 [32:01:52<199:19:54,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28147/203307 [32:01:52<199:19:54,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28148/203307 [32:01:56<199:19:50,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28148/203307 [32:01:56<199:19:50,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28149/203307 [32:02:00<199:19:43,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28149/203307 [32:02:00<199:19:43,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28150/203307 [32:02:04<199:19:41,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28150/203307 [32:02:04<199:19:41,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28151/203307 [32:02:09<199:19:39,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28151/203307 [32:02:09<199:19:39,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28152/203307 [32:02:12<199:19:33,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28152/203307 [32:02:12<199:19:33,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28153/203307 [32:02:16<199:19:25,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28153/203307 [32:02:16<199:19:26,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28154/203307 [32:02:20<199:19:24,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28154/203307 [32:02:20<199:19:24,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28155/203307 [32:02:25<199:19:21,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28155/203307 [32:02:25<199:19:21,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28156/203307 [32:02:29<199:19:20,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28156/203307 [32:02:29<199:19:20,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28157/203307 [32:02:33<199:19:16,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28157/203307 [32:02:33<199:19:16,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28158/203307 [32:02:38<199:19:13,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28158/203307 [32:02:38<199:19:13,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28159/203307 [32:02:41<199:19:07,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28159/203307 [32:02:41<199:19:07,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28160/203307 [32:02:46<199:19:05,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28160/203307 [32:02:46<199:19:05,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28161/203307 [32:02:50<199:18:58,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28161/203307 [32:02:50<199:18:58,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28162/203307 [32:02:54<199:18:56,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28162/203307 [32:02:54<199:18:56,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28163/203307 [32:02:58<199:18:53,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28163/203307 [32:02:58<199:18:53,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28164/203307 [32:03:02<199:18:46,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28164/203307 [32:03:02<199:18:46,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28165/203307 [32:03:06<199:18:44,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28165/203307 [32:03:06<199:18:44,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28166/203307 [32:03:10<199:18:40,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28166/203307 [32:03:10<199:18:40,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28167/203307 [32:03:15<199:18:37,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28167/203307 [32:03:15<199:18:37,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28168/203307 [32:03:19<199:18:34,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28168/203307 [32:03:19<199:18:34,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28169/203307 [32:03:23<199:18:27,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28169/203307 [32:03:23<199:18:27,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28170/203307 [32:03:26<199:18:21,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28170/203307 [32:03:26<199:18:21,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28171/203307 [32:03:31<199:18:19,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28171/203307 [32:03:31<199:18:19,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28172/203307 [32:03:35<199:18:12,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28172/203307 [32:03:35<199:18:12,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28173/203307 [32:03:39<199:18:10,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28173/203307 [32:03:39<199:18:10,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28174/203307 [32:03:43<199:18:03,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28174/203307 [32:03:43<199:18:03,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28175/203307 [32:03:47<199:17:59,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28175/203307 [32:03:47<199:17:59,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28176/203307 [32:03:51<199:17:56,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28176/203307 [32:03:51<199:17:56,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28177/203307 [32:03:55<199:17:53,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28177/203307 [32:03:55<199:17:53,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28178/203307 [32:03:59<199:17:46,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28178/203307 [32:03:59<199:17:46,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28179/203307 [32:04:02<199:17:39,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28179/203307 [32:04:02<199:17:39,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28180/203307 [32:04:07<199:17:37,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28180/203307 [32:04:07<199:17:37,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28181/203307 [32:04:11<199:17:30,  0.24it/s, v_num=t5e6, training/loss=0.0847]Epoch 0:  14%|█▍        | 28181/203307 [32:04:11<199:17:30,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28182/203307 [32:04:15<199:17:28,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28182/203307 [32:04:15<199:17:28,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28183/203307 [32:04:19<199:17:21,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28183/203307 [32:04:19<199:17:21,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28184/203307 [32:04:23<199:17:19,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28184/203307 [32:04:23<199:17:19,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28185/203307 [32:04:27<199:17:13,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28185/203307 [32:04:27<199:17:13,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28186/203307 [32:04:31<199:17:11,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28186/203307 [32:04:31<199:17:11,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28187/203307 [32:04:35<199:17:04,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28187/203307 [32:04:35<199:17:04,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28188/203307 [32:04:39<199:17:02,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28188/203307 [32:04:39<199:17:02,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28189/203307 [32:04:43<199:16:56,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28189/203307 [32:04:43<199:16:56,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28190/203307 [32:04:47<199:16:50,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28190/203307 [32:04:47<199:16:50,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28191/203307 [32:04:51<199:16:48,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28191/203307 [32:04:51<199:16:48,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28192/203307 [32:04:55<199:16:41,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28192/203307 [32:04:55<199:16:41,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28193/203307 [32:04:59<199:16:38,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28193/203307 [32:04:59<199:16:38,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28194/203307 [32:05:04<199:16:36,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28194/203307 [32:05:04<199:16:36,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28195/203307 [32:05:07<199:16:30,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28195/203307 [32:05:07<199:16:30,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28196/203307 [32:05:12<199:16:26,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28196/203307 [32:05:12<199:16:26,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28197/203307 [32:05:16<199:16:25,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28197/203307 [32:05:16<199:16:25,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28198/203307 [32:05:20<199:16:18,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28198/203307 [32:05:20<199:16:18,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28199/203307 [32:05:24<199:16:16,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28199/203307 [32:05:24<199:16:16,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28200/203307 [32:05:28<199:16:11,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28200/203307 [32:05:28<199:16:11,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28201/203307 [32:05:32<199:16:04,  0.24it/s, v_num=t5e6, training/loss=0.0781]Epoch 0:  14%|█▍        | 28201/203307 [32:05:32<199:16:04,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28202/203307 [32:05:36<199:16:03,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28202/203307 [32:05:36<199:16:03,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28203/203307 [32:05:41<199:16:00,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28203/203307 [32:05:41<199:16:00,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28204/203307 [32:05:44<199:15:54,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28204/203307 [32:05:44<199:15:54,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28205/203307 [32:05:49<199:15:51,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28205/203307 [32:05:49<199:15:51,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28206/203307 [32:05:53<199:15:50,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28206/203307 [32:05:53<199:15:50,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28207/203307 [32:05:57<199:15:44,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28207/203307 [32:05:57<199:15:44,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28208/203307 [32:06:02<199:15:42,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28208/203307 [32:06:02<199:15:42,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28209/203307 [32:06:05<199:15:36,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28209/203307 [32:06:05<199:15:36,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28210/203307 [32:06:10<199:15:33,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28210/203307 [32:06:10<199:15:33,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28211/203307 [32:06:14<199:15:30,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28211/203307 [32:06:14<199:15:30,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28212/203307 [32:06:18<199:15:27,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28212/203307 [32:06:18<199:15:28,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28213/203307 [32:06:22<199:15:24,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28213/203307 [32:06:22<199:15:24,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28214/203307 [32:06:27<199:15:22,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28214/203307 [32:06:27<199:15:22,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28215/203307 [32:06:31<199:15:16,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28215/203307 [32:06:31<199:15:16,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28216/203307 [32:06:34<199:15:10,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28216/203307 [32:06:34<199:15:10,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28217/203307 [32:06:39<199:15:08,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28217/203307 [32:06:39<199:15:08,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28218/203307 [32:06:43<199:15:01,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28218/203307 [32:06:43<199:15:01,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28219/203307 [32:06:48<199:15:03,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28219/203307 [32:06:48<199:15:03,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28220/203307 [32:06:52<199:14:58,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28220/203307 [32:06:52<199:14:58,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28221/203307 [32:06:56<199:14:55,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 28221/203307 [32:06:56<199:14:55,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28222/203307 [32:06:59<199:14:48,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28222/203307 [32:07:00<199:14:48,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28223/203307 [32:07:04<199:14:46,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28223/203307 [32:07:04<199:14:46,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28224/203307 [32:07:08<199:14:40,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28224/203307 [32:07:08<199:14:40,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28225/203307 [32:07:12<199:14:37,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28225/203307 [32:07:12<199:14:37,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28226/203307 [32:07:16<199:14:31,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28226/203307 [32:07:16<199:14:31,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28227/203307 [32:07:19<199:14:24,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28227/203307 [32:07:19<199:14:24,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28228/203307 [32:07:24<199:14:22,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28228/203307 [32:07:24<199:14:22,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28229/203307 [32:07:28<199:14:19,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28229/203307 [32:07:28<199:14:19,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28230/203307 [32:07:32<199:14:16,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28230/203307 [32:07:32<199:14:16,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28231/203307 [32:07:36<199:14:10,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28231/203307 [32:07:36<199:14:10,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28232/203307 [32:07:41<199:14:08,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28232/203307 [32:07:41<199:14:08,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28233/203307 [32:07:44<199:14:01,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28233/203307 [32:07:44<199:14:01,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28234/203307 [32:07:49<199:13:59,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28234/203307 [32:07:49<199:13:59,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28235/203307 [32:07:52<199:13:52,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28235/203307 [32:07:52<199:13:52,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28236/203307 [32:07:57<199:13:50,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28236/203307 [32:07:57<199:13:50,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28237/203307 [32:08:01<199:13:46,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28237/203307 [32:08:01<199:13:46,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28238/203307 [32:08:05<199:13:44,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28238/203307 [32:08:05<199:13:44,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28239/203307 [32:08:09<199:13:37,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28239/203307 [32:08:09<199:13:37,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28240/203307 [32:08:13<199:13:35,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28240/203307 [32:08:13<199:13:35,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28241/203307 [32:08:17<199:13:29,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28241/203307 [32:08:17<199:13:29,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28242/203307 [32:08:21<199:13:22,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28242/203307 [32:08:21<199:13:23,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28243/203307 [32:08:25<199:13:20,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28243/203307 [32:08:25<199:13:20,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28244/203307 [32:08:29<199:13:14,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28244/203307 [32:08:29<199:13:14,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28245/203307 [32:08:33<199:13:12,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28245/203307 [32:08:33<199:13:12,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28246/203307 [32:08:38<199:13:09,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28246/203307 [32:08:38<199:13:09,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28247/203307 [32:08:42<199:13:05,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28247/203307 [32:08:42<199:13:05,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28248/203307 [32:08:46<199:12:59,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28248/203307 [32:08:46<199:12:59,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28249/203307 [32:08:50<199:12:57,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28249/203307 [32:08:50<199:12:57,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28250/203307 [32:08:54<199:12:50,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28250/203307 [32:08:54<199:12:50,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28251/203307 [32:08:58<199:12:48,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28251/203307 [32:08:58<199:12:48,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28252/203307 [32:09:02<199:12:42,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28252/203307 [32:09:02<199:12:42,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28253/203307 [32:09:05<199:12:35,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28253/203307 [32:09:05<199:12:35,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28254/203307 [32:09:10<199:12:33,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28254/203307 [32:09:10<199:12:33,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28255/203307 [32:09:14<199:12:30,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28255/203307 [32:09:14<199:12:30,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28256/203307 [32:09:18<199:12:24,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28256/203307 [32:09:18<199:12:24,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28257/203307 [32:09:22<199:12:18,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28257/203307 [32:09:22<199:12:18,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28258/203307 [32:09:26<199:12:16,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28258/203307 [32:09:26<199:12:16,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28259/203307 [32:09:30<199:12:10,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28259/203307 [32:09:30<199:12:10,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28260/203307 [32:09:34<199:12:08,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28260/203307 [32:09:34<199:12:08,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28261/203307 [32:09:38<199:12:02,  0.24it/s, v_num=t5e6, training/loss=0.0822]Epoch 0:  14%|█▍        | 28261/203307 [32:09:38<199:12:02,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28262/203307 [32:09:42<199:11:59,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28262/203307 [32:09:42<199:11:59,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28263/203307 [32:09:47<199:11:56,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28263/203307 [32:09:47<199:11:56,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28264/203307 [32:09:51<199:11:53,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28264/203307 [32:09:51<199:11:53,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28265/203307 [32:09:55<199:11:47,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28265/203307 [32:09:55<199:11:47,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28266/203307 [32:09:59<199:11:44,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28266/203307 [32:09:59<199:11:44,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28267/203307 [32:10:03<199:11:38,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28267/203307 [32:10:03<199:11:38,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28268/203307 [32:10:07<199:11:32,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28268/203307 [32:10:07<199:11:32,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28269/203307 [32:10:11<199:11:30,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28269/203307 [32:10:11<199:11:30,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28270/203307 [32:10:15<199:11:23,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28270/203307 [32:10:15<199:11:24,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28271/203307 [32:10:19<199:11:21,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28271/203307 [32:10:19<199:11:21,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28272/203307 [32:10:24<199:11:19,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28272/203307 [32:10:24<199:11:19,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28273/203307 [32:10:27<199:11:13,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28273/203307 [32:10:27<199:11:13,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28274/203307 [32:10:32<199:11:10,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28274/203307 [32:10:32<199:11:10,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28275/203307 [32:10:36<199:11:09,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28275/203307 [32:10:36<199:11:09,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28276/203307 [32:10:40<199:11:02,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28276/203307 [32:10:40<199:11:02,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28277/203307 [32:10:44<199:11:00,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28277/203307 [32:10:44<199:11:00,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28278/203307 [32:10:48<199:10:54,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28278/203307 [32:10:48<199:10:54,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28279/203307 [32:10:52<199:10:48,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28279/203307 [32:10:52<199:10:48,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28280/203307 [32:10:56<199:10:46,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28280/203307 [32:10:56<199:10:46,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28281/203307 [32:11:01<199:10:43,  0.24it/s, v_num=t5e6, training/loss=0.0854]Epoch 0:  14%|█▍        | 28281/203307 [32:11:01<199:10:43,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28282/203307 [32:11:04<199:10:37,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28282/203307 [32:11:04<199:10:37,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28283/203307 [32:11:09<199:10:34,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28283/203307 [32:11:09<199:10:34,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28284/203307 [32:11:13<199:10:32,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28284/203307 [32:11:13<199:10:32,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28285/203307 [32:11:17<199:10:26,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28285/203307 [32:11:17<199:10:26,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28286/203307 [32:11:21<199:10:24,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28286/203307 [32:11:21<199:10:24,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28287/203307 [32:11:25<199:10:18,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28287/203307 [32:11:25<199:10:18,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28288/203307 [32:11:29<199:10:15,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28288/203307 [32:11:29<199:10:15,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28289/203307 [32:11:33<199:10:09,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28289/203307 [32:11:33<199:10:09,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28290/203307 [32:11:38<199:10:06,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28290/203307 [32:11:38<199:10:06,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28291/203307 [32:11:41<199:10:00,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28291/203307 [32:11:41<199:10:00,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28292/203307 [32:11:46<199:09:58,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28292/203307 [32:11:46<199:09:58,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28293/203307 [32:11:49<199:09:52,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28293/203307 [32:11:49<199:09:52,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28294/203307 [32:11:53<199:09:45,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28294/203307 [32:11:53<199:09:45,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28295/203307 [32:11:58<199:09:43,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28295/203307 [32:11:58<199:09:43,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28296/203307 [32:12:02<199:09:40,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28296/203307 [32:12:02<199:09:40,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28297/203307 [32:12:06<199:09:38,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28297/203307 [32:12:06<199:09:38,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28298/203307 [32:12:10<199:09:35,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28298/203307 [32:12:10<199:09:35,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28299/203307 [32:12:14<199:09:29,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28299/203307 [32:12:14<199:09:29,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28300/203307 [32:12:18<199:09:23,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28300/203307 [32:12:18<199:09:23,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28301/203307 [32:12:23<199:09:21,  0.24it/s, v_num=t5e6, training/loss=0.0875]Epoch 0:  14%|█▍        | 28301/203307 [32:12:23<199:09:21,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28302/203307 [32:12:26<199:09:15,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28302/203307 [32:12:26<199:09:15,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28303/203307 [32:12:31<199:09:13,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28303/203307 [32:12:31<199:09:13,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28304/203307 [32:12:34<199:09:07,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28304/203307 [32:12:34<199:09:07,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28305/203307 [32:12:39<199:09:03,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28305/203307 [32:12:39<199:09:03,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28306/203307 [32:12:43<199:09:00,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28306/203307 [32:12:43<199:09:00,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28307/203307 [32:12:47<199:08:57,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28307/203307 [32:12:47<199:08:57,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28308/203307 [32:12:51<199:08:51,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28308/203307 [32:12:51<199:08:51,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28309/203307 [32:12:55<199:08:44,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28309/203307 [32:12:55<199:08:44,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28310/203307 [32:12:59<199:08:43,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28310/203307 [32:12:59<199:08:43,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28311/203307 [32:13:03<199:08:37,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28311/203307 [32:13:03<199:08:37,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28312/203307 [32:13:07<199:08:34,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28312/203307 [32:13:07<199:08:34,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28313/203307 [32:13:12<199:08:31,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28313/203307 [32:13:12<199:08:31,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28314/203307 [32:13:16<199:08:28,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28314/203307 [32:13:16<199:08:28,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28315/203307 [32:13:20<199:08:22,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28315/203307 [32:13:20<199:08:22,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28316/203307 [32:13:24<199:08:19,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28316/203307 [32:13:24<199:08:19,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28317/203307 [32:13:28<199:08:13,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28317/203307 [32:13:28<199:08:13,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28318/203307 [32:13:32<199:08:12,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28318/203307 [32:13:32<199:08:12,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28319/203307 [32:13:37<199:08:09,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28319/203307 [32:13:37<199:08:09,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28320/203307 [32:13:40<199:08:02,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28320/203307 [32:13:40<199:08:02,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28321/203307 [32:13:45<199:08:00,  0.24it/s, v_num=t5e6, training/loss=0.0708]Epoch 0:  14%|█▍        | 28321/203307 [32:13:45<199:08:00,  0.24it/s, v_num=t5e6, training/loss=0.079] Epoch 0:  14%|█▍        | 28322/203307 [32:13:48<199:07:54,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28322/203307 [32:13:48<199:07:54,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28323/203307 [32:13:53<199:07:51,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28323/203307 [32:13:53<199:07:51,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28324/203307 [32:13:57<199:07:48,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28324/203307 [32:13:57<199:07:48,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28325/203307 [32:14:01<199:07:42,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28325/203307 [32:14:01<199:07:42,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28326/203307 [32:14:04<199:07:35,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28326/203307 [32:14:04<199:07:35,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28327/203307 [32:14:09<199:07:34,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28327/203307 [32:14:09<199:07:34,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28328/203307 [32:14:13<199:07:30,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28328/203307 [32:14:13<199:07:31,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28329/203307 [32:14:18<199:07:28,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28329/203307 [32:14:18<199:07:28,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28330/203307 [32:14:22<199:07:26,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28330/203307 [32:14:22<199:07:26,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28331/203307 [32:14:26<199:07:19,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28331/203307 [32:14:26<199:07:19,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28332/203307 [32:14:30<199:07:17,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28332/203307 [32:14:30<199:07:17,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28333/203307 [32:14:34<199:07:15,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28333/203307 [32:14:34<199:07:15,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28334/203307 [32:14:38<199:07:08,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28334/203307 [32:14:38<199:07:08,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28335/203307 [32:14:42<199:07:02,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28335/203307 [32:14:42<199:07:02,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28336/203307 [32:14:46<199:07:00,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28336/203307 [32:14:46<199:07:00,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28337/203307 [32:14:50<199:06:56,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28337/203307 [32:14:50<199:06:56,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28338/203307 [32:14:55<199:06:54,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28338/203307 [32:14:55<199:06:54,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28339/203307 [32:14:59<199:06:48,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28339/203307 [32:14:59<199:06:48,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28340/203307 [32:15:03<199:06:44,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28340/203307 [32:15:03<199:06:44,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28341/203307 [32:15:07<199:06:38,  0.24it/s, v_num=t5e6, training/loss=0.079]Epoch 0:  14%|█▍        | 28341/203307 [32:15:07<199:06:38,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28342/203307 [32:15:11<199:06:35,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28342/203307 [32:15:11<199:06:35,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28343/203307 [32:15:15<199:06:30,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28343/203307 [32:15:15<199:06:31,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28344/203307 [32:15:19<199:06:28,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28344/203307 [32:15:19<199:06:28,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28345/203307 [32:15:23<199:06:22,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28345/203307 [32:15:23<199:06:22,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28346/203307 [32:15:27<199:06:19,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28346/203307 [32:15:27<199:06:19,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28347/203307 [32:15:32<199:06:16,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28347/203307 [32:15:32<199:06:16,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28348/203307 [32:15:35<199:06:10,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28348/203307 [32:15:35<199:06:10,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28349/203307 [32:15:40<199:06:07,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28349/203307 [32:15:40<199:06:07,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28350/203307 [32:15:44<199:06:03,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28350/203307 [32:15:44<199:06:03,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28351/203307 [32:15:47<199:05:57,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28351/203307 [32:15:47<199:05:57,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28352/203307 [32:15:51<199:05:50,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28352/203307 [32:15:51<199:05:50,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28353/203307 [32:15:56<199:05:48,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28353/203307 [32:15:56<199:05:48,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28354/203307 [32:15:59<199:05:41,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28354/203307 [32:15:59<199:05:41,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28355/203307 [32:16:04<199:05:39,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28355/203307 [32:16:04<199:05:39,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28356/203307 [32:16:07<199:05:33,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28356/203307 [32:16:07<199:05:33,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28357/203307 [32:16:11<199:05:26,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28357/203307 [32:16:11<199:05:26,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28358/203307 [32:16:15<199:05:23,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28358/203307 [32:16:15<199:05:23,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28359/203307 [32:16:20<199:05:21,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28359/203307 [32:16:20<199:05:21,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28360/203307 [32:16:23<199:05:14,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28360/203307 [32:16:23<199:05:14,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28361/203307 [32:16:27<199:05:08,  0.24it/s, v_num=t5e6, training/loss=0.0878]Epoch 0:  14%|█▍        | 28361/203307 [32:16:27<199:05:08,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28362/203307 [32:16:32<199:05:06,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28362/203307 [32:16:32<199:05:06,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28363/203307 [32:16:36<199:05:03,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28363/203307 [32:16:36<199:05:03,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28364/203307 [32:16:40<199:05:01,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28364/203307 [32:16:40<199:05:01,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28365/203307 [32:16:44<199:04:54,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28365/203307 [32:16:44<199:04:54,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28366/203307 [32:16:48<199:04:51,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28366/203307 [32:16:48<199:04:51,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28367/203307 [32:16:52<199:04:45,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28367/203307 [32:16:52<199:04:45,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28368/203307 [32:16:56<199:04:42,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28368/203307 [32:16:56<199:04:42,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28369/203307 [32:17:00<199:04:36,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28369/203307 [32:17:00<199:04:36,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28370/203307 [32:17:04<199:04:33,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28370/203307 [32:17:04<199:04:33,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28371/203307 [32:17:09<199:04:30,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28371/203307 [32:17:09<199:04:30,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28372/203307 [32:17:12<199:04:23,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28372/203307 [32:17:12<199:04:23,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28373/203307 [32:17:17<199:04:21,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28373/203307 [32:17:17<199:04:21,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28374/203307 [32:17:21<199:04:15,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28374/203307 [32:17:21<199:04:15,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28375/203307 [32:17:25<199:04:13,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28375/203307 [32:17:25<199:04:13,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28376/203307 [32:17:29<199:04:10,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28376/203307 [32:17:29<199:04:10,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28377/203307 [32:17:33<199:04:03,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28377/203307 [32:17:33<199:04:04,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28378/203307 [32:17:37<199:03:57,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28378/203307 [32:17:37<199:03:57,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28379/203307 [32:17:41<199:03:55,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28379/203307 [32:17:41<199:03:55,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28380/203307 [32:17:45<199:03:52,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28380/203307 [32:17:45<199:03:52,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28381/203307 [32:17:50<199:03:50,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28381/203307 [32:17:50<199:03:50,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28382/203307 [32:17:54<199:03:46,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28382/203307 [32:17:54<199:03:46,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28383/203307 [32:17:58<199:03:39,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28383/203307 [32:17:58<199:03:39,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28384/203307 [32:18:02<199:03:37,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28384/203307 [32:18:02<199:03:37,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28385/203307 [32:18:06<199:03:34,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28385/203307 [32:18:06<199:03:34,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28386/203307 [32:18:10<199:03:27,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28386/203307 [32:18:10<199:03:27,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28387/203307 [32:18:13<199:03:20,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28387/203307 [32:18:13<199:03:20,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28388/203307 [32:18:18<199:03:19,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28388/203307 [32:18:18<199:03:19,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28389/203307 [32:18:22<199:03:13,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28389/203307 [32:18:22<199:03:13,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28390/203307 [32:18:26<199:03:12,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28390/203307 [32:18:26<199:03:12,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28391/203307 [32:18:31<199:03:08,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28391/203307 [32:18:31<199:03:08,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28392/203307 [32:18:35<199:03:05,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28392/203307 [32:18:35<199:03:05,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28393/203307 [32:18:39<199:03:00,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28393/203307 [32:18:39<199:03:00,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28394/203307 [32:18:43<199:02:57,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28394/203307 [32:18:43<199:02:57,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28395/203307 [32:18:47<199:02:51,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28395/203307 [32:18:47<199:02:51,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28396/203307 [32:18:51<199:02:49,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28396/203307 [32:18:51<199:02:49,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28397/203307 [32:18:55<199:02:44,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28397/203307 [32:18:55<199:02:44,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28398/203307 [32:18:59<199:02:38,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28398/203307 [32:18:59<199:02:38,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28399/203307 [32:19:04<199:02:36,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28399/203307 [32:19:04<199:02:36,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28400/203307 [32:19:08<199:02:34,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28400/203307 [32:19:08<199:02:34,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28401/203307 [32:19:12<199:02:31,  0.24it/s, v_num=t5e6, training/loss=0.0872]Epoch 0:  14%|█▍        | 28401/203307 [32:19:12<199:02:31,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28402/203307 [32:19:16<199:02:28,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28402/203307 [32:19:16<199:02:28,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28403/203307 [32:19:20<199:02:22,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28403/203307 [32:19:20<199:02:22,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28404/203307 [32:19:24<199:02:16,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28404/203307 [32:19:24<199:02:16,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28405/203307 [32:19:29<199:02:15,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28405/203307 [32:19:29<199:02:15,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28406/203307 [32:19:32<199:02:08,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28406/203307 [32:19:32<199:02:08,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28407/203307 [32:19:37<199:02:06,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28407/203307 [32:19:37<199:02:06,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28408/203307 [32:19:41<199:02:01,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28408/203307 [32:19:41<199:02:01,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28409/203307 [32:19:45<199:01:58,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28409/203307 [32:19:45<199:01:58,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28410/203307 [32:19:49<199:01:55,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28410/203307 [32:19:49<199:01:55,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28411/203307 [32:19:54<199:01:53,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28411/203307 [32:19:54<199:01:53,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28412/203307 [32:19:57<199:01:46,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28412/203307 [32:19:57<199:01:47,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28413/203307 [32:20:02<199:01:43,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28413/203307 [32:20:02<199:01:44,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28414/203307 [32:20:06<199:01:42,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28414/203307 [32:20:06<199:01:42,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28415/203307 [32:20:10<199:01:36,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28415/203307 [32:20:10<199:01:36,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28416/203307 [32:20:14<199:01:34,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28416/203307 [32:20:14<199:01:34,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28417/203307 [32:20:18<199:01:28,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28417/203307 [32:20:18<199:01:28,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28418/203307 [32:20:22<199:01:26,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28418/203307 [32:20:23<199:01:26,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28419/203307 [32:20:26<199:01:19,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28419/203307 [32:20:26<199:01:19,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28420/203307 [32:20:31<199:01:16,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28420/203307 [32:20:31<199:01:16,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28421/203307 [32:20:35<199:01:13,  0.24it/s, v_num=t5e6, training/loss=0.0819]Epoch 0:  14%|█▍        | 28421/203307 [32:20:35<199:01:13,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28422/203307 [32:20:39<199:01:11,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28422/203307 [32:20:39<199:01:11,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28423/203307 [32:20:43<199:01:05,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28423/203307 [32:20:43<199:01:05,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28424/203307 [32:20:47<199:00:59,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28424/203307 [32:20:47<199:00:59,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28425/203307 [32:20:51<199:00:57,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28425/203307 [32:20:51<199:00:57,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28426/203307 [32:20:55<199:00:50,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28426/203307 [32:20:55<199:00:50,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28427/203307 [32:20:59<199:00:47,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28427/203307 [32:20:59<199:00:47,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28428/203307 [32:21:03<199:00:44,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28428/203307 [32:21:03<199:00:44,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28429/203307 [32:21:07<199:00:37,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28429/203307 [32:21:07<199:00:37,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28430/203307 [32:21:11<199:00:34,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28430/203307 [32:21:11<199:00:34,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28431/203307 [32:21:16<199:00:33,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28431/203307 [32:21:16<199:00:33,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28432/203307 [32:21:20<199:00:26,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28432/203307 [32:21:20<199:00:26,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28433/203307 [32:21:24<199:00:24,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28433/203307 [32:21:24<199:00:24,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28434/203307 [32:21:28<199:00:18,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28434/203307 [32:21:28<199:00:18,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28435/203307 [32:21:31<199:00:11,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28435/203307 [32:21:31<199:00:11,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28436/203307 [32:21:36<199:00:09,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28436/203307 [32:21:36<199:00:09,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28437/203307 [32:21:40<199:00:07,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28437/203307 [32:21:40<199:00:07,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28438/203307 [32:21:44<199:00:03,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28438/203307 [32:21:44<199:00:03,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28439/203307 [32:21:48<198:59:57,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28439/203307 [32:21:48<198:59:57,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28440/203307 [32:21:52<198:59:55,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28440/203307 [32:21:52<198:59:55,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28441/203307 [32:21:56<198:59:48,  0.24it/s, v_num=t5e6, training/loss=0.0899]Epoch 0:  14%|█▍        | 28441/203307 [32:21:56<198:59:48,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28442/203307 [32:22:01<198:59:46,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28442/203307 [32:22:01<198:59:47,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28443/203307 [32:22:04<198:59:40,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28443/203307 [32:22:04<198:59:40,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28444/203307 [32:22:09<198:59:38,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28444/203307 [32:22:09<198:59:38,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28445/203307 [32:22:13<198:59:35,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28445/203307 [32:22:13<198:59:35,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28446/203307 [32:22:17<198:59:32,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28446/203307 [32:22:17<198:59:32,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28447/203307 [32:22:21<198:59:26,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28447/203307 [32:22:21<198:59:26,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28448/203307 [32:22:26<198:59:25,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28448/203307 [32:22:26<198:59:25,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28449/203307 [32:22:30<198:59:19,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28449/203307 [32:22:30<198:59:19,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28450/203307 [32:22:33<198:59:13,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28450/203307 [32:22:33<198:59:13,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28451/203307 [32:22:38<198:59:11,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28451/203307 [32:22:38<198:59:11,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28452/203307 [32:22:42<198:59:05,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28452/203307 [32:22:42<198:59:05,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28453/203307 [32:22:46<198:59:02,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28453/203307 [32:22:46<198:59:02,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28454/203307 [32:22:50<198:59:00,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28454/203307 [32:22:50<198:59:00,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28455/203307 [32:22:55<198:58:57,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28455/203307 [32:22:55<198:58:57,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28456/203307 [32:22:58<198:58:51,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28456/203307 [32:22:58<198:58:51,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28457/203307 [32:23:03<198:58:49,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28457/203307 [32:23:03<198:58:49,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28458/203307 [32:23:07<198:58:43,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28458/203307 [32:23:07<198:58:43,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28459/203307 [32:23:11<198:58:41,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28459/203307 [32:23:11<198:58:41,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28460/203307 [32:23:15<198:58:34,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28460/203307 [32:23:15<198:58:34,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28461/203307 [32:23:18<198:58:28,  0.24it/s, v_num=t5e6, training/loss=0.0856]Epoch 0:  14%|█▍        | 28461/203307 [32:23:18<198:58:28,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28462/203307 [32:23:23<198:58:26,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28462/203307 [32:23:23<198:58:26,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28463/203307 [32:23:27<198:58:23,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28463/203307 [32:23:27<198:58:23,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28464/203307 [32:23:31<198:58:17,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28464/203307 [32:23:31<198:58:17,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28465/203307 [32:23:35<198:58:10,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28465/203307 [32:23:35<198:58:10,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28466/203307 [32:23:39<198:58:08,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28466/203307 [32:23:39<198:58:08,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28467/203307 [32:23:43<198:58:02,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28467/203307 [32:23:43<198:58:02,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28468/203307 [32:23:47<198:58:00,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28468/203307 [32:23:47<198:58:00,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28469/203307 [32:23:51<198:57:53,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28469/203307 [32:23:51<198:57:53,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28470/203307 [32:23:55<198:57:51,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28470/203307 [32:23:55<198:57:51,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28471/203307 [32:24:00<198:57:48,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28471/203307 [32:24:00<198:57:48,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28472/203307 [32:24:04<198:57:45,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28472/203307 [32:24:04<198:57:45,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28473/203307 [32:24:08<198:57:39,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28473/203307 [32:24:08<198:57:39,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28474/203307 [32:24:12<198:57:37,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28474/203307 [32:24:12<198:57:37,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28475/203307 [32:24:16<198:57:31,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28475/203307 [32:24:16<198:57:31,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28476/203307 [32:24:20<198:57:25,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28476/203307 [32:24:20<198:57:25,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28477/203307 [32:24:24<198:57:24,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28477/203307 [32:24:24<198:57:24,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28478/203307 [32:24:28<198:57:17,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28478/203307 [32:24:28<198:57:17,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28479/203307 [32:24:32<198:57:14,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28479/203307 [32:24:32<198:57:14,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28480/203307 [32:24:36<198:57:11,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28480/203307 [32:24:36<198:57:11,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28481/203307 [32:24:41<198:57:08,  0.24it/s, v_num=t5e6, training/loss=0.0865]Epoch 0:  14%|█▍        | 28481/203307 [32:24:41<198:57:08,  0.24it/s, v_num=t5e6, training/loss=0.089] Epoch 0:  14%|█▍        | 28482/203307 [32:24:45<198:57:03,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28482/203307 [32:24:45<198:57:03,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28483/203307 [32:24:49<198:57:02,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28483/203307 [32:24:49<198:57:02,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28484/203307 [32:24:53<198:56:55,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28484/203307 [32:24:53<198:56:55,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28485/203307 [32:24:57<198:56:53,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28485/203307 [32:24:57<198:56:53,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28486/203307 [32:25:01<198:56:47,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28486/203307 [32:25:01<198:56:47,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28487/203307 [32:25:05<198:56:40,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28487/203307 [32:25:05<198:56:40,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28488/203307 [32:25:09<198:56:37,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28488/203307 [32:25:09<198:56:37,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28489/203307 [32:25:13<198:56:35,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28489/203307 [32:25:13<198:56:35,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28490/203307 [32:25:17<198:56:31,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28490/203307 [32:25:17<198:56:31,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28491/203307 [32:25:21<198:56:24,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28491/203307 [32:25:21<198:56:24,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28492/203307 [32:25:26<198:56:23,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28492/203307 [32:25:26<198:56:23,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28493/203307 [32:25:30<198:56:17,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28493/203307 [32:25:30<198:56:17,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28494/203307 [32:25:34<198:56:15,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28494/203307 [32:25:34<198:56:15,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28495/203307 [32:25:38<198:56:09,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28495/203307 [32:25:38<198:56:09,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28496/203307 [32:25:42<198:56:06,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28496/203307 [32:25:42<198:56:06,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28497/203307 [32:25:46<198:56:00,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28497/203307 [32:25:46<198:56:00,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28498/203307 [32:25:50<198:55:57,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28498/203307 [32:25:50<198:55:57,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28499/203307 [32:25:54<198:55:53,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28499/203307 [32:25:54<198:55:53,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28500/203307 [32:25:59<198:55:51,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28500/203307 [32:25:59<198:55:51,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28501/203307 [32:26:02<198:55:45,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28501/203307 [32:26:02<198:55:45,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28502/203307 [32:26:06<198:55:39,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28502/203307 [32:26:06<198:55:39,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28503/203307 [32:26:11<198:55:37,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28503/203307 [32:26:11<198:55:37,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28504/203307 [32:26:14<198:55:30,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28504/203307 [32:26:14<198:55:30,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28505/203307 [32:26:19<198:55:27,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28505/203307 [32:26:19<198:55:28,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28506/203307 [32:26:23<198:55:25,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28506/203307 [32:26:23<198:55:25,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28507/203307 [32:26:27<198:55:19,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28507/203307 [32:26:27<198:55:19,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28508/203307 [32:26:31<198:55:16,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28508/203307 [32:26:31<198:55:16,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28509/203307 [32:26:36<198:55:14,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28509/203307 [32:26:36<198:55:14,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28510/203307 [32:26:39<198:55:08,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28510/203307 [32:26:39<198:55:08,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28511/203307 [32:26:44<198:55:06,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28511/203307 [32:26:44<198:55:06,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28512/203307 [32:26:47<198:55:00,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28512/203307 [32:26:47<198:55:00,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28513/203307 [32:26:52<198:54:56,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28513/203307 [32:26:52<198:54:56,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28514/203307 [32:26:56<198:54:53,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28514/203307 [32:26:56<198:54:54,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28515/203307 [32:27:00<198:54:51,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28515/203307 [32:27:00<198:54:51,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28516/203307 [32:27:04<198:54:44,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28516/203307 [32:27:04<198:54:45,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28517/203307 [32:27:08<198:54:41,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28517/203307 [32:27:08<198:54:41,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28518/203307 [32:27:13<198:54:40,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28518/203307 [32:27:13<198:54:40,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28519/203307 [32:27:17<198:54:34,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28519/203307 [32:27:17<198:54:34,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28520/203307 [32:27:21<198:54:32,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28520/203307 [32:27:21<198:54:32,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28521/203307 [32:27:25<198:54:30,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28521/203307 [32:27:25<198:54:30,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28522/203307 [32:27:30<198:54:27,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28522/203307 [32:27:30<198:54:27,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28523/203307 [32:27:34<198:54:22,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28523/203307 [32:27:34<198:54:22,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28524/203307 [32:27:38<198:54:19,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28524/203307 [32:27:38<198:54:19,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28525/203307 [32:27:42<198:54:12,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28525/203307 [32:27:42<198:54:12,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28526/203307 [32:27:46<198:54:10,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28526/203307 [32:27:46<198:54:11,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28527/203307 [32:27:50<198:54:04,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28527/203307 [32:27:50<198:54:04,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28528/203307 [32:27:54<198:53:57,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28528/203307 [32:27:54<198:53:57,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28529/203307 [32:27:58<198:53:55,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28529/203307 [32:27:58<198:53:56,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28530/203307 [32:28:02<198:53:53,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28530/203307 [32:28:02<198:53:53,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28531/203307 [32:28:07<198:53:50,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28531/203307 [32:28:07<198:53:50,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28532/203307 [32:28:11<198:53:47,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28532/203307 [32:28:11<198:53:47,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28533/203307 [32:28:15<198:53:40,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28533/203307 [32:28:15<198:53:40,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28534/203307 [32:28:18<198:53:34,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28534/203307 [32:28:18<198:53:34,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28535/203307 [32:28:23<198:53:32,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28535/203307 [32:28:23<198:53:32,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28536/203307 [32:28:27<198:53:26,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28536/203307 [32:28:27<198:53:26,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28537/203307 [32:28:31<198:53:24,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28537/203307 [32:28:31<198:53:24,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28538/203307 [32:28:35<198:53:21,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28538/203307 [32:28:35<198:53:21,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28539/203307 [32:28:39<198:53:15,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28539/203307 [32:28:39<198:53:15,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28540/203307 [32:28:43<198:53:12,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28540/203307 [32:28:43<198:53:12,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28541/203307 [32:28:48<198:53:09,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28541/203307 [32:28:48<198:53:09,  0.24it/s, v_num=t5e6, training/loss=0.092] Epoch 0:  14%|█▍        | 28542/203307 [32:28:51<198:53:03,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28542/203307 [32:28:51<198:53:03,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28543/203307 [32:28:55<198:52:56,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28543/203307 [32:28:55<198:52:56,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28544/203307 [32:28:59<198:52:54,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28544/203307 [32:28:59<198:52:54,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28545/203307 [32:29:03<198:52:47,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28545/203307 [32:29:03<198:52:47,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28546/203307 [32:29:08<198:52:45,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28546/203307 [32:29:08<198:52:45,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28547/203307 [32:29:11<198:52:39,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28547/203307 [32:29:11<198:52:39,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28548/203307 [32:29:16<198:52:36,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28548/203307 [32:29:16<198:52:36,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28549/203307 [32:29:19<198:52:30,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28549/203307 [32:29:19<198:52:30,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28550/203307 [32:29:24<198:52:28,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28550/203307 [32:29:24<198:52:28,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28551/203307 [32:29:27<198:52:21,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28551/203307 [32:29:27<198:52:21,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28552/203307 [32:29:32<198:52:19,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28552/203307 [32:29:32<198:52:19,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28553/203307 [32:29:36<198:52:16,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28553/203307 [32:29:36<198:52:16,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28554/203307 [32:29:40<198:52:10,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28554/203307 [32:29:40<198:52:10,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28555/203307 [32:29:44<198:52:08,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28555/203307 [32:29:44<198:52:08,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28556/203307 [32:29:48<198:52:02,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28556/203307 [32:29:48<198:52:02,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28557/203307 [32:29:52<198:51:59,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28557/203307 [32:29:52<198:51:59,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28558/203307 [32:29:57<198:51:57,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28558/203307 [32:29:57<198:51:57,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28559/203307 [32:30:01<198:51:50,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28559/203307 [32:30:01<198:51:50,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28560/203307 [32:30:04<198:51:44,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28560/203307 [32:30:04<198:51:44,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28561/203307 [32:30:09<198:51:42,  0.24it/s, v_num=t5e6, training/loss=0.092]Epoch 0:  14%|█▍        | 28561/203307 [32:30:09<198:51:42,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28562/203307 [32:30:13<198:51:38,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28562/203307 [32:30:13<198:51:38,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28563/203307 [32:30:17<198:51:36,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28563/203307 [32:30:17<198:51:36,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28564/203307 [32:30:21<198:51:30,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28564/203307 [32:30:21<198:51:30,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28565/203307 [32:30:25<198:51:23,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28565/203307 [32:30:25<198:51:23,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28566/203307 [32:30:29<198:51:21,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28566/203307 [32:30:29<198:51:21,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28567/203307 [32:30:33<198:51:19,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28567/203307 [32:30:33<198:51:19,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28568/203307 [32:30:37<198:51:12,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28568/203307 [32:30:37<198:51:12,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28569/203307 [32:30:41<198:51:05,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28569/203307 [32:30:41<198:51:05,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28570/203307 [32:30:45<198:51:04,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28570/203307 [32:30:45<198:51:04,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28571/203307 [32:30:50<198:51:01,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28571/203307 [32:30:50<198:51:01,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28572/203307 [32:30:54<198:50:59,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28572/203307 [32:30:54<198:50:59,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28573/203307 [32:30:58<198:50:52,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28573/203307 [32:30:58<198:50:52,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28574/203307 [32:31:02<198:50:49,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28574/203307 [32:31:02<198:50:49,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28575/203307 [32:31:06<198:50:43,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28575/203307 [32:31:06<198:50:43,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28576/203307 [32:31:10<198:50:41,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28576/203307 [32:31:10<198:50:41,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28577/203307 [32:31:14<198:50:34,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28577/203307 [32:31:14<198:50:35,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28578/203307 [32:31:18<198:50:32,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28578/203307 [32:31:18<198:50:32,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28579/203307 [32:31:22<198:50:26,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28579/203307 [32:31:22<198:50:26,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28580/203307 [32:31:26<198:50:23,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28580/203307 [32:31:26<198:50:23,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28581/203307 [32:31:31<198:50:21,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  14%|█▍        | 28581/203307 [32:31:31<198:50:21,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28582/203307 [32:31:34<198:50:14,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28582/203307 [32:31:34<198:50:14,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28583/203307 [32:31:39<198:50:12,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28583/203307 [32:31:39<198:50:12,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28584/203307 [32:31:43<198:50:09,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28584/203307 [32:31:43<198:50:09,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28585/203307 [32:31:47<198:50:02,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28585/203307 [32:31:47<198:50:02,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28586/203307 [32:31:51<198:49:56,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28586/203307 [32:31:51<198:49:56,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28587/203307 [32:31:55<198:49:54,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28587/203307 [32:31:55<198:49:54,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28588/203307 [32:31:59<198:49:51,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28588/203307 [32:31:59<198:49:51,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28589/203307 [32:32:04<198:49:48,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28589/203307 [32:32:04<198:49:48,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28590/203307 [32:32:07<198:49:42,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28590/203307 [32:32:07<198:49:42,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28591/203307 [32:32:11<198:49:36,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28591/203307 [32:32:11<198:49:36,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28592/203307 [32:32:15<198:49:34,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28592/203307 [32:32:15<198:49:34,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28593/203307 [32:32:20<198:49:31,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28593/203307 [32:32:20<198:49:31,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28594/203307 [32:32:24<198:49:24,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28594/203307 [32:32:24<198:49:25,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28595/203307 [32:32:27<198:49:18,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28595/203307 [32:32:27<198:49:18,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28596/203307 [32:32:32<198:49:16,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28596/203307 [32:32:32<198:49:16,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28597/203307 [32:32:35<198:49:10,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28597/203307 [32:32:35<198:49:10,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28598/203307 [32:32:40<198:49:08,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28598/203307 [32:32:40<198:49:08,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28599/203307 [32:32:44<198:49:01,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28599/203307 [32:32:44<198:49:01,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28600/203307 [32:32:48<198:48:58,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28600/203307 [32:32:48<198:48:58,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28601/203307 [32:32:51<198:48:51,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  14%|█▍        | 28601/203307 [32:32:51<198:48:51,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28602/203307 [32:32:56<198:48:48,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28602/203307 [32:32:56<198:48:48,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28603/203307 [32:32:59<198:48:41,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28603/203307 [32:32:59<198:48:42,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28604/203307 [32:33:04<198:48:39,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28604/203307 [32:33:04<198:48:39,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28605/203307 [32:33:08<198:48:36,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28605/203307 [32:33:08<198:48:36,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28606/203307 [32:33:12<198:48:29,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28606/203307 [32:33:12<198:48:29,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28607/203307 [32:33:16<198:48:27,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28607/203307 [32:33:16<198:48:27,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28608/203307 [32:33:20<198:48:20,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28608/203307 [32:33:20<198:48:20,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28609/203307 [32:33:24<198:48:18,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28609/203307 [32:33:24<198:48:18,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28610/203307 [32:33:28<198:48:15,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28610/203307 [32:33:28<198:48:15,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28611/203307 [32:33:32<198:48:08,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28611/203307 [32:33:32<198:48:08,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28612/203307 [32:33:36<198:48:01,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28612/203307 [32:33:36<198:48:01,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28613/203307 [32:33:40<198:47:59,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28613/203307 [32:33:40<198:47:59,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28614/203307 [32:33:44<198:47:52,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28614/203307 [32:33:44<198:47:52,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28615/203307 [32:33:48<198:47:50,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28615/203307 [32:33:48<198:47:50,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28616/203307 [32:33:52<198:47:46,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28616/203307 [32:33:52<198:47:46,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28617/203307 [32:33:56<198:47:39,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28617/203307 [32:33:56<198:47:39,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28618/203307 [32:34:00<198:47:37,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28618/203307 [32:34:00<198:47:37,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28619/203307 [32:34:05<198:47:34,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28619/203307 [32:34:05<198:47:34,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28620/203307 [32:34:08<198:47:27,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28620/203307 [32:34:08<198:47:27,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28621/203307 [32:34:13<198:47:25,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 28621/203307 [32:34:13<198:47:25,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28622/203307 [32:34:17<198:47:23,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28622/203307 [32:34:17<198:47:23,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28623/203307 [32:34:21<198:47:16,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28623/203307 [32:34:21<198:47:16,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28624/203307 [32:34:25<198:47:15,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28624/203307 [32:34:25<198:47:15,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28625/203307 [32:34:29<198:47:10,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28625/203307 [32:34:29<198:47:10,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28626/203307 [32:34:34<198:47:07,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28626/203307 [32:34:34<198:47:07,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28627/203307 [32:34:37<198:47:01,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28627/203307 [32:34:37<198:47:01,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28628/203307 [32:34:42<198:46:58,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28628/203307 [32:34:42<198:46:58,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28629/203307 [32:34:45<198:46:51,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28629/203307 [32:34:45<198:46:51,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28630/203307 [32:34:50<198:46:49,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28630/203307 [32:34:50<198:46:49,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28631/203307 [32:34:53<198:46:42,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28631/203307 [32:34:53<198:46:42,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28632/203307 [32:34:57<198:46:35,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28632/203307 [32:34:57<198:46:35,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28633/203307 [32:35:01<198:46:33,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28633/203307 [32:35:01<198:46:33,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28634/203307 [32:35:05<198:46:29,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28634/203307 [32:35:06<198:46:29,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28635/203307 [32:35:10<198:46:26,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28635/203307 [32:35:10<198:46:26,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28636/203307 [32:35:14<198:46:23,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28636/203307 [32:35:14<198:46:23,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28637/203307 [32:35:18<198:46:17,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28637/203307 [32:35:18<198:46:17,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28638/203307 [32:35:22<198:46:14,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28638/203307 [32:35:22<198:46:14,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28639/203307 [32:35:27<198:46:13,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28639/203307 [32:35:27<198:46:13,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28640/203307 [32:35:30<198:46:06,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28640/203307 [32:35:30<198:46:06,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28641/203307 [32:35:35<198:46:04,  0.24it/s, v_num=t5e6, training/loss=0.0738]Epoch 0:  14%|█▍        | 28641/203307 [32:35:35<198:46:05,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28642/203307 [32:35:39<198:45:59,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28642/203307 [32:35:39<198:45:59,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28643/203307 [32:35:43<198:45:56,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28643/203307 [32:35:43<198:45:56,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28644/203307 [32:35:47<198:45:53,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28644/203307 [32:35:47<198:45:53,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28645/203307 [32:35:52<198:45:50,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28645/203307 [32:35:52<198:45:50,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28646/203307 [32:35:56<198:45:47,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28646/203307 [32:35:56<198:45:47,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28647/203307 [32:36:00<198:45:40,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28647/203307 [32:36:00<198:45:40,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28648/203307 [32:36:04<198:45:38,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28648/203307 [32:36:04<198:45:38,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28649/203307 [32:36:08<198:45:32,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28649/203307 [32:36:08<198:45:32,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28650/203307 [32:36:12<198:45:30,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28650/203307 [32:36:12<198:45:30,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28651/203307 [32:36:16<198:45:23,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28651/203307 [32:36:16<198:45:23,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28652/203307 [32:36:20<198:45:21,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28652/203307 [32:36:20<198:45:21,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28653/203307 [32:36:24<198:45:15,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28653/203307 [32:36:24<198:45:15,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28654/203307 [32:36:28<198:45:13,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28654/203307 [32:36:28<198:45:13,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28655/203307 [32:36:33<198:45:10,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28655/203307 [32:36:33<198:45:10,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28656/203307 [32:36:37<198:45:08,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28656/203307 [32:36:37<198:45:08,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28657/203307 [32:36:41<198:45:02,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28657/203307 [32:36:41<198:45:02,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28658/203307 [32:36:45<198:44:56,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28658/203307 [32:36:45<198:44:56,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28659/203307 [32:36:49<198:44:54,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28659/203307 [32:36:49<198:44:54,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28660/203307 [32:36:53<198:44:47,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28660/203307 [32:36:53<198:44:48,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28661/203307 [32:36:57<198:44:45,  0.24it/s, v_num=t5e6, training/loss=0.0914]Epoch 0:  14%|█▍        | 28661/203307 [32:36:57<198:44:45,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28662/203307 [32:37:01<198:44:42,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28662/203307 [32:37:01<198:44:42,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28663/203307 [32:37:06<198:44:39,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28663/203307 [32:37:06<198:44:39,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28664/203307 [32:37:09<198:44:33,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28664/203307 [32:37:09<198:44:33,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28665/203307 [32:37:14<198:44:31,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28665/203307 [32:37:14<198:44:31,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28666/203307 [32:37:18<198:44:25,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28666/203307 [32:37:18<198:44:25,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28667/203307 [32:37:22<198:44:22,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28667/203307 [32:37:22<198:44:22,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28668/203307 [32:37:26<198:44:16,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28668/203307 [32:37:26<198:44:16,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28669/203307 [32:37:29<198:44:09,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28669/203307 [32:37:29<198:44:09,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28670/203307 [32:37:34<198:44:07,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28670/203307 [32:37:34<198:44:07,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28671/203307 [32:37:38<198:44:04,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28671/203307 [32:37:38<198:44:04,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28672/203307 [32:37:42<198:43:58,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28672/203307 [32:37:42<198:43:58,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28673/203307 [32:37:46<198:43:52,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28673/203307 [32:37:46<198:43:52,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28674/203307 [32:37:50<198:43:51,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28674/203307 [32:37:50<198:43:51,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28675/203307 [32:37:54<198:43:44,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28675/203307 [32:37:54<198:43:44,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28676/203307 [32:37:58<198:43:42,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28676/203307 [32:37:58<198:43:42,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28677/203307 [32:38:02<198:43:35,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28677/203307 [32:38:02<198:43:35,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28678/203307 [32:38:06<198:43:32,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28678/203307 [32:38:06<198:43:32,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28679/203307 [32:38:10<198:43:28,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28679/203307 [32:38:10<198:43:28,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28680/203307 [32:38:15<198:43:26,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28680/203307 [32:38:15<198:43:26,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28681/203307 [32:38:19<198:43:19,  0.24it/s, v_num=t5e6, training/loss=0.0838]Epoch 0:  14%|█▍        | 28681/203307 [32:38:19<198:43:19,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28682/203307 [32:38:23<198:43:17,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28682/203307 [32:38:23<198:43:17,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28683/203307 [32:38:27<198:43:11,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28683/203307 [32:38:27<198:43:11,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28684/203307 [32:38:30<198:43:04,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28684/203307 [32:38:30<198:43:04,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28685/203307 [32:38:35<198:43:02,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28685/203307 [32:38:35<198:43:02,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28686/203307 [32:38:39<198:42:56,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28686/203307 [32:38:39<198:42:56,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28687/203307 [32:38:43<198:42:53,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28687/203307 [32:38:43<198:42:53,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28688/203307 [32:38:47<198:42:50,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28688/203307 [32:38:47<198:42:50,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28689/203307 [32:38:51<198:42:44,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28689/203307 [32:38:51<198:42:44,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28690/203307 [32:38:55<198:42:37,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28690/203307 [32:38:55<198:42:37,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28691/203307 [32:38:59<198:42:35,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28691/203307 [32:38:59<198:42:35,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28692/203307 [32:39:03<198:42:29,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28692/203307 [32:39:03<198:42:29,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28693/203307 [32:39:07<198:42:26,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28693/203307 [32:39:07<198:42:26,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28694/203307 [32:39:11<198:42:20,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28694/203307 [32:39:11<198:42:20,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28695/203307 [32:39:14<198:42:13,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28695/203307 [32:39:14<198:42:13,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28696/203307 [32:39:19<198:42:10,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28696/203307 [32:39:19<198:42:10,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28697/203307 [32:39:23<198:42:08,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28697/203307 [32:39:23<198:42:08,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28698/203307 [32:39:27<198:42:02,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28698/203307 [32:39:27<198:42:02,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28699/203307 [32:39:31<198:41:55,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28699/203307 [32:39:31<198:41:55,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28700/203307 [32:39:35<198:41:53,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28700/203307 [32:39:35<198:41:53,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28701/203307 [32:39:39<198:41:47,  0.24it/s, v_num=t5e6, training/loss=0.0883]Epoch 0:  14%|█▍        | 28701/203307 [32:39:39<198:41:47,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28702/203307 [32:39:43<198:41:45,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28702/203307 [32:39:43<198:41:45,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28703/203307 [32:39:47<198:41:38,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28703/203307 [32:39:47<198:41:38,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28704/203307 [32:39:51<198:41:36,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28704/203307 [32:39:51<198:41:36,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28705/203307 [32:39:55<198:41:32,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28705/203307 [32:39:55<198:41:32,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28706/203307 [32:40:00<198:41:29,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28706/203307 [32:40:00<198:41:30,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28707/203307 [32:40:04<198:41:24,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28707/203307 [32:40:04<198:41:24,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28708/203307 [32:40:08<198:41:21,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28708/203307 [32:40:08<198:41:21,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28709/203307 [32:40:12<198:41:15,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28709/203307 [32:40:12<198:41:15,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28710/203307 [32:40:15<198:41:09,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28710/203307 [32:40:15<198:41:09,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28711/203307 [32:40:20<198:41:07,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28711/203307 [32:40:20<198:41:07,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28712/203307 [32:40:24<198:41:01,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28712/203307 [32:40:24<198:41:01,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28713/203307 [32:40:28<198:40:58,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28713/203307 [32:40:28<198:40:58,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28714/203307 [32:40:32<198:40:55,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28714/203307 [32:40:32<198:40:55,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28715/203307 [32:40:36<198:40:52,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28715/203307 [32:40:36<198:40:52,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28716/203307 [32:40:40<198:40:46,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28716/203307 [32:40:40<198:40:46,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28717/203307 [32:40:45<198:40:45,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28717/203307 [32:40:45<198:40:45,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28718/203307 [32:40:49<198:40:38,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28718/203307 [32:40:49<198:40:38,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28719/203307 [32:40:53<198:40:37,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28719/203307 [32:40:53<198:40:37,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28720/203307 [32:40:57<198:40:30,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28720/203307 [32:40:57<198:40:30,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28721/203307 [32:41:01<198:40:27,  0.24it/s, v_num=t5e6, training/loss=0.0992]Epoch 0:  14%|█▍        | 28721/203307 [32:41:01<198:40:27,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28722/203307 [32:41:05<198:40:25,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28722/203307 [32:41:05<198:40:25,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28723/203307 [32:41:10<198:40:22,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28723/203307 [32:41:10<198:40:22,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28724/203307 [32:41:14<198:40:18,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28724/203307 [32:41:14<198:40:18,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28725/203307 [32:41:18<198:40:12,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28725/203307 [32:41:18<198:40:12,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28726/203307 [32:41:22<198:40:10,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28726/203307 [32:41:22<198:40:10,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28727/203307 [32:41:26<198:40:04,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28727/203307 [32:41:26<198:40:04,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28728/203307 [32:41:30<198:40:02,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28728/203307 [32:41:30<198:40:02,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28729/203307 [32:41:34<198:39:55,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28729/203307 [32:41:34<198:39:55,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28730/203307 [32:41:38<198:39:53,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28730/203307 [32:41:38<198:39:53,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28731/203307 [32:41:42<198:39:46,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28731/203307 [32:41:42<198:39:46,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28732/203307 [32:41:46<198:39:44,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28732/203307 [32:41:46<198:39:44,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28733/203307 [32:41:51<198:39:41,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28733/203307 [32:41:51<198:39:41,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28734/203307 [32:41:55<198:39:39,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28734/203307 [32:41:55<198:39:39,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28735/203307 [32:41:59<198:39:33,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28735/203307 [32:41:59<198:39:33,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28736/203307 [32:42:03<198:39:27,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28736/203307 [32:42:03<198:39:27,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28737/203307 [32:42:07<198:39:25,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28737/203307 [32:42:07<198:39:25,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28738/203307 [32:42:11<198:39:22,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28738/203307 [32:42:11<198:39:22,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28739/203307 [32:42:16<198:39:19,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28739/203307 [32:42:16<198:39:19,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28740/203307 [32:42:20<198:39:16,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28740/203307 [32:42:20<198:39:16,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28741/203307 [32:42:24<198:39:09,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28741/203307 [32:42:24<198:39:09,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28742/203307 [32:42:28<198:39:06,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28742/203307 [32:42:28<198:39:06,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28743/203307 [32:42:32<198:39:03,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28743/203307 [32:42:32<198:39:03,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28744/203307 [32:42:36<198:38:57,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28744/203307 [32:42:36<198:38:57,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28745/203307 [32:42:40<198:38:54,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28745/203307 [32:42:40<198:38:54,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28746/203307 [32:42:44<198:38:50,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28746/203307 [32:42:44<198:38:51,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28747/203307 [32:42:48<198:38:44,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28747/203307 [32:42:48<198:38:44,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28748/203307 [32:42:52<198:38:41,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28748/203307 [32:42:52<198:38:41,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28749/203307 [32:42:57<198:38:38,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28749/203307 [32:42:57<198:38:38,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28750/203307 [32:43:00<198:38:31,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28750/203307 [32:43:00<198:38:31,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28751/203307 [32:43:05<198:38:28,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28751/203307 [32:43:05<198:38:28,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28752/203307 [32:43:09<198:38:26,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28752/203307 [32:43:09<198:38:26,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28753/203307 [32:43:13<198:38:19,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28753/203307 [32:43:13<198:38:19,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28754/203307 [32:43:17<198:38:17,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28754/203307 [32:43:17<198:38:17,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28755/203307 [32:43:21<198:38:14,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28755/203307 [32:43:21<198:38:15,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28756/203307 [32:43:26<198:38:11,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28756/203307 [32:43:26<198:38:11,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28757/203307 [32:43:29<198:38:05,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28757/203307 [32:43:29<198:38:05,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28758/203307 [32:43:34<198:38:03,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28758/203307 [32:43:34<198:38:03,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28759/203307 [32:43:37<198:37:56,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28759/203307 [32:43:37<198:37:56,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28760/203307 [32:43:42<198:37:54,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28760/203307 [32:43:42<198:37:54,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28761/203307 [32:43:46<198:37:47,  0.24it/s, v_num=t5e6, training/loss=0.0803]Epoch 0:  14%|█▍        | 28761/203307 [32:43:46<198:37:47,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28762/203307 [32:43:49<198:37:41,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28762/203307 [32:43:49<198:37:41,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28763/203307 [32:43:54<198:37:39,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28763/203307 [32:43:54<198:37:39,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28764/203307 [32:43:57<198:37:32,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28764/203307 [32:43:57<198:37:32,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28765/203307 [32:44:02<198:37:29,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28765/203307 [32:44:02<198:37:29,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28766/203307 [32:44:06<198:37:26,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28766/203307 [32:44:06<198:37:26,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28767/203307 [32:44:10<198:37:20,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28767/203307 [32:44:10<198:37:20,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28768/203307 [32:44:13<198:37:13,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28768/203307 [32:44:13<198:37:13,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28769/203307 [32:44:18<198:37:11,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28769/203307 [32:44:18<198:37:11,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28770/203307 [32:44:22<198:37:05,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28770/203307 [32:44:22<198:37:05,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28771/203307 [32:44:26<198:37:03,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28771/203307 [32:44:26<198:37:03,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28772/203307 [32:44:30<198:36:56,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28772/203307 [32:44:30<198:36:56,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28773/203307 [32:44:33<198:36:50,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28773/203307 [32:44:33<198:36:50,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28774/203307 [32:44:38<198:36:48,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28774/203307 [32:44:38<198:36:48,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28775/203307 [32:44:42<198:36:45,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28775/203307 [32:44:42<198:36:45,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28776/203307 [32:44:46<198:36:38,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28776/203307 [32:44:46<198:36:38,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28777/203307 [32:44:49<198:36:31,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28777/203307 [32:44:49<198:36:31,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28778/203307 [32:44:54<198:36:28,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28778/203307 [32:44:54<198:36:28,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28779/203307 [32:44:57<198:36:22,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28779/203307 [32:44:57<198:36:22,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28780/203307 [32:45:02<198:36:20,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28780/203307 [32:45:02<198:36:20,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28781/203307 [32:45:05<198:36:13,  0.24it/s, v_num=t5e6, training/loss=0.0896]Epoch 0:  14%|█▍        | 28781/203307 [32:45:05<198:36:13,  0.24it/s, v_num=t5e6, training/loss=0.089] Epoch 0:  14%|█▍        | 28782/203307 [32:45:10<198:36:09,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28782/203307 [32:45:10<198:36:10,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28783/203307 [32:45:13<198:36:03,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28783/203307 [32:45:13<198:36:03,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28784/203307 [32:45:18<198:36:00,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28784/203307 [32:45:18<198:36:00,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28785/203307 [32:45:21<198:35:53,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28785/203307 [32:45:21<198:35:53,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28786/203307 [32:45:26<198:35:51,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28786/203307 [32:45:26<198:35:51,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28787/203307 [32:45:30<198:35:48,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28787/203307 [32:45:30<198:35:48,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28788/203307 [32:45:34<198:35:45,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28788/203307 [32:45:34<198:35:45,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28789/203307 [32:45:39<198:35:42,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28789/203307 [32:45:39<198:35:42,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28790/203307 [32:45:42<198:35:36,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28790/203307 [32:45:42<198:35:36,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28791/203307 [32:45:47<198:35:33,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28791/203307 [32:45:47<198:35:33,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28792/203307 [32:45:51<198:35:31,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28792/203307 [32:45:51<198:35:31,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28793/203307 [32:45:55<198:35:24,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28793/203307 [32:45:55<198:35:24,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28794/203307 [32:45:58<198:35:17,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28794/203307 [32:45:58<198:35:17,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28795/203307 [32:46:03<198:35:16,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28795/203307 [32:46:03<198:35:16,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28796/203307 [32:46:07<198:35:12,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28796/203307 [32:46:07<198:35:12,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28797/203307 [32:46:11<198:35:10,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28797/203307 [32:46:11<198:35:10,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28798/203307 [32:46:15<198:35:04,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28798/203307 [32:46:15<198:35:04,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28799/203307 [32:46:19<198:34:57,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28799/203307 [32:46:19<198:34:57,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28800/203307 [32:46:23<198:34:55,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28800/203307 [32:46:23<198:34:55,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28801/203307 [32:46:28<198:34:53,  0.24it/s, v_num=t5e6, training/loss=0.089]Epoch 0:  14%|█▍        | 28801/203307 [32:46:28<198:34:53,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28802/203307 [32:46:31<198:34:46,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28802/203307 [32:46:31<198:34:46,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28803/203307 [32:46:35<198:34:39,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28803/203307 [32:46:35<198:34:39,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28804/203307 [32:46:39<198:34:38,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28804/203307 [32:46:39<198:34:38,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28805/203307 [32:46:44<198:34:35,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28805/203307 [32:46:44<198:34:35,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28806/203307 [32:46:48<198:34:33,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28806/203307 [32:46:48<198:34:33,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28807/203307 [32:46:52<198:34:26,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28807/203307 [32:46:52<198:34:26,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28808/203307 [32:46:56<198:34:23,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28808/203307 [32:46:56<198:34:23,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28809/203307 [32:47:00<198:34:17,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28809/203307 [32:47:00<198:34:17,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28810/203307 [32:47:04<198:34:15,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28810/203307 [32:47:04<198:34:15,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28811/203307 [32:47:08<198:34:08,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28811/203307 [32:47:08<198:34:08,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28812/203307 [32:47:13<198:34:07,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28812/203307 [32:47:13<198:34:07,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28813/203307 [32:47:17<198:34:04,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28813/203307 [32:47:17<198:34:04,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28814/203307 [32:47:21<198:34:01,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28814/203307 [32:47:21<198:34:01,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28815/203307 [32:47:26<198:33:58,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28815/203307 [32:47:26<198:33:59,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28816/203307 [32:47:29<198:33:52,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28816/203307 [32:47:29<198:33:53,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28817/203307 [32:47:34<198:33:50,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28817/203307 [32:47:34<198:33:50,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28818/203307 [32:47:38<198:33:47,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28818/203307 [32:47:38<198:33:47,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28819/203307 [32:47:42<198:33:40,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28819/203307 [32:47:42<198:33:40,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28820/203307 [32:47:45<198:33:34,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28820/203307 [32:47:45<198:33:34,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28821/203307 [32:47:50<198:33:32,  0.24it/s, v_num=t5e6, training/loss=0.0851]Epoch 0:  14%|█▍        | 28821/203307 [32:47:50<198:33:32,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28822/203307 [32:47:54<198:33:26,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28822/203307 [32:47:54<198:33:26,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28823/203307 [32:47:58<198:33:24,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28823/203307 [32:47:58<198:33:24,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28824/203307 [32:48:02<198:33:18,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28824/203307 [32:48:02<198:33:18,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28825/203307 [32:48:05<198:33:11,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28825/203307 [32:48:05<198:33:11,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28826/203307 [32:48:10<198:33:09,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28826/203307 [32:48:10<198:33:09,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28827/203307 [32:48:14<198:33:06,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28827/203307 [32:48:14<198:33:06,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28828/203307 [32:48:18<198:33:00,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28828/203307 [32:48:18<198:33:00,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28829/203307 [32:48:22<198:32:54,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28829/203307 [32:48:22<198:32:54,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28830/203307 [32:48:26<198:32:52,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28830/203307 [32:48:26<198:32:52,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28831/203307 [32:48:30<198:32:45,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28831/203307 [32:48:30<198:32:45,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28832/203307 [32:48:34<198:32:43,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28832/203307 [32:48:34<198:32:43,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28833/203307 [32:48:38<198:32:36,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28833/203307 [32:48:38<198:32:36,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28834/203307 [32:48:42<198:32:33,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28834/203307 [32:48:42<198:32:33,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28835/203307 [32:48:46<198:32:27,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28835/203307 [32:48:46<198:32:27,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28836/203307 [32:48:50<198:32:24,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28836/203307 [32:48:50<198:32:24,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28837/203307 [32:48:54<198:32:18,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28837/203307 [32:48:54<198:32:18,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28838/203307 [32:48:58<198:32:16,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28838/203307 [32:48:58<198:32:16,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28839/203307 [32:49:02<198:32:09,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28839/203307 [32:49:02<198:32:09,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28840/203307 [32:49:06<198:32:03,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28840/203307 [32:49:06<198:32:03,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28841/203307 [32:49:10<198:32:01,  0.24it/s, v_num=t5e6, training/loss=0.0828]Epoch 0:  14%|█▍        | 28841/203307 [32:49:10<198:32:01,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28842/203307 [32:49:14<198:31:55,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28842/203307 [32:49:14<198:31:55,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28843/203307 [32:49:18<198:31:52,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28843/203307 [32:49:18<198:31:52,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28844/203307 [32:49:23<198:31:50,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28844/203307 [32:49:23<198:31:50,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28845/203307 [32:49:26<198:31:44,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28845/203307 [32:49:26<198:31:44,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28846/203307 [32:49:31<198:31:41,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28846/203307 [32:49:31<198:31:41,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28847/203307 [32:49:35<198:31:39,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28847/203307 [32:49:35<198:31:39,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28848/203307 [32:49:39<198:31:32,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28848/203307 [32:49:39<198:31:32,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28849/203307 [32:49:43<198:31:30,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28849/203307 [32:49:43<198:31:30,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28850/203307 [32:49:47<198:31:27,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28850/203307 [32:49:47<198:31:27,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28851/203307 [32:49:51<198:31:20,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28851/203307 [32:49:51<198:31:20,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28852/203307 [32:49:55<198:31:17,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28852/203307 [32:49:55<198:31:17,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28853/203307 [32:50:00<198:31:14,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28853/203307 [32:50:00<198:31:14,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28854/203307 [32:50:03<198:31:08,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28854/203307 [32:50:03<198:31:08,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28855/203307 [32:50:08<198:31:05,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28855/203307 [32:50:08<198:31:05,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28856/203307 [32:50:12<198:31:03,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28856/203307 [32:50:12<198:31:03,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28857/203307 [32:50:16<198:30:57,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28857/203307 [32:50:16<198:30:57,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28858/203307 [32:50:20<198:30:55,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28858/203307 [32:50:20<198:30:55,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28859/203307 [32:50:25<198:30:52,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28859/203307 [32:50:25<198:30:52,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28860/203307 [32:50:29<198:30:49,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28860/203307 [32:50:29<198:30:49,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28861/203307 [32:50:33<198:30:43,  0.24it/s, v_num=t5e6, training/loss=0.0885]Epoch 0:  14%|█▍        | 28861/203307 [32:50:33<198:30:43,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28862/203307 [32:50:37<198:30:40,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28862/203307 [32:50:37<198:30:40,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28863/203307 [32:50:41<198:30:37,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28863/203307 [32:50:41<198:30:37,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28864/203307 [32:50:46<198:30:35,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28864/203307 [32:50:46<198:30:35,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28865/203307 [32:50:50<198:30:29,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28865/203307 [32:50:50<198:30:29,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28866/203307 [32:50:53<198:30:22,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28866/203307 [32:50:53<198:30:22,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28867/203307 [32:50:58<198:30:20,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28867/203307 [32:50:58<198:30:20,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28868/203307 [32:51:02<198:30:17,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28868/203307 [32:51:02<198:30:17,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28869/203307 [32:51:06<198:30:14,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28869/203307 [32:51:06<198:30:14,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28870/203307 [32:51:10<198:30:11,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28870/203307 [32:51:10<198:30:11,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28871/203307 [32:51:15<198:30:08,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28871/203307 [32:51:15<198:30:08,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28872/203307 [32:51:18<198:30:02,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28872/203307 [32:51:19<198:30:02,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28873/203307 [32:51:23<198:30:00,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28873/203307 [32:51:23<198:30:00,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28874/203307 [32:51:27<198:29:54,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28874/203307 [32:51:27<198:29:54,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28875/203307 [32:51:31<198:29:52,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28875/203307 [32:51:31<198:29:52,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28876/203307 [32:51:35<198:29:46,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28876/203307 [32:51:35<198:29:46,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28877/203307 [32:51:39<198:29:44,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28877/203307 [32:51:39<198:29:44,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28878/203307 [32:51:44<198:29:41,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28878/203307 [32:51:44<198:29:41,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28879/203307 [32:51:48<198:29:39,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28879/203307 [32:51:48<198:29:39,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28880/203307 [32:51:52<198:29:36,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28880/203307 [32:51:52<198:29:36,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28881/203307 [32:51:56<198:29:30,  0.24it/s, v_num=t5e6, training/loss=0.0848]Epoch 0:  14%|█▍        | 28881/203307 [32:51:56<198:29:30,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28882/203307 [32:52:01<198:29:28,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28882/203307 [32:52:01<198:29:28,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28883/203307 [32:52:04<198:29:22,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28883/203307 [32:52:04<198:29:22,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28884/203307 [32:52:09<198:29:20,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28884/203307 [32:52:09<198:29:20,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28885/203307 [32:52:13<198:29:14,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28885/203307 [32:52:13<198:29:14,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28886/203307 [32:52:17<198:29:12,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28886/203307 [32:52:17<198:29:12,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28887/203307 [32:52:21<198:29:06,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28887/203307 [32:52:21<198:29:06,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28888/203307 [32:52:25<198:29:03,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28888/203307 [32:52:25<198:29:03,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28889/203307 [32:52:29<198:28:57,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28889/203307 [32:52:29<198:28:57,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28890/203307 [32:52:34<198:28:56,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28890/203307 [32:52:34<198:28:56,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28891/203307 [32:52:37<198:28:50,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28891/203307 [32:52:37<198:28:50,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28892/203307 [32:52:41<198:28:44,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28892/203307 [32:52:41<198:28:44,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28893/203307 [32:52:46<198:28:43,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28893/203307 [32:52:46<198:28:43,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28894/203307 [32:52:50<198:28:37,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28894/203307 [32:52:50<198:28:37,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28895/203307 [32:52:54<198:28:35,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28895/203307 [32:52:54<198:28:35,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28896/203307 [32:52:58<198:28:32,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28896/203307 [32:52:58<198:28:32,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28897/203307 [32:53:02<198:28:26,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28897/203307 [32:53:02<198:28:26,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28898/203307 [32:53:06<198:28:19,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28898/203307 [32:53:06<198:28:19,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28899/203307 [32:53:10<198:28:18,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28899/203307 [32:53:10<198:28:18,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28900/203307 [32:53:14<198:28:12,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28900/203307 [32:53:14<198:28:12,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28901/203307 [32:53:18<198:28:10,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  14%|█▍        | 28901/203307 [32:53:18<198:28:10,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28902/203307 [32:53:22<198:28:04,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28902/203307 [32:53:22<198:28:04,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28903/203307 [32:53:26<198:27:57,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28903/203307 [32:53:26<198:27:57,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28904/203307 [32:53:30<198:27:55,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28904/203307 [32:53:30<198:27:55,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28905/203307 [32:53:35<198:27:52,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28905/203307 [32:53:35<198:27:52,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28906/203307 [32:53:38<198:27:46,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28906/203307 [32:53:38<198:27:46,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28907/203307 [32:53:42<198:27:39,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28907/203307 [32:53:42<198:27:39,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28908/203307 [32:53:46<198:27:37,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28908/203307 [32:53:46<198:27:37,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28909/203307 [32:53:50<198:27:31,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28909/203307 [32:53:50<198:27:31,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28910/203307 [32:53:55<198:27:29,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28910/203307 [32:53:55<198:27:29,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28911/203307 [32:53:58<198:27:23,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28911/203307 [32:53:58<198:27:23,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28912/203307 [32:54:03<198:27:20,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28912/203307 [32:54:03<198:27:20,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28913/203307 [32:54:07<198:27:17,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28913/203307 [32:54:07<198:27:17,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28914/203307 [32:54:11<198:27:14,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28914/203307 [32:54:11<198:27:15,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28915/203307 [32:54:15<198:27:08,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28915/203307 [32:54:15<198:27:08,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28916/203307 [32:54:20<198:27:06,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28916/203307 [32:54:20<198:27:06,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28917/203307 [32:54:23<198:27:00,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28917/203307 [32:54:23<198:27:00,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28918/203307 [32:54:27<198:26:54,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28918/203307 [32:54:27<198:26:54,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28919/203307 [32:54:32<198:26:52,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28919/203307 [32:54:32<198:26:52,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28920/203307 [32:54:35<198:26:46,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28920/203307 [32:54:35<198:26:46,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28921/203307 [32:54:40<198:26:44,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  14%|█▍        | 28921/203307 [32:54:40<198:26:44,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28922/203307 [32:54:44<198:26:41,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28922/203307 [32:54:44<198:26:41,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28923/203307 [32:54:48<198:26:35,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28923/203307 [32:54:48<198:26:35,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28924/203307 [32:54:52<198:26:29,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28924/203307 [32:54:52<198:26:29,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28925/203307 [32:54:56<198:26:27,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28925/203307 [32:54:56<198:26:27,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28926/203307 [32:55:00<198:26:21,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28926/203307 [32:55:00<198:26:21,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28927/203307 [32:55:04<198:26:18,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28927/203307 [32:55:04<198:26:18,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28928/203307 [32:55:08<198:26:12,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28928/203307 [32:55:08<198:26:12,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28929/203307 [32:55:12<198:26:05,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28929/203307 [32:55:12<198:26:05,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28930/203307 [32:55:16<198:26:04,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28930/203307 [32:55:16<198:26:04,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28931/203307 [32:55:20<198:26:02,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28931/203307 [32:55:20<198:26:02,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28932/203307 [32:55:24<198:25:55,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28932/203307 [32:55:24<198:25:55,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28933/203307 [32:55:28<198:25:49,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28933/203307 [32:55:28<198:25:49,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28934/203307 [32:55:32<198:25:47,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28934/203307 [32:55:32<198:25:47,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28935/203307 [32:55:36<198:25:41,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28935/203307 [32:55:36<198:25:41,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28936/203307 [32:55:41<198:25:39,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28936/203307 [32:55:41<198:25:39,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28937/203307 [32:55:44<198:25:32,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28937/203307 [32:55:44<198:25:32,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28938/203307 [32:55:48<198:25:29,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28938/203307 [32:55:48<198:25:29,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28939/203307 [32:55:52<198:25:23,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28939/203307 [32:55:52<198:25:23,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28940/203307 [32:55:57<198:25:20,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28940/203307 [32:55:57<198:25:20,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28941/203307 [32:56:00<198:25:13,  0.24it/s, v_num=t5e6, training/loss=0.0857]Epoch 0:  14%|█▍        | 28941/203307 [32:56:00<198:25:14,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28942/203307 [32:56:05<198:25:11,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28942/203307 [32:56:05<198:25:11,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28943/203307 [32:56:08<198:25:05,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28943/203307 [32:56:08<198:25:05,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28944/203307 [32:56:12<198:24:58,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28944/203307 [32:56:12<198:24:58,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28945/203307 [32:56:17<198:24:56,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28945/203307 [32:56:17<198:24:56,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28946/203307 [32:56:21<198:24:53,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28946/203307 [32:56:21<198:24:53,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28947/203307 [32:56:25<198:24:50,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28947/203307 [32:56:25<198:24:50,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28948/203307 [32:56:29<198:24:47,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28948/203307 [32:56:29<198:24:47,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28949/203307 [32:56:33<198:24:44,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28949/203307 [32:56:33<198:24:44,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28950/203307 [32:56:37<198:24:37,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28950/203307 [32:56:37<198:24:37,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28951/203307 [32:56:42<198:24:35,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28951/203307 [32:56:42<198:24:35,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28952/203307 [32:56:45<198:24:29,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28952/203307 [32:56:45<198:24:29,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28953/203307 [32:56:50<198:24:27,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28953/203307 [32:56:50<198:24:27,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28954/203307 [32:56:53<198:24:20,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28954/203307 [32:56:54<198:24:20,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28955/203307 [32:56:58<198:24:17,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28955/203307 [32:56:58<198:24:17,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28956/203307 [32:57:02<198:24:14,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28956/203307 [32:57:02<198:24:14,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28957/203307 [32:57:06<198:24:11,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28957/203307 [32:57:06<198:24:11,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28958/203307 [32:57:10<198:24:08,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28958/203307 [32:57:11<198:24:08,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28959/203307 [32:57:14<198:24:01,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28959/203307 [32:57:14<198:24:01,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28960/203307 [32:57:19<198:23:59,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28960/203307 [32:57:19<198:23:59,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28961/203307 [32:57:22<198:23:53,  0.24it/s, v_num=t5e6, training/loss=0.0801]Epoch 0:  14%|█▍        | 28961/203307 [32:57:22<198:23:53,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28962/203307 [32:57:27<198:23:51,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28962/203307 [32:57:27<198:23:51,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28963/203307 [32:57:31<198:23:47,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28963/203307 [32:57:31<198:23:47,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28964/203307 [32:57:35<198:23:44,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28964/203307 [32:57:35<198:23:44,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28965/203307 [32:57:39<198:23:38,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28965/203307 [32:57:39<198:23:38,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28966/203307 [32:57:43<198:23:35,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28966/203307 [32:57:43<198:23:35,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28967/203307 [32:57:47<198:23:31,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28967/203307 [32:57:47<198:23:31,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28968/203307 [32:57:52<198:23:28,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28968/203307 [32:57:52<198:23:28,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28969/203307 [32:57:55<198:23:22,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28969/203307 [32:57:55<198:23:22,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28970/203307 [32:57:59<198:23:14,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28970/203307 [32:57:59<198:23:15,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28971/203307 [32:58:03<198:23:13,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28971/203307 [32:58:03<198:23:13,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28972/203307 [32:58:07<198:23:06,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28972/203307 [32:58:07<198:23:06,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28973/203307 [32:58:11<198:23:03,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28973/203307 [32:58:11<198:23:03,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28974/203307 [32:58:16<198:22:59,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28974/203307 [32:58:16<198:22:59,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28975/203307 [32:58:19<198:22:53,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28975/203307 [32:58:19<198:22:53,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28976/203307 [32:58:23<198:22:49,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28976/203307 [32:58:23<198:22:49,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28977/203307 [32:58:28<198:22:47,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28977/203307 [32:58:28<198:22:47,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28978/203307 [32:58:32<198:22:40,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28978/203307 [32:58:32<198:22:40,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28979/203307 [32:58:36<198:22:38,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28979/203307 [32:58:36<198:22:38,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28980/203307 [32:58:40<198:22:34,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28980/203307 [32:58:40<198:22:34,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28981/203307 [32:58:44<198:22:28,  0.24it/s, v_num=t5e6, training/loss=0.0826]Epoch 0:  14%|█▍        | 28981/203307 [32:58:44<198:22:28,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28982/203307 [32:58:48<198:22:25,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28982/203307 [32:58:48<198:22:25,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28983/203307 [32:58:52<198:22:22,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28983/203307 [32:58:52<198:22:22,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28984/203307 [32:58:56<198:22:15,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28984/203307 [32:58:56<198:22:15,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28985/203307 [32:59:00<198:22:11,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28985/203307 [32:59:00<198:22:11,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28986/203307 [32:59:05<198:22:10,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28986/203307 [32:59:05<198:22:10,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28987/203307 [32:59:08<198:22:03,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28987/203307 [32:59:08<198:22:03,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28988/203307 [32:59:13<198:22:02,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28988/203307 [32:59:13<198:22:02,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28989/203307 [32:59:17<198:21:55,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28989/203307 [32:59:17<198:21:56,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28990/203307 [32:59:21<198:21:53,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28990/203307 [32:59:21<198:21:53,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28991/203307 [32:59:25<198:21:48,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28991/203307 [32:59:25<198:21:48,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28992/203307 [32:59:29<198:21:45,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28992/203307 [32:59:29<198:21:45,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28993/203307 [32:59:33<198:21:39,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28993/203307 [32:59:33<198:21:39,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28994/203307 [32:59:37<198:21:37,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28994/203307 [32:59:37<198:21:37,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28995/203307 [32:59:41<198:21:31,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28995/203307 [32:59:41<198:21:31,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28996/203307 [32:59:46<198:21:28,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28996/203307 [32:59:46<198:21:28,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28997/203307 [32:59:50<198:21:26,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28997/203307 [32:59:50<198:21:26,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28998/203307 [32:59:54<198:21:20,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28998/203307 [32:59:54<198:21:20,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28999/203307 [32:59:58<198:21:17,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 28999/203307 [32:59:58<198:21:17,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 29000/203307 [33:00:02<198:21:14,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 29000/203307 [33:00:02<198:21:14,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 29001/203307 [33:00:06<198:21:08,  0.24it/s, v_num=t5e6, training/loss=0.0909]Epoch 0:  14%|█▍        | 29001/203307 [33:00:06<198:21:08,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29002/203307 [33:00:10<198:21:03,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29002/203307 [33:00:10<198:21:03,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29003/203307 [33:00:14<198:21:01,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29003/203307 [33:00:14<198:21:01,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29004/203307 [33:00:18<198:20:55,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29004/203307 [33:00:18<198:20:55,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29005/203307 [33:00:23<198:20:53,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29005/203307 [33:00:23<198:20:53,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29006/203307 [33:00:27<198:20:47,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29006/203307 [33:00:27<198:20:48,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29007/203307 [33:00:30<198:20:41,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29007/203307 [33:00:30<198:20:41,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29008/203307 [33:00:35<198:20:39,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29008/203307 [33:00:35<198:20:39,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29009/203307 [33:00:39<198:20:37,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29009/203307 [33:00:39<198:20:37,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29010/203307 [33:00:43<198:20:31,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29010/203307 [33:00:43<198:20:31,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29011/203307 [33:00:47<198:20:25,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29011/203307 [33:00:47<198:20:25,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29012/203307 [33:00:51<198:20:23,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29012/203307 [33:00:51<198:20:23,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29013/203307 [33:00:55<198:20:20,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29013/203307 [33:00:55<198:20:20,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29014/203307 [33:01:00<198:20:18,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29014/203307 [33:01:00<198:20:18,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29015/203307 [33:01:04<198:20:12,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29015/203307 [33:01:04<198:20:12,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29016/203307 [33:01:08<198:20:10,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29016/203307 [33:01:08<198:20:10,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29017/203307 [33:01:12<198:20:04,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29017/203307 [33:01:12<198:20:04,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29018/203307 [33:01:16<198:20:01,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29018/203307 [33:01:16<198:20:01,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29019/203307 [33:01:20<198:19:55,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29019/203307 [33:01:20<198:19:55,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29020/203307 [33:01:24<198:19:53,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29020/203307 [33:01:24<198:19:53,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29021/203307 [33:01:29<198:19:50,  0.24it/s, v_num=t5e6, training/loss=0.0785]Epoch 0:  14%|█▍        | 29021/203307 [33:01:29<198:19:50,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29022/203307 [33:01:33<198:19:45,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29022/203307 [33:01:33<198:19:45,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29023/203307 [33:01:37<198:19:43,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29023/203307 [33:01:37<198:19:43,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29024/203307 [33:01:41<198:19:37,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29024/203307 [33:01:41<198:19:37,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29025/203307 [33:01:45<198:19:34,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29025/203307 [33:01:45<198:19:34,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29026/203307 [33:01:50<198:19:32,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29026/203307 [33:01:50<198:19:32,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29027/203307 [33:01:53<198:19:25,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29027/203307 [33:01:53<198:19:25,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29028/203307 [33:01:57<198:19:18,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29028/203307 [33:01:57<198:19:18,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29029/203307 [33:02:02<198:19:18,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29029/203307 [33:02:02<198:19:18,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29030/203307 [33:02:06<198:19:15,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29030/203307 [33:02:06<198:19:15,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29031/203307 [33:02:10<198:19:13,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29031/203307 [33:02:10<198:19:13,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29032/203307 [33:02:14<198:19:07,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29032/203307 [33:02:14<198:19:07,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29033/203307 [33:02:18<198:19:01,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29033/203307 [33:02:18<198:19:01,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29034/203307 [33:02:22<198:18:59,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29034/203307 [33:02:22<198:18:59,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29035/203307 [33:02:27<198:18:57,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29035/203307 [33:02:27<198:18:57,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29036/203307 [33:02:31<198:18:53,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29036/203307 [33:02:31<198:18:53,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29037/203307 [33:02:35<198:18:46,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29037/203307 [33:02:35<198:18:46,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29038/203307 [33:02:39<198:18:45,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29038/203307 [33:02:39<198:18:45,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29039/203307 [33:02:43<198:18:41,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29039/203307 [33:02:43<198:18:41,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29040/203307 [33:02:48<198:18:39,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29040/203307 [33:02:48<198:18:39,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29041/203307 [33:02:51<198:18:32,  0.24it/s, v_num=t5e6, training/loss=0.0898]Epoch 0:  14%|█▍        | 29041/203307 [33:02:51<198:18:32,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29042/203307 [33:02:56<198:18:29,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29042/203307 [33:02:56<198:18:29,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29043/203307 [33:02:59<198:18:23,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29043/203307 [33:02:59<198:18:23,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29044/203307 [33:03:04<198:18:20,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29044/203307 [33:03:04<198:18:20,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29045/203307 [33:03:07<198:18:14,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29045/203307 [33:03:07<198:18:14,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29046/203307 [33:03:12<198:18:12,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29046/203307 [33:03:12<198:18:12,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29047/203307 [33:03:16<198:18:06,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29047/203307 [33:03:16<198:18:06,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29048/203307 [33:03:20<198:18:02,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29048/203307 [33:03:20<198:18:02,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29049/203307 [33:03:24<198:18:00,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29049/203307 [33:03:24<198:18:00,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29050/203307 [33:03:28<198:17:54,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29050/203307 [33:03:28<198:17:54,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29051/203307 [33:03:32<198:17:52,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29051/203307 [33:03:32<198:17:52,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29052/203307 [33:03:37<198:17:48,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29052/203307 [33:03:37<198:17:48,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29053/203307 [33:03:40<198:17:42,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29053/203307 [33:03:40<198:17:42,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29054/203307 [33:03:44<198:17:36,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29054/203307 [33:03:44<198:17:36,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29055/203307 [33:03:49<198:17:34,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29055/203307 [33:03:49<198:17:34,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29056/203307 [33:03:52<198:17:27,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29056/203307 [33:03:52<198:17:27,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29057/203307 [33:03:57<198:17:25,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29057/203307 [33:03:57<198:17:25,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29058/203307 [33:04:00<198:17:19,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29058/203307 [33:04:00<198:17:19,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29059/203307 [33:04:04<198:17:12,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29059/203307 [33:04:04<198:17:12,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29060/203307 [33:04:08<198:17:10,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29060/203307 [33:04:08<198:17:10,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29061/203307 [33:04:13<198:17:08,  0.24it/s, v_num=t5e6, training/loss=0.0852]Epoch 0:  14%|█▍        | 29061/203307 [33:04:13<198:17:08,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29062/203307 [33:04:16<198:17:01,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29062/203307 [33:04:16<198:17:01,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29063/203307 [33:04:21<198:16:58,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29063/203307 [33:04:21<198:16:58,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29064/203307 [33:04:25<198:16:57,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29064/203307 [33:04:25<198:16:57,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29065/203307 [33:04:29<198:16:50,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29065/203307 [33:04:29<198:16:50,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29066/203307 [33:04:33<198:16:48,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29066/203307 [33:04:33<198:16:48,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29067/203307 [33:04:37<198:16:42,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29067/203307 [33:04:37<198:16:42,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29068/203307 [33:04:41<198:16:39,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29068/203307 [33:04:41<198:16:39,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29069/203307 [33:04:45<198:16:32,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29069/203307 [33:04:45<198:16:32,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29070/203307 [33:04:49<198:16:29,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29070/203307 [33:04:49<198:16:29,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29071/203307 [33:04:54<198:16:26,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29071/203307 [33:04:54<198:16:26,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29072/203307 [33:04:58<198:16:24,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29072/203307 [33:04:58<198:16:24,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29073/203307 [33:05:02<198:16:18,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29073/203307 [33:05:02<198:16:18,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29074/203307 [33:05:05<198:16:11,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29074/203307 [33:05:05<198:16:11,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29075/203307 [33:05:10<198:16:08,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29075/203307 [33:05:10<198:16:08,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29076/203307 [33:05:14<198:16:02,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29076/203307 [33:05:14<198:16:02,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29077/203307 [33:05:18<198:16:00,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29077/203307 [33:05:18<198:16:00,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29078/203307 [33:05:22<198:15:56,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29078/203307 [33:05:22<198:15:56,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29079/203307 [33:05:26<198:15:50,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29079/203307 [33:05:26<198:15:51,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29080/203307 [33:05:30<198:15:48,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29080/203307 [33:05:30<198:15:48,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29081/203307 [33:05:35<198:15:46,  0.24it/s, v_num=t5e6, training/loss=0.0901]Epoch 0:  14%|█▍        | 29081/203307 [33:05:35<198:15:46,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29082/203307 [33:05:39<198:15:40,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29082/203307 [33:05:39<198:15:40,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29083/203307 [33:05:43<198:15:38,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29083/203307 [33:05:43<198:15:38,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29084/203307 [33:05:47<198:15:35,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29084/203307 [33:05:47<198:15:35,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29085/203307 [33:05:51<198:15:28,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29085/203307 [33:05:51<198:15:28,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29086/203307 [33:05:55<198:15:25,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29086/203307 [33:05:55<198:15:25,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29087/203307 [33:06:00<198:15:22,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29087/203307 [33:06:00<198:15:22,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29088/203307 [33:06:04<198:15:19,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29088/203307 [33:06:04<198:15:19,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29089/203307 [33:06:08<198:15:13,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29089/203307 [33:06:08<198:15:13,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29090/203307 [33:06:12<198:15:11,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29090/203307 [33:06:12<198:15:11,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29091/203307 [33:06:16<198:15:05,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29091/203307 [33:06:16<198:15:05,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29092/203307 [33:06:20<198:15:03,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29092/203307 [33:06:20<198:15:03,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29093/203307 [33:06:24<198:15:00,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29093/203307 [33:06:24<198:15:00,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29094/203307 [33:06:29<198:14:57,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29094/203307 [33:06:29<198:14:57,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29095/203307 [33:06:33<198:14:51,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29095/203307 [33:06:33<198:14:51,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29096/203307 [33:06:37<198:14:49,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29096/203307 [33:06:37<198:14:49,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29097/203307 [33:06:41<198:14:43,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29097/203307 [33:06:41<198:14:43,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29098/203307 [33:06:45<198:14:41,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29098/203307 [33:06:45<198:14:41,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29099/203307 [33:06:49<198:14:35,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29099/203307 [33:06:49<198:14:35,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29100/203307 [33:06:53<198:14:29,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29100/203307 [33:06:53<198:14:29,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29101/203307 [33:06:57<198:14:27,  0.24it/s, v_num=t5e6, training/loss=0.0825]Epoch 0:  14%|█▍        | 29101/203307 [33:06:57<198:14:28,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29102/203307 [33:07:02<198:14:24,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29102/203307 [33:07:02<198:14:24,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29103/203307 [33:07:06<198:14:22,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29103/203307 [33:07:06<198:14:22,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29104/203307 [33:07:10<198:14:19,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29104/203307 [33:07:10<198:14:19,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29105/203307 [33:07:14<198:14:16,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29105/203307 [33:07:14<198:14:16,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29106/203307 [33:07:18<198:14:10,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29106/203307 [33:07:18<198:14:10,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29107/203307 [33:07:23<198:14:08,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29107/203307 [33:07:23<198:14:08,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29108/203307 [33:07:26<198:14:02,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29108/203307 [33:07:26<198:14:02,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29109/203307 [33:07:31<198:14:00,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29109/203307 [33:07:31<198:14:00,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29110/203307 [33:07:35<198:13:54,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29110/203307 [33:07:35<198:13:54,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29111/203307 [33:07:39<198:13:50,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29111/203307 [33:07:39<198:13:50,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29112/203307 [33:07:43<198:13:48,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29112/203307 [33:07:43<198:13:48,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29113/203307 [33:07:48<198:13:45,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29113/203307 [33:07:48<198:13:45,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29114/203307 [33:07:51<198:13:39,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29114/203307 [33:07:51<198:13:39,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29115/203307 [33:07:55<198:13:33,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29115/203307 [33:07:55<198:13:33,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29116/203307 [33:08:00<198:13:32,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29116/203307 [33:08:00<198:13:32,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29117/203307 [33:08:03<198:13:26,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29117/203307 [33:08:03<198:13:26,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29118/203307 [33:08:08<198:13:24,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29118/203307 [33:08:08<198:13:24,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29119/203307 [33:08:12<198:13:17,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29119/203307 [33:08:12<198:13:17,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29120/203307 [33:08:16<198:13:15,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29120/203307 [33:08:16<198:13:15,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29121/203307 [33:08:20<198:13:12,  0.24it/s, v_num=t5e6, training/loss=0.0799]Epoch 0:  14%|█▍        | 29121/203307 [33:08:20<198:13:12,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29122/203307 [33:08:25<198:13:09,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29122/203307 [33:08:25<198:13:09,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29123/203307 [33:08:28<198:13:03,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29123/203307 [33:08:28<198:13:03,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29124/203307 [33:08:33<198:13:02,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29124/203307 [33:08:33<198:13:02,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29125/203307 [33:08:37<198:12:56,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29125/203307 [33:08:37<198:12:56,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29126/203307 [33:08:41<198:12:51,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29126/203307 [33:08:41<198:12:51,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29127/203307 [33:08:45<198:12:49,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29127/203307 [33:08:45<198:12:49,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29128/203307 [33:08:49<198:12:43,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29128/203307 [33:08:49<198:12:43,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29129/203307 [33:08:53<198:12:41,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29129/203307 [33:08:53<198:12:41,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29130/203307 [33:08:58<198:12:38,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29130/203307 [33:08:58<198:12:38,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29131/203307 [33:09:01<198:12:32,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29131/203307 [33:09:01<198:12:32,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29132/203307 [33:09:05<198:12:26,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29132/203307 [33:09:05<198:12:26,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29133/203307 [33:09:10<198:12:25,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29133/203307 [33:09:10<198:12:25,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29134/203307 [33:09:13<198:12:18,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29134/203307 [33:09:13<198:12:18,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29135/203307 [33:09:18<198:12:16,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29135/203307 [33:09:18<198:12:16,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29136/203307 [33:09:22<198:12:10,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29136/203307 [33:09:22<198:12:10,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29137/203307 [33:09:25<198:12:04,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29137/203307 [33:09:25<198:12:04,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29138/203307 [33:09:30<198:12:02,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29138/203307 [33:09:30<198:12:02,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29139/203307 [33:09:34<198:11:59,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29139/203307 [33:09:34<198:11:59,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29140/203307 [33:09:38<198:11:53,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29140/203307 [33:09:38<198:11:53,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29141/203307 [33:09:42<198:11:48,  0.24it/s, v_num=t5e6, training/loss=0.0744]Epoch 0:  14%|█▍        | 29141/203307 [33:09:42<198:11:48,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29142/203307 [33:09:46<198:11:46,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29142/203307 [33:09:46<198:11:46,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29143/203307 [33:09:50<198:11:40,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29143/203307 [33:09:50<198:11:40,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29144/203307 [33:09:55<198:11:38,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29144/203307 [33:09:55<198:11:38,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29145/203307 [33:09:58<198:11:32,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29145/203307 [33:09:58<198:11:32,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29146/203307 [33:10:03<198:11:29,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29146/203307 [33:10:03<198:11:29,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29147/203307 [33:10:07<198:11:26,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29147/203307 [33:10:07<198:11:26,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29148/203307 [33:10:11<198:11:24,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29148/203307 [33:10:11<198:11:24,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29149/203307 [33:10:15<198:11:17,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29149/203307 [33:10:15<198:11:17,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29150/203307 [33:10:20<198:11:16,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29150/203307 [33:10:20<198:11:16,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29151/203307 [33:10:23<198:11:10,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29151/203307 [33:10:23<198:11:10,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29152/203307 [33:10:27<198:11:04,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29152/203307 [33:10:27<198:11:04,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29153/203307 [33:10:32<198:11:02,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29153/203307 [33:10:32<198:11:02,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29154/203307 [33:10:35<198:10:56,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29154/203307 [33:10:35<198:10:56,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29155/203307 [33:10:40<198:10:54,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29155/203307 [33:10:40<198:10:54,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29156/203307 [33:10:44<198:10:51,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29156/203307 [33:10:44<198:10:51,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29157/203307 [33:10:48<198:10:45,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29157/203307 [33:10:48<198:10:45,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29158/203307 [33:10:52<198:10:40,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29158/203307 [33:10:52<198:10:40,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29159/203307 [33:10:56<198:10:38,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29159/203307 [33:10:56<198:10:38,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29160/203307 [33:11:00<198:10:32,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29160/203307 [33:11:00<198:10:32,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29161/203307 [33:11:04<198:10:30,  0.24it/s, v_num=t5e6, training/loss=0.0773]Epoch 0:  14%|█▍        | 29161/203307 [33:11:04<198:10:30,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29162/203307 [33:11:08<198:10:24,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29162/203307 [33:11:08<198:10:24,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29163/203307 [33:11:13<198:10:21,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29163/203307 [33:11:13<198:10:21,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29164/203307 [33:11:17<198:10:19,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29164/203307 [33:11:17<198:10:19,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29165/203307 [33:11:21<198:10:16,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29165/203307 [33:11:21<198:10:16,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29166/203307 [33:11:25<198:10:10,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29166/203307 [33:11:25<198:10:10,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29167/203307 [33:11:29<198:10:04,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29167/203307 [33:11:29<198:10:04,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29168/203307 [33:11:33<198:10:02,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29168/203307 [33:11:33<198:10:02,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29169/203307 [33:11:37<198:09:56,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29169/203307 [33:11:37<198:09:56,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29170/203307 [33:11:42<198:09:55,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29170/203307 [33:11:42<198:09:55,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29171/203307 [33:11:46<198:09:51,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29171/203307 [33:11:46<198:09:51,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29172/203307 [33:11:50<198:09:49,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29172/203307 [33:11:50<198:09:49,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29173/203307 [33:11:54<198:09:43,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29173/203307 [33:11:54<198:09:43,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29174/203307 [33:11:58<198:09:40,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29174/203307 [33:11:58<198:09:41,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29175/203307 [33:12:02<198:09:34,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29175/203307 [33:12:02<198:09:35,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29176/203307 [33:12:07<198:09:33,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29176/203307 [33:12:07<198:09:33,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29177/203307 [33:12:10<198:09:27,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29177/203307 [33:12:10<198:09:27,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29178/203307 [33:12:14<198:09:20,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29178/203307 [33:12:14<198:09:20,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29179/203307 [33:12:18<198:09:18,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29179/203307 [33:12:18<198:09:18,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29180/203307 [33:12:23<198:09:15,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29180/203307 [33:12:23<198:09:15,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29181/203307 [33:12:27<198:09:12,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29181/203307 [33:12:27<198:09:12,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29182/203307 [33:12:31<198:09:09,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29182/203307 [33:12:31<198:09:09,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29183/203307 [33:12:36<198:09:05,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29183/203307 [33:12:36<198:09:05,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29184/203307 [33:12:39<198:08:59,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29184/203307 [33:12:39<198:08:59,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29185/203307 [33:12:44<198:08:57,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29185/203307 [33:12:44<198:08:57,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29186/203307 [33:12:47<198:08:50,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29186/203307 [33:12:47<198:08:50,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29187/203307 [33:12:52<198:08:48,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29187/203307 [33:12:52<198:08:48,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29188/203307 [33:12:56<198:08:44,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29188/203307 [33:12:56<198:08:44,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29189/203307 [33:13:00<198:08:38,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29189/203307 [33:13:00<198:08:38,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29190/203307 [33:13:04<198:08:36,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29190/203307 [33:13:04<198:08:36,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29191/203307 [33:13:08<198:08:32,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29191/203307 [33:13:08<198:08:32,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29192/203307 [33:13:12<198:08:29,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29192/203307 [33:13:12<198:08:29,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29193/203307 [33:13:16<198:08:23,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29193/203307 [33:13:16<198:08:23,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29194/203307 [33:13:21<198:08:20,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29194/203307 [33:13:21<198:08:20,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29195/203307 [33:13:24<198:08:14,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29195/203307 [33:13:24<198:08:14,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29196/203307 [33:13:29<198:08:12,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29196/203307 [33:13:29<198:08:12,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29197/203307 [33:13:33<198:08:06,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29197/203307 [33:13:33<198:08:06,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29198/203307 [33:13:37<198:08:03,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29198/203307 [33:13:37<198:08:03,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29199/203307 [33:13:41<198:07:57,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29199/203307 [33:13:41<198:07:57,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29200/203307 [33:13:45<198:07:55,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29200/203307 [33:13:45<198:07:55,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29201/203307 [33:13:49<198:07:52,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  14%|█▍        | 29201/203307 [33:13:49<198:07:52,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29202/203307 [33:13:54<198:07:50,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29202/203307 [33:13:54<198:07:50,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29203/203307 [33:13:58<198:07:44,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29203/203307 [33:13:58<198:07:44,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29204/203307 [33:14:01<198:07:38,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29204/203307 [33:14:01<198:07:38,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29205/203307 [33:14:06<198:07:36,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29205/203307 [33:14:06<198:07:36,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29206/203307 [33:14:10<198:07:30,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29206/203307 [33:14:10<198:07:30,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29207/203307 [33:14:14<198:07:28,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29207/203307 [33:14:14<198:07:28,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29208/203307 [33:14:18<198:07:25,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29208/203307 [33:14:18<198:07:25,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29209/203307 [33:14:22<198:07:19,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29209/203307 [33:14:22<198:07:19,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29210/203307 [33:14:26<198:07:15,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29210/203307 [33:14:26<198:07:16,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29211/203307 [33:14:31<198:07:13,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29211/203307 [33:14:31<198:07:13,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29212/203307 [33:14:34<198:07:07,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29212/203307 [33:14:34<198:07:07,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29213/203307 [33:14:39<198:07:05,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29213/203307 [33:14:39<198:07:05,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29214/203307 [33:14:43<198:06:59,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29214/203307 [33:14:43<198:06:59,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29215/203307 [33:14:46<198:06:53,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29215/203307 [33:14:46<198:06:53,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29216/203307 [33:14:51<198:06:51,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29216/203307 [33:14:51<198:06:51,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29217/203307 [33:14:55<198:06:48,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29217/203307 [33:14:55<198:06:48,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29218/203307 [33:14:59<198:06:42,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29218/203307 [33:14:59<198:06:42,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29219/203307 [33:15:03<198:06:38,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29219/203307 [33:15:03<198:06:38,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29220/203307 [33:15:08<198:06:37,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29220/203307 [33:15:08<198:06:37,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29221/203307 [33:15:12<198:06:34,  0.24it/s, v_num=t5e6, training/loss=0.0757]Epoch 0:  14%|█▍        | 29221/203307 [33:15:12<198:06:34,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29222/203307 [33:15:16<198:06:31,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29222/203307 [33:15:16<198:06:31,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29223/203307 [33:15:20<198:06:25,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29223/203307 [33:15:20<198:06:25,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29224/203307 [33:15:24<198:06:22,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29224/203307 [33:15:24<198:06:22,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29225/203307 [33:15:28<198:06:16,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29225/203307 [33:15:28<198:06:16,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29226/203307 [33:15:32<198:06:13,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29226/203307 [33:15:32<198:06:13,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29227/203307 [33:15:36<198:06:06,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29227/203307 [33:15:36<198:06:06,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29228/203307 [33:15:40<198:06:04,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29228/203307 [33:15:40<198:06:04,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29229/203307 [33:15:44<198:05:58,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29229/203307 [33:15:44<198:05:58,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29230/203307 [33:15:49<198:05:56,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29230/203307 [33:15:49<198:05:56,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29231/203307 [33:15:53<198:05:53,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29231/203307 [33:15:53<198:05:53,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29232/203307 [33:15:57<198:05:47,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29232/203307 [33:15:57<198:05:47,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29233/203307 [33:16:01<198:05:44,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29233/203307 [33:16:01<198:05:44,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29234/203307 [33:16:05<198:05:41,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29234/203307 [33:16:05<198:05:41,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29235/203307 [33:16:09<198:05:34,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29235/203307 [33:16:09<198:05:34,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29236/203307 [33:16:13<198:05:28,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29236/203307 [33:16:13<198:05:28,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29237/203307 [33:16:17<198:05:28,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29237/203307 [33:16:17<198:05:28,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29238/203307 [33:16:22<198:05:25,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29238/203307 [33:16:22<198:05:25,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29239/203307 [33:16:26<198:05:23,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29239/203307 [33:16:26<198:05:23,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29240/203307 [33:16:30<198:05:16,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29240/203307 [33:16:30<198:05:16,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29241/203307 [33:16:34<198:05:11,  0.24it/s, v_num=t5e6, training/loss=0.0867]Epoch 0:  14%|█▍        | 29241/203307 [33:16:34<198:05:11,  0.24it/s, v_num=t5e6, training/loss=0.076] Epoch 0:  14%|█▍        | 29242/203307 [33:16:38<198:05:08,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29242/203307 [33:16:38<198:05:08,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29243/203307 [33:16:42<198:05:06,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29243/203307 [33:16:42<198:05:06,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29244/203307 [33:16:46<198:04:59,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29244/203307 [33:16:46<198:04:59,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29245/203307 [33:16:50<198:04:52,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29245/203307 [33:16:50<198:04:52,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29246/203307 [33:16:54<198:04:50,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29246/203307 [33:16:54<198:04:50,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29247/203307 [33:16:58<198:04:44,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29247/203307 [33:16:58<198:04:44,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29248/203307 [33:17:02<198:04:43,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29248/203307 [33:17:02<198:04:43,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29249/203307 [33:17:06<198:04:36,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29249/203307 [33:17:06<198:04:36,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29250/203307 [33:17:10<198:04:34,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29250/203307 [33:17:10<198:04:34,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29251/203307 [33:17:14<198:04:27,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29251/203307 [33:17:14<198:04:27,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29252/203307 [33:17:18<198:04:24,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29252/203307 [33:17:18<198:04:24,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29253/203307 [33:17:22<198:04:18,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29253/203307 [33:17:22<198:04:18,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29254/203307 [33:17:27<198:04:16,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29254/203307 [33:17:27<198:04:16,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29255/203307 [33:17:31<198:04:13,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29255/203307 [33:17:31<198:04:13,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29256/203307 [33:17:35<198:04:07,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29256/203307 [33:17:35<198:04:07,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29257/203307 [33:17:39<198:04:05,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29257/203307 [33:17:39<198:04:05,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29258/203307 [33:17:43<198:03:59,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29258/203307 [33:17:43<198:03:59,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29259/203307 [33:17:47<198:03:57,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29259/203307 [33:17:47<198:03:57,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29260/203307 [33:17:52<198:03:54,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29260/203307 [33:17:52<198:03:54,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29261/203307 [33:17:55<198:03:48,  0.24it/s, v_num=t5e6, training/loss=0.076]Epoch 0:  14%|█▍        | 29261/203307 [33:17:55<198:03:48,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29262/203307 [33:17:59<198:03:42,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29262/203307 [33:17:59<198:03:42,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29263/203307 [33:18:04<198:03:41,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29263/203307 [33:18:04<198:03:41,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29264/203307 [33:18:08<198:03:37,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29264/203307 [33:18:08<198:03:37,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29265/203307 [33:18:12<198:03:35,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29265/203307 [33:18:12<198:03:35,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29266/203307 [33:18:16<198:03:29,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29266/203307 [33:18:16<198:03:29,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29267/203307 [33:18:20<198:03:23,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29267/203307 [33:18:20<198:03:23,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29268/203307 [33:18:24<198:03:21,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29268/203307 [33:18:24<198:03:21,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29269/203307 [33:18:29<198:03:18,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29269/203307 [33:18:29<198:03:18,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29270/203307 [33:18:32<198:03:12,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29270/203307 [33:18:32<198:03:12,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29271/203307 [33:18:37<198:03:09,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29271/203307 [33:18:37<198:03:09,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29272/203307 [33:18:41<198:03:07,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29272/203307 [33:18:41<198:03:07,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29273/203307 [33:18:45<198:03:03,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29273/203307 [33:18:45<198:03:03,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29274/203307 [33:18:50<198:03:01,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29274/203307 [33:18:50<198:03:01,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29275/203307 [33:18:53<198:02:54,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29275/203307 [33:18:53<198:02:54,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29276/203307 [33:18:58<198:02:52,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29276/203307 [33:18:58<198:02:52,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29277/203307 [33:19:01<198:02:45,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29277/203307 [33:19:01<198:02:45,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29278/203307 [33:19:06<198:02:42,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29278/203307 [33:19:06<198:02:42,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29279/203307 [33:19:09<198:02:36,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29279/203307 [33:19:09<198:02:36,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29280/203307 [33:19:14<198:02:34,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29280/203307 [33:19:14<198:02:34,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29281/203307 [33:19:18<198:02:27,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29281/203307 [33:19:18<198:02:28,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29282/203307 [33:19:22<198:02:24,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29282/203307 [33:19:22<198:02:24,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29283/203307 [33:19:26<198:02:22,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29283/203307 [33:19:26<198:02:22,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29284/203307 [33:19:30<198:02:16,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29284/203307 [33:19:30<198:02:16,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29285/203307 [33:19:34<198:02:14,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29285/203307 [33:19:34<198:02:14,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29286/203307 [33:19:39<198:02:11,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29286/203307 [33:19:39<198:02:11,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29287/203307 [33:19:43<198:02:05,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29287/203307 [33:19:43<198:02:05,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29288/203307 [33:19:47<198:02:03,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29288/203307 [33:19:47<198:02:03,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29289/203307 [33:19:51<198:02:01,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29289/203307 [33:19:51<198:02:01,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29290/203307 [33:19:55<198:01:55,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29290/203307 [33:19:55<198:01:55,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29291/203307 [33:20:00<198:01:53,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29291/203307 [33:20:00<198:01:53,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29292/203307 [33:20:04<198:01:48,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29292/203307 [33:20:04<198:01:48,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29293/203307 [33:20:07<198:01:42,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29293/203307 [33:20:07<198:01:42,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29294/203307 [33:20:12<198:01:39,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29294/203307 [33:20:12<198:01:39,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29295/203307 [33:20:16<198:01:36,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29295/203307 [33:20:16<198:01:36,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29296/203307 [33:20:20<198:01:33,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29296/203307 [33:20:20<198:01:33,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29297/203307 [33:20:24<198:01:27,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29297/203307 [33:20:24<198:01:27,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29298/203307 [33:20:28<198:01:25,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29298/203307 [33:20:29<198:01:25,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29299/203307 [33:20:32<198:01:19,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29299/203307 [33:20:32<198:01:19,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29300/203307 [33:20:37<198:01:17,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29300/203307 [33:20:37<198:01:17,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29301/203307 [33:20:40<198:01:11,  0.24it/s, v_num=t5e6, training/loss=0.0903]Epoch 0:  14%|█▍        | 29301/203307 [33:20:40<198:01:11,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29302/203307 [33:20:45<198:01:08,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29302/203307 [33:20:45<198:01:08,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29303/203307 [33:20:48<198:01:02,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29303/203307 [33:20:48<198:01:02,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29304/203307 [33:20:53<198:00:59,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29304/203307 [33:20:53<198:00:59,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29305/203307 [33:20:57<198:00:56,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29305/203307 [33:20:57<198:00:56,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29306/203307 [33:21:01<198:00:54,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29306/203307 [33:21:01<198:00:54,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29307/203307 [33:21:05<198:00:48,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29307/203307 [33:21:05<198:00:48,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29308/203307 [33:21:09<198:00:41,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29308/203307 [33:21:09<198:00:41,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29309/203307 [33:21:13<198:00:39,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29309/203307 [33:21:13<198:00:39,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29310/203307 [33:21:17<198:00:33,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29310/203307 [33:21:17<198:00:33,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29311/203307 [33:21:22<198:00:30,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29311/203307 [33:21:22<198:00:31,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29312/203307 [33:21:26<198:00:28,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29312/203307 [33:21:26<198:00:28,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29313/203307 [33:21:30<198:00:25,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29313/203307 [33:21:30<198:00:25,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29314/203307 [33:21:34<198:00:19,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29314/203307 [33:21:34<198:00:19,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29315/203307 [33:21:38<198:00:17,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29315/203307 [33:21:38<198:00:17,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29316/203307 [33:21:42<198:00:11,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29316/203307 [33:21:42<198:00:11,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29317/203307 [33:21:46<198:00:08,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29317/203307 [33:21:46<198:00:08,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29318/203307 [33:21:51<198:00:04,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29318/203307 [33:21:51<198:00:05,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29319/203307 [33:21:54<197:59:58,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29319/203307 [33:21:54<197:59:58,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29320/203307 [33:21:59<197:59:55,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29320/203307 [33:21:59<197:59:55,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29321/203307 [33:22:03<197:59:52,  0.24it/s, v_num=t5e6, training/loss=0.0788]Epoch 0:  14%|█▍        | 29321/203307 [33:22:03<197:59:52,  0.24it/s, v_num=t5e6, training/loss=0.087] Epoch 0:  14%|█▍        | 29322/203307 [33:22:07<197:59:46,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29322/203307 [33:22:07<197:59:46,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29323/203307 [33:22:10<197:59:40,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29323/203307 [33:22:10<197:59:40,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29324/203307 [33:22:15<197:59:38,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29324/203307 [33:22:15<197:59:38,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29325/203307 [33:22:19<197:59:32,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29325/203307 [33:22:19<197:59:32,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29326/203307 [33:22:23<197:59:30,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29326/203307 [33:22:23<197:59:31,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29327/203307 [33:22:27<197:59:27,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29327/203307 [33:22:27<197:59:27,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29328/203307 [33:22:32<197:59:24,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29328/203307 [33:22:32<197:59:24,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29329/203307 [33:22:36<197:59:19,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29329/203307 [33:22:36<197:59:19,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29330/203307 [33:22:40<197:59:16,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29330/203307 [33:22:40<197:59:16,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29331/203307 [33:22:44<197:59:10,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29331/203307 [33:22:44<197:59:10,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29332/203307 [33:22:48<197:59:08,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29332/203307 [33:22:48<197:59:08,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29333/203307 [33:22:52<197:59:02,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29333/203307 [33:22:52<197:59:02,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29334/203307 [33:22:56<197:58:56,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29334/203307 [33:22:56<197:58:56,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29335/203307 [33:23:00<197:58:54,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29335/203307 [33:23:00<197:58:54,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29336/203307 [33:23:04<197:58:51,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29336/203307 [33:23:04<197:58:51,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29337/203307 [33:23:09<197:58:48,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29337/203307 [33:23:09<197:58:48,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29338/203307 [33:23:13<197:58:45,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29338/203307 [33:23:13<197:58:45,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29339/203307 [33:23:17<197:58:39,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29339/203307 [33:23:17<197:58:39,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29340/203307 [33:23:20<197:58:33,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29340/203307 [33:23:21<197:58:33,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29341/203307 [33:23:25<197:58:31,  0.24it/s, v_num=t5e6, training/loss=0.087]Epoch 0:  14%|█▍        | 29341/203307 [33:23:25<197:58:31,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29342/203307 [33:23:29<197:58:25,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29342/203307 [33:23:29<197:58:25,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29343/203307 [33:23:33<197:58:23,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29343/203307 [33:23:33<197:58:23,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29344/203307 [33:23:37<197:58:17,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29344/203307 [33:23:37<197:58:17,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29345/203307 [33:23:41<197:58:14,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29345/203307 [33:23:41<197:58:14,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29346/203307 [33:23:46<197:58:11,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29346/203307 [33:23:46<197:58:11,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29347/203307 [33:23:50<197:58:08,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29347/203307 [33:23:50<197:58:08,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29348/203307 [33:23:54<197:58:02,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29348/203307 [33:23:54<197:58:02,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29349/203307 [33:23:57<197:57:56,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29349/203307 [33:23:57<197:57:56,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29350/203307 [33:24:02<197:57:55,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29350/203307 [33:24:02<197:57:55,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29351/203307 [33:24:06<197:57:49,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29351/203307 [33:24:06<197:57:49,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29352/203307 [33:24:10<197:57:47,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29352/203307 [33:24:10<197:57:47,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29353/203307 [33:24:14<197:57:41,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29353/203307 [33:24:14<197:57:41,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29354/203307 [33:24:18<197:57:39,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29354/203307 [33:24:18<197:57:39,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29355/203307 [33:24:23<197:57:36,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29355/203307 [33:24:23<197:57:36,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29356/203307 [33:24:27<197:57:32,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29356/203307 [33:24:27<197:57:32,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29357/203307 [33:24:31<197:57:26,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29357/203307 [33:24:31<197:57:26,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29358/203307 [33:24:35<197:57:24,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29358/203307 [33:24:35<197:57:24,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29359/203307 [33:24:39<197:57:18,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29359/203307 [33:24:39<197:57:18,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29360/203307 [33:24:42<197:57:11,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29360/203307 [33:24:42<197:57:11,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29361/203307 [33:24:47<197:57:09,  0.24it/s, v_num=t5e6, training/loss=0.0809]Epoch 0:  14%|█▍        | 29361/203307 [33:24:47<197:57:09,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29362/203307 [33:24:51<197:57:02,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29362/203307 [33:24:51<197:57:02,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29363/203307 [33:24:55<197:57:00,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29363/203307 [33:24:55<197:57:00,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29364/203307 [33:24:59<197:56:57,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29364/203307 [33:24:59<197:56:57,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29365/203307 [33:25:03<197:56:50,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29365/203307 [33:25:03<197:56:50,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29366/203307 [33:25:07<197:56:43,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29366/203307 [33:25:07<197:56:43,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29367/203307 [33:25:11<197:56:42,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29367/203307 [33:25:11<197:56:42,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29368/203307 [33:25:15<197:56:35,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29368/203307 [33:25:15<197:56:35,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29369/203307 [33:25:19<197:56:33,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29369/203307 [33:25:19<197:56:33,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29370/203307 [33:25:23<197:56:27,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29370/203307 [33:25:23<197:56:27,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29371/203307 [33:25:27<197:56:24,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29371/203307 [33:25:27<197:56:24,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29372/203307 [33:25:32<197:56:21,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29372/203307 [33:25:32<197:56:21,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29373/203307 [33:25:36<197:56:18,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29373/203307 [33:25:36<197:56:18,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29374/203307 [33:25:40<197:56:12,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29374/203307 [33:25:40<197:56:12,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29375/203307 [33:25:43<197:56:05,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29375/203307 [33:25:43<197:56:05,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29376/203307 [33:25:48<197:56:03,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29376/203307 [33:25:48<197:56:03,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29377/203307 [33:25:51<197:55:57,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29377/203307 [33:25:51<197:55:57,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29378/203307 [33:25:56<197:55:54,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29378/203307 [33:25:56<197:55:54,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29379/203307 [33:25:59<197:55:47,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29379/203307 [33:25:59<197:55:47,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29380/203307 [33:26:04<197:55:45,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29380/203307 [33:26:04<197:55:45,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29381/203307 [33:26:08<197:55:42,  0.24it/s, v_num=t5e6, training/loss=0.0778]Epoch 0:  14%|█▍        | 29381/203307 [33:26:08<197:55:42,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29382/203307 [33:26:12<197:55:39,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29382/203307 [33:26:12<197:55:39,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29383/203307 [33:26:16<197:55:32,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29383/203307 [33:26:16<197:55:33,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29384/203307 [33:26:20<197:55:31,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29384/203307 [33:26:20<197:55:31,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29385/203307 [33:26:24<197:55:25,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29385/203307 [33:26:24<197:55:25,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29386/203307 [33:26:28<197:55:18,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29386/203307 [33:26:28<197:55:18,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29387/203307 [33:26:32<197:55:16,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29387/203307 [33:26:32<197:55:16,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29388/203307 [33:26:37<197:55:12,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29388/203307 [33:26:37<197:55:12,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29389/203307 [33:26:41<197:55:10,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29389/203307 [33:26:41<197:55:10,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29390/203307 [33:26:45<197:55:07,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29390/203307 [33:26:45<197:55:07,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29391/203307 [33:26:49<197:55:01,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29391/203307 [33:26:49<197:55:01,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29392/203307 [33:26:53<197:54:54,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29392/203307 [33:26:53<197:54:54,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29393/203307 [33:26:57<197:54:53,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29393/203307 [33:26:57<197:54:53,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29394/203307 [33:27:01<197:54:46,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29394/203307 [33:27:01<197:54:46,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29395/203307 [33:27:05<197:54:44,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29395/203307 [33:27:05<197:54:44,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29396/203307 [33:27:09<197:54:40,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29396/203307 [33:27:09<197:54:40,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29397/203307 [33:27:13<197:54:34,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29397/203307 [33:27:13<197:54:34,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29398/203307 [33:27:18<197:54:32,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29398/203307 [33:27:18<197:54:32,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29399/203307 [33:27:22<197:54:30,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29399/203307 [33:27:22<197:54:30,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29400/203307 [33:27:26<197:54:24,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29400/203307 [33:27:26<197:54:24,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29401/203307 [33:27:29<197:54:17,  0.24it/s, v_num=t5e6, training/loss=0.0751]Epoch 0:  14%|█▍        | 29401/203307 [33:27:29<197:54:17,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29402/203307 [33:27:34<197:54:16,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29402/203307 [33:27:34<197:54:16,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29403/203307 [33:27:38<197:54:09,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29403/203307 [33:27:38<197:54:09,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29404/203307 [33:27:42<197:54:08,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29404/203307 [33:27:42<197:54:08,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29405/203307 [33:27:46<197:54:04,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29405/203307 [33:27:46<197:54:04,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29406/203307 [33:27:51<197:54:01,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29406/203307 [33:27:51<197:54:01,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29407/203307 [33:27:54<197:53:55,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29407/203307 [33:27:55<197:53:55,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29408/203307 [33:27:59<197:53:53,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29408/203307 [33:27:59<197:53:53,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29409/203307 [33:28:03<197:53:46,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29409/203307 [33:28:03<197:53:46,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29410/203307 [33:28:07<197:53:45,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29410/203307 [33:28:07<197:53:45,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29411/203307 [33:28:11<197:53:38,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29411/203307 [33:28:11<197:53:39,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29412/203307 [33:28:15<197:53:33,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29412/203307 [33:28:15<197:53:33,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29413/203307 [33:28:19<197:53:31,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29413/203307 [33:28:19<197:53:31,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29414/203307 [33:28:23<197:53:26,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29414/203307 [33:28:23<197:53:26,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29415/203307 [33:28:27<197:53:23,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29415/203307 [33:28:27<197:53:24,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29416/203307 [33:28:32<197:53:21,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29416/203307 [33:28:32<197:53:21,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29417/203307 [33:28:36<197:53:17,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29417/203307 [33:28:36<197:53:17,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29418/203307 [33:28:40<197:53:11,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29418/203307 [33:28:40<197:53:11,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29419/203307 [33:28:44<197:53:09,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29419/203307 [33:28:44<197:53:09,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29420/203307 [33:28:48<197:53:03,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29420/203307 [33:28:48<197:53:03,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29421/203307 [33:28:52<197:53:02,  0.24it/s, v_num=t5e6, training/loss=0.0841]Epoch 0:  14%|█▍        | 29421/203307 [33:28:52<197:53:02,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29422/203307 [33:28:56<197:52:55,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29422/203307 [33:28:56<197:52:55,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29423/203307 [33:29:00<197:52:49,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29423/203307 [33:29:00<197:52:49,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29424/203307 [33:29:04<197:52:47,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29424/203307 [33:29:04<197:52:47,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29425/203307 [33:29:09<197:52:44,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29425/203307 [33:29:09<197:52:44,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29426/203307 [33:29:13<197:52:41,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29426/203307 [33:29:13<197:52:41,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29427/203307 [33:29:17<197:52:34,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29427/203307 [33:29:17<197:52:34,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29428/203307 [33:29:21<197:52:33,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29428/203307 [33:29:21<197:52:33,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29429/203307 [33:29:25<197:52:27,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29429/203307 [33:29:25<197:52:27,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29430/203307 [33:29:30<197:52:26,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29430/203307 [33:29:30<197:52:26,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29431/203307 [33:29:33<197:52:19,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29431/203307 [33:29:33<197:52:19,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29432/203307 [33:29:38<197:52:17,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29432/203307 [33:29:38<197:52:17,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29433/203307 [33:29:41<197:52:11,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29433/203307 [33:29:41<197:52:11,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29434/203307 [33:29:46<197:52:08,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29434/203307 [33:29:46<197:52:08,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29435/203307 [33:29:50<197:52:04,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29435/203307 [33:29:50<197:52:04,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29436/203307 [33:29:54<197:52:03,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29436/203307 [33:29:54<197:52:03,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29437/203307 [33:29:58<197:51:56,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29437/203307 [33:29:58<197:51:57,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29438/203307 [33:30:02<197:51:54,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29438/203307 [33:30:02<197:51:54,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29439/203307 [33:30:07<197:51:51,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29439/203307 [33:30:07<197:51:52,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29440/203307 [33:30:11<197:51:46,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29440/203307 [33:30:11<197:51:46,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29441/203307 [33:30:15<197:51:43,  0.24it/s, v_num=t5e6, training/loss=0.0869]Epoch 0:  14%|█▍        | 29441/203307 [33:30:15<197:51:43,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29442/203307 [33:30:19<197:51:40,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29442/203307 [33:30:19<197:51:40,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29443/203307 [33:30:23<197:51:34,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29443/203307 [33:30:23<197:51:34,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29444/203307 [33:30:27<197:51:31,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29444/203307 [33:30:27<197:51:31,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29445/203307 [33:30:32<197:51:29,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29445/203307 [33:30:32<197:51:29,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29446/203307 [33:30:36<197:51:26,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29446/203307 [33:30:36<197:51:26,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29447/203307 [33:30:41<197:51:24,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29447/203307 [33:30:41<197:51:24,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29448/203307 [33:30:44<197:51:18,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29448/203307 [33:30:44<197:51:18,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29449/203307 [33:30:48<197:51:12,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29449/203307 [33:30:48<197:51:12,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29450/203307 [33:30:53<197:51:10,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29450/203307 [33:30:53<197:51:10,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29451/203307 [33:30:57<197:51:07,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29451/203307 [33:30:57<197:51:07,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29452/203307 [33:31:00<197:51:01,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29452/203307 [33:31:00<197:51:01,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29453/203307 [33:31:05<197:50:57,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29453/203307 [33:31:05<197:50:57,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29454/203307 [33:31:09<197:50:55,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29454/203307 [33:31:09<197:50:55,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29455/203307 [33:31:14<197:50:53,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29455/203307 [33:31:14<197:50:53,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29456/203307 [33:31:18<197:50:51,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29456/203307 [33:31:18<197:50:51,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29457/203307 [33:31:22<197:50:45,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29457/203307 [33:31:22<197:50:45,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29458/203307 [33:31:26<197:50:44,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29458/203307 [33:31:26<197:50:44,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29459/203307 [33:31:30<197:50:38,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29459/203307 [33:31:30<197:50:38,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29460/203307 [33:31:35<197:50:36,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29460/203307 [33:31:35<197:50:36,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29461/203307 [33:31:38<197:50:30,  0.24it/s, v_num=t5e6, training/loss=0.0871]Epoch 0:  14%|█▍        | 29461/203307 [33:31:38<197:50:30,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29462/203307 [33:31:43<197:50:28,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29462/203307 [33:31:43<197:50:28,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29463/203307 [33:31:47<197:50:25,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29463/203307 [33:31:47<197:50:25,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29464/203307 [33:31:51<197:50:19,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29464/203307 [33:31:51<197:50:19,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29465/203307 [33:31:55<197:50:17,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29465/203307 [33:31:55<197:50:17,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29466/203307 [33:31:59<197:50:11,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29466/203307 [33:31:59<197:50:11,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29467/203307 [33:32:04<197:50:09,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29467/203307 [33:32:04<197:50:09,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29468/203307 [33:32:08<197:50:06,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29468/203307 [33:32:08<197:50:06,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29469/203307 [33:32:12<197:50:00,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29469/203307 [33:32:12<197:50:00,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29470/203307 [33:32:15<197:49:54,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29470/203307 [33:32:15<197:49:54,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29471/203307 [33:32:20<197:49:52,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29471/203307 [33:32:20<197:49:52,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29472/203307 [33:32:24<197:49:46,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29472/203307 [33:32:24<197:49:46,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29473/203307 [33:32:28<197:49:44,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29473/203307 [33:32:28<197:49:44,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29474/203307 [33:32:32<197:49:38,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29474/203307 [33:32:32<197:49:39,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29475/203307 [33:32:36<197:49:32,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29475/203307 [33:32:36<197:49:32,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29476/203307 [33:32:40<197:49:30,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29476/203307 [33:32:40<197:49:30,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29477/203307 [33:32:44<197:49:27,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29477/203307 [33:32:44<197:49:27,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29478/203307 [33:32:48<197:49:20,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29478/203307 [33:32:48<197:49:20,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29479/203307 [33:32:52<197:49:14,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  14%|█▍        | 29479/203307 [33:32:52<197:49:14,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  15%|█▍        | 29480/203307 [33:32:56<197:49:12,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  15%|█▍        | 29480/203307 [33:32:56<197:49:12,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  15%|█▍        | 29481/203307 [33:33:00<197:49:06,  0.24it/s, v_num=t5e6, training/loss=0.0817]Epoch 0:  15%|█▍        | 29481/203307 [33:33:00<197:49:06,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29482/203307 [33:33:04<197:49:03,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29482/203307 [33:33:04<197:49:03,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29483/203307 [33:33:08<197:48:58,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29483/203307 [33:33:08<197:48:58,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29484/203307 [33:33:12<197:48:55,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29484/203307 [33:33:12<197:48:55,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29485/203307 [33:33:16<197:48:49,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29485/203307 [33:33:16<197:48:49,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29486/203307 [33:33:21<197:48:46,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29486/203307 [33:33:21<197:48:46,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29487/203307 [33:33:24<197:48:41,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29487/203307 [33:33:24<197:48:41,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29488/203307 [33:33:29<197:48:39,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29488/203307 [33:33:29<197:48:39,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29489/203307 [33:33:33<197:48:36,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29489/203307 [33:33:33<197:48:36,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29490/203307 [33:33:37<197:48:29,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29490/203307 [33:33:37<197:48:29,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29491/203307 [33:33:41<197:48:27,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29491/203307 [33:33:41<197:48:27,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29492/203307 [33:33:45<197:48:21,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29492/203307 [33:33:45<197:48:21,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29493/203307 [33:33:49<197:48:19,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29493/203307 [33:33:50<197:48:19,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29494/203307 [33:33:54<197:48:16,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29494/203307 [33:33:54<197:48:16,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29495/203307 [33:33:57<197:48:09,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29495/203307 [33:33:58<197:48:10,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29496/203307 [33:34:02<197:48:06,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29496/203307 [33:34:02<197:48:06,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29497/203307 [33:34:06<197:48:05,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29497/203307 [33:34:06<197:48:05,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29498/203307 [33:34:10<197:48:01,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29498/203307 [33:34:10<197:48:01,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29499/203307 [33:34:15<197:47:59,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29499/203307 [33:34:15<197:47:59,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29500/203307 [33:34:19<197:47:53,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29500/203307 [33:34:19<197:47:53,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29501/203307 [33:34:22<197:47:46,  0.24it/s, v_num=t5e6, training/loss=0.0833]Epoch 0:  15%|█▍        | 29501/203307 [33:34:22<197:47:46,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29502/203307 [33:34:27<197:47:45,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29502/203307 [33:34:27<197:47:45,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29503/203307 [33:34:31<197:47:42,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29503/203307 [33:34:31<197:47:42,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29504/203307 [33:34:35<197:47:36,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29504/203307 [33:34:35<197:47:36,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29505/203307 [33:34:39<197:47:34,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29505/203307 [33:34:39<197:47:34,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29506/203307 [33:34:44<197:47:32,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29506/203307 [33:34:44<197:47:32,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29507/203307 [33:34:48<197:47:28,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29507/203307 [33:34:48<197:47:28,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29508/203307 [33:34:53<197:47:26,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29508/203307 [33:34:53<197:47:27,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29509/203307 [33:34:56<197:47:21,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29509/203307 [33:34:56<197:47:21,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29510/203307 [33:35:01<197:47:18,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29510/203307 [33:35:01<197:47:18,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29511/203307 [33:35:04<197:47:12,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29511/203307 [33:35:04<197:47:12,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29512/203307 [33:35:09<197:47:09,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29512/203307 [33:35:09<197:47:10,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29513/203307 [33:35:13<197:47:06,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29513/203307 [33:35:13<197:47:06,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29514/203307 [33:35:17<197:47:04,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29514/203307 [33:35:17<197:47:04,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29515/203307 [33:35:21<197:46:58,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29515/203307 [33:35:21<197:46:58,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29516/203307 [33:35:25<197:46:54,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29516/203307 [33:35:25<197:46:54,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29517/203307 [33:35:30<197:46:52,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29517/203307 [33:35:30<197:46:52,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29518/203307 [33:35:34<197:46:46,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29518/203307 [33:35:34<197:46:46,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29519/203307 [33:35:38<197:46:44,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29519/203307 [33:35:38<197:46:44,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29520/203307 [33:35:42<197:46:40,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29520/203307 [33:35:42<197:46:40,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29521/203307 [33:35:47<197:46:38,  0.24it/s, v_num=t5e6, training/loss=0.0889]Epoch 0:  15%|█▍        | 29521/203307 [33:35:47<197:46:38,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29522/203307 [33:35:50<197:46:32,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29522/203307 [33:35:50<197:46:32,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29523/203307 [33:35:55<197:46:30,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29523/203307 [33:35:55<197:46:30,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29524/203307 [33:35:58<197:46:23,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29524/203307 [33:35:58<197:46:23,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29525/203307 [33:36:03<197:46:22,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29525/203307 [33:36:03<197:46:22,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29526/203307 [33:36:07<197:46:15,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29526/203307 [33:36:07<197:46:15,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29527/203307 [33:36:10<197:46:09,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29527/203307 [33:36:10<197:46:09,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29528/203307 [33:36:15<197:46:06,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29528/203307 [33:36:15<197:46:06,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29529/203307 [33:36:19<197:46:04,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29529/203307 [33:36:19<197:46:04,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29530/203307 [33:36:23<197:46:00,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29530/203307 [33:36:23<197:46:00,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29531/203307 [33:36:27<197:45:54,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29531/203307 [33:36:27<197:45:54,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29532/203307 [33:36:32<197:45:52,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29532/203307 [33:36:32<197:45:52,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29533/203307 [33:36:35<197:45:46,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29533/203307 [33:36:35<197:45:46,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29534/203307 [33:36:40<197:45:44,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29534/203307 [33:36:40<197:45:44,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29535/203307 [33:36:43<197:45:38,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29535/203307 [33:36:43<197:45:38,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29536/203307 [33:36:48<197:45:35,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29536/203307 [33:36:48<197:45:35,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29537/203307 [33:36:51<197:45:28,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29537/203307 [33:36:51<197:45:29,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29538/203307 [33:36:56<197:45:25,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29538/203307 [33:36:56<197:45:25,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29539/203307 [33:36:59<197:45:19,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29539/203307 [33:36:59<197:45:19,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29540/203307 [33:37:04<197:45:18,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29540/203307 [33:37:04<197:45:18,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29541/203307 [33:37:08<197:45:11,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29541/203307 [33:37:08<197:45:11,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29542/203307 [33:37:11<197:45:05,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29542/203307 [33:37:11<197:45:05,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29543/203307 [33:37:16<197:45:03,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29543/203307 [33:37:16<197:45:03,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29544/203307 [33:37:20<197:44:57,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29544/203307 [33:37:20<197:44:57,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29545/203307 [33:37:24<197:44:54,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29545/203307 [33:37:24<197:44:55,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29546/203307 [33:37:28<197:44:51,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29546/203307 [33:37:28<197:44:51,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29547/203307 [33:37:32<197:44:45,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29547/203307 [33:37:32<197:44:45,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29548/203307 [33:37:36<197:44:39,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29548/203307 [33:37:36<197:44:39,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29549/203307 [33:37:40<197:44:38,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29549/203307 [33:37:40<197:44:38,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29550/203307 [33:37:44<197:44:32,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29550/203307 [33:37:44<197:44:32,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29551/203307 [33:37:49<197:44:30,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29551/203307 [33:37:49<197:44:30,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29552/203307 [33:37:53<197:44:27,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29552/203307 [33:37:53<197:44:27,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29553/203307 [33:37:57<197:44:20,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29553/203307 [33:37:57<197:44:20,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29554/203307 [33:38:01<197:44:17,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29554/203307 [33:38:01<197:44:17,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29555/203307 [33:38:05<197:44:14,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29555/203307 [33:38:05<197:44:14,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29556/203307 [33:38:09<197:44:08,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29556/203307 [33:38:09<197:44:08,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29557/203307 [33:38:13<197:44:02,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29557/203307 [33:38:13<197:44:02,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29558/203307 [33:38:17<197:44:00,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29558/203307 [33:38:17<197:44:00,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29559/203307 [33:38:21<197:43:54,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29559/203307 [33:38:21<197:43:54,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29560/203307 [33:38:25<197:43:52,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29560/203307 [33:38:25<197:43:52,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29561/203307 [33:38:30<197:43:49,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29561/203307 [33:38:30<197:43:49,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29562/203307 [33:38:34<197:43:46,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29562/203307 [33:38:34<197:43:46,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29563/203307 [33:38:38<197:43:43,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29563/203307 [33:38:38<197:43:43,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29564/203307 [33:38:42<197:43:39,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29564/203307 [33:38:42<197:43:39,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29565/203307 [33:38:46<197:43:32,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29565/203307 [33:38:46<197:43:32,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29566/203307 [33:38:50<197:43:30,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29566/203307 [33:38:50<197:43:30,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29567/203307 [33:38:54<197:43:24,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29567/203307 [33:38:54<197:43:24,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29568/203307 [33:38:58<197:43:17,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29568/203307 [33:38:58<197:43:17,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29569/203307 [33:39:02<197:43:15,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29569/203307 [33:39:02<197:43:15,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29570/203307 [33:39:06<197:43:12,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29570/203307 [33:39:06<197:43:12,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29571/203307 [33:39:11<197:43:08,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29571/203307 [33:39:11<197:43:08,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29572/203307 [33:39:15<197:43:05,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29572/203307 [33:39:15<197:43:05,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29573/203307 [33:39:19<197:42:59,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29573/203307 [33:39:19<197:42:59,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29574/203307 [33:39:22<197:42:53,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29574/203307 [33:39:22<197:42:53,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29575/203307 [33:39:27<197:42:52,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29575/203307 [33:39:27<197:42:52,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29576/203307 [33:39:31<197:42:46,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29576/203307 [33:39:31<197:42:46,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29577/203307 [33:39:35<197:42:43,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29577/203307 [33:39:35<197:42:43,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29578/203307 [33:39:39<197:42:37,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29578/203307 [33:39:39<197:42:37,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29579/203307 [33:39:43<197:42:33,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29579/203307 [33:39:43<197:42:33,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29580/203307 [33:39:47<197:42:30,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29580/203307 [33:39:47<197:42:30,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29581/203307 [33:39:52<197:42:28,  0.24it/s, v_num=t5e6, training/loss=0.0835]Epoch 0:  15%|█▍        | 29581/203307 [33:39:52<197:42:28,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29582/203307 [33:39:55<197:42:21,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29582/203307 [33:39:55<197:42:21,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29583/203307 [33:39:59<197:42:15,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29583/203307 [33:39:59<197:42:15,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29584/203307 [33:40:04<197:42:13,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29584/203307 [33:40:04<197:42:13,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29585/203307 [33:40:07<197:42:07,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29585/203307 [33:40:07<197:42:07,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29586/203307 [33:40:12<197:42:05,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29586/203307 [33:40:12<197:42:05,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29587/203307 [33:40:15<197:41:59,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29587/203307 [33:40:15<197:41:59,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29588/203307 [33:40:20<197:41:56,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29588/203307 [33:40:20<197:41:56,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29589/203307 [33:40:24<197:41:50,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29589/203307 [33:40:24<197:41:50,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29590/203307 [33:40:28<197:41:47,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29590/203307 [33:40:28<197:41:47,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29591/203307 [33:40:32<197:41:41,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29591/203307 [33:40:32<197:41:41,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29592/203307 [33:40:36<197:41:39,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29592/203307 [33:40:36<197:41:39,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29593/203307 [33:40:40<197:41:33,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29593/203307 [33:40:40<197:41:33,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29594/203307 [33:40:44<197:41:27,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29594/203307 [33:40:44<197:41:27,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29595/203307 [33:40:48<197:41:25,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29595/203307 [33:40:48<197:41:25,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29596/203307 [33:40:52<197:41:22,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29596/203307 [33:40:52<197:41:22,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29597/203307 [33:40:57<197:41:19,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29597/203307 [33:40:57<197:41:19,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29598/203307 [33:41:01<197:41:15,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29598/203307 [33:41:01<197:41:15,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29599/203307 [33:41:05<197:41:09,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29599/203307 [33:41:05<197:41:09,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29600/203307 [33:41:08<197:41:03,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29600/203307 [33:41:08<197:41:03,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29601/203307 [33:41:13<197:41:01,  0.24it/s, v_num=t5e6, training/loss=0.0827]Epoch 0:  15%|█▍        | 29601/203307 [33:41:13<197:41:01,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29602/203307 [33:41:16<197:40:54,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29602/203307 [33:41:16<197:40:55,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29603/203307 [33:41:21<197:40:53,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29603/203307 [33:41:21<197:40:53,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29604/203307 [33:41:25<197:40:46,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29604/203307 [33:41:25<197:40:46,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29605/203307 [33:41:29<197:40:44,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29605/203307 [33:41:29<197:40:44,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29606/203307 [33:41:33<197:40:41,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29606/203307 [33:41:33<197:40:41,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29607/203307 [33:41:37<197:40:37,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29607/203307 [33:41:37<197:40:37,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29608/203307 [33:41:41<197:40:30,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29608/203307 [33:41:41<197:40:30,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29609/203307 [33:41:45<197:40:24,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29609/203307 [33:41:45<197:40:24,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29610/203307 [33:41:49<197:40:22,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29610/203307 [33:41:49<197:40:22,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29611/203307 [33:41:53<197:40:16,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29611/203307 [33:41:53<197:40:16,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29612/203307 [33:41:57<197:40:13,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29612/203307 [33:41:57<197:40:13,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29613/203307 [33:42:02<197:40:09,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29613/203307 [33:42:02<197:40:09,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29614/203307 [33:42:06<197:40:06,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29614/203307 [33:42:06<197:40:06,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29615/203307 [33:42:10<197:40:03,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29615/203307 [33:42:10<197:40:03,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29616/203307 [33:42:14<197:40:00,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29616/203307 [33:42:14<197:40:00,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29617/203307 [33:42:18<197:39:54,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29617/203307 [33:42:18<197:39:54,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29618/203307 [33:42:23<197:39:52,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29618/203307 [33:42:23<197:39:52,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29619/203307 [33:42:26<197:39:46,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29619/203307 [33:42:26<197:39:46,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29620/203307 [33:42:30<197:39:41,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29620/203307 [33:42:30<197:39:41,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29621/203307 [33:42:35<197:39:39,  0.24it/s, v_num=t5e6, training/loss=0.0812]Epoch 0:  15%|█▍        | 29621/203307 [33:42:35<197:39:39,  0.24it/s, v_num=t5e6, training/loss=0.085] Epoch 0:  15%|█▍        | 29622/203307 [33:42:38<197:39:32,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29622/203307 [33:42:38<197:39:32,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29623/203307 [33:42:43<197:39:29,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29623/203307 [33:42:43<197:39:29,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29624/203307 [33:42:47<197:39:26,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29624/203307 [33:42:47<197:39:26,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29625/203307 [33:42:51<197:39:20,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29625/203307 [33:42:51<197:39:20,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29626/203307 [33:42:54<197:39:14,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29626/203307 [33:42:54<197:39:14,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29627/203307 [33:42:59<197:39:12,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29627/203307 [33:42:59<197:39:12,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29628/203307 [33:43:02<197:39:05,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29628/203307 [33:43:02<197:39:05,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29629/203307 [33:43:07<197:39:03,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29629/203307 [33:43:07<197:39:03,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29630/203307 [33:43:11<197:39:00,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29630/203307 [33:43:11<197:39:00,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29631/203307 [33:43:15<197:38:53,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29631/203307 [33:43:15<197:38:53,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29632/203307 [33:43:19<197:38:51,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29632/203307 [33:43:19<197:38:51,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29633/203307 [33:43:23<197:38:48,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29633/203307 [33:43:23<197:38:48,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29634/203307 [33:43:27<197:38:41,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29634/203307 [33:43:27<197:38:41,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29635/203307 [33:43:31<197:38:35,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29635/203307 [33:43:31<197:38:35,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29636/203307 [33:43:35<197:38:33,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29636/203307 [33:43:35<197:38:33,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29637/203307 [33:43:39<197:38:26,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29637/203307 [33:43:39<197:38:26,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29638/203307 [33:43:43<197:38:24,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29638/203307 [33:43:43<197:38:24,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29639/203307 [33:43:47<197:38:18,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29639/203307 [33:43:47<197:38:18,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29640/203307 [33:43:51<197:38:15,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29640/203307 [33:43:51<197:38:15,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29641/203307 [33:43:55<197:38:08,  0.24it/s, v_num=t5e6, training/loss=0.085]Epoch 0:  15%|█▍        | 29641/203307 [33:43:55<197:38:08,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29642/203307 [33:43:59<197:38:05,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29642/203307 [33:43:59<197:38:05,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29643/203307 [33:44:03<197:37:58,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29643/203307 [33:44:03<197:37:58,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29644/203307 [33:44:08<197:37:57,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29644/203307 [33:44:08<197:37:57,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29645/203307 [33:44:11<197:37:50,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29645/203307 [33:44:11<197:37:50,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29646/203307 [33:44:15<197:37:47,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29646/203307 [33:44:15<197:37:47,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29647/203307 [33:44:20<197:37:45,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29647/203307 [33:44:20<197:37:45,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29648/203307 [33:44:24<197:37:39,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29648/203307 [33:44:24<197:37:39,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29649/203307 [33:44:28<197:37:36,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29649/203307 [33:44:28<197:37:36,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29650/203307 [33:44:32<197:37:33,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29650/203307 [33:44:32<197:37:33,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29651/203307 [33:44:37<197:37:30,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29651/203307 [33:44:37<197:37:30,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29652/203307 [33:44:40<197:37:23,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29652/203307 [33:44:40<197:37:23,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29653/203307 [33:44:45<197:37:21,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29653/203307 [33:44:45<197:37:21,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29654/203307 [33:44:48<197:37:14,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29654/203307 [33:44:48<197:37:14,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29655/203307 [33:44:53<197:37:13,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29655/203307 [33:44:53<197:37:13,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29656/203307 [33:44:57<197:37:07,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29656/203307 [33:44:57<197:37:07,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29657/203307 [33:45:00<197:37:00,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29657/203307 [33:45:00<197:37:00,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29658/203307 [33:45:05<197:36:58,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29658/203307 [33:45:05<197:36:58,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29659/203307 [33:45:09<197:36:55,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29659/203307 [33:45:09<197:36:55,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29660/203307 [33:45:13<197:36:52,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29660/203307 [33:45:13<197:36:52,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29661/203307 [33:45:17<197:36:45,  0.24it/s, v_num=t5e6, training/loss=0.0802]Epoch 0:  15%|█▍        | 29661/203307 [33:45:17<197:36:45,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29662/203307 [33:45:21<197:36:43,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29662/203307 [33:45:21<197:36:43,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29663/203307 [33:45:26<197:36:40,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29663/203307 [33:45:26<197:36:40,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29664/203307 [33:45:30<197:36:37,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29664/203307 [33:45:30<197:36:37,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29665/203307 [33:45:34<197:36:31,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29665/203307 [33:45:34<197:36:31,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29666/203307 [33:45:38<197:36:28,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29666/203307 [33:45:38<197:36:28,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29667/203307 [33:45:42<197:36:22,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29667/203307 [33:45:42<197:36:22,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29668/203307 [33:45:46<197:36:19,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29668/203307 [33:45:46<197:36:19,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29669/203307 [33:45:50<197:36:15,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29669/203307 [33:45:50<197:36:15,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29670/203307 [33:45:54<197:36:12,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29670/203307 [33:45:54<197:36:12,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29671/203307 [33:45:59<197:36:09,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29671/203307 [33:45:59<197:36:09,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29672/203307 [33:46:02<197:36:02,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29672/203307 [33:46:02<197:36:02,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29673/203307 [33:46:07<197:36:00,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29673/203307 [33:46:07<197:36:00,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29674/203307 [33:46:10<197:35:54,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29674/203307 [33:46:10<197:35:54,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29675/203307 [33:46:15<197:35:51,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29675/203307 [33:46:15<197:35:51,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29676/203307 [33:46:19<197:35:48,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29676/203307 [33:46:19<197:35:48,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29677/203307 [33:46:23<197:35:41,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29677/203307 [33:46:23<197:35:41,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29678/203307 [33:46:27<197:35:38,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29678/203307 [33:46:27<197:35:38,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29679/203307 [33:46:31<197:35:37,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29679/203307 [33:46:31<197:35:37,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29680/203307 [33:46:36<197:35:34,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29680/203307 [33:46:36<197:35:34,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29681/203307 [33:46:40<197:35:31,  0.24it/s, v_num=t5e6, training/loss=0.0794]Epoch 0:  15%|█▍        | 29681/203307 [33:46:40<197:35:31,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29682/203307 [33:46:44<197:35:26,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29682/203307 [33:46:44<197:35:26,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29683/203307 [33:46:48<197:35:19,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29683/203307 [33:46:48<197:35:19,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29684/203307 [33:46:52<197:35:17,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29684/203307 [33:46:52<197:35:17,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29685/203307 [33:46:56<197:35:14,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29685/203307 [33:46:56<197:35:14,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29686/203307 [33:47:00<197:35:08,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29686/203307 [33:47:00<197:35:08,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29687/203307 [33:47:04<197:35:05,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29687/203307 [33:47:04<197:35:05,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29688/203307 [33:47:09<197:35:04,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29688/203307 [33:47:09<197:35:04,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29689/203307 [33:47:13<197:34:58,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29689/203307 [33:47:13<197:34:58,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29690/203307 [33:47:17<197:34:57,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29690/203307 [33:47:17<197:34:57,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29691/203307 [33:47:21<197:34:51,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29691/203307 [33:47:21<197:34:51,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29692/203307 [33:47:26<197:34:48,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29692/203307 [33:47:26<197:34:48,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29693/203307 [33:47:30<197:34:44,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29693/203307 [33:47:30<197:34:44,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29694/203307 [33:47:34<197:34:41,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29694/203307 [33:47:34<197:34:41,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29695/203307 [33:47:38<197:34:35,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29695/203307 [33:47:38<197:34:35,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29696/203307 [33:47:42<197:34:33,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29696/203307 [33:47:42<197:34:33,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29697/203307 [33:47:46<197:34:27,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29697/203307 [33:47:46<197:34:27,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29698/203307 [33:47:50<197:34:22,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29698/203307 [33:47:50<197:34:23,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29699/203307 [33:47:54<197:34:20,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29699/203307 [33:47:54<197:34:20,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29700/203307 [33:47:58<197:34:14,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29700/203307 [33:47:58<197:34:14,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29701/203307 [33:48:02<197:34:11,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29701/203307 [33:48:02<197:34:11,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29702/203307 [33:48:07<197:34:08,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29702/203307 [33:48:07<197:34:08,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29703/203307 [33:48:10<197:34:02,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29703/203307 [33:48:10<197:34:02,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29704/203307 [33:48:14<197:33:56,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29704/203307 [33:48:14<197:33:56,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29705/203307 [33:48:19<197:33:54,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29705/203307 [33:48:19<197:33:54,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29706/203307 [33:48:22<197:33:48,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29706/203307 [33:48:22<197:33:48,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29707/203307 [33:48:27<197:33:46,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29707/203307 [33:48:27<197:33:46,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29708/203307 [33:48:31<197:33:40,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29708/203307 [33:48:31<197:33:40,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29709/203307 [33:48:34<197:33:34,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29709/203307 [33:48:34<197:33:34,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29710/203307 [33:48:39<197:33:32,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29710/203307 [33:48:39<197:33:32,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29711/203307 [33:48:43<197:33:28,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29711/203307 [33:48:43<197:33:28,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29712/203307 [33:48:47<197:33:22,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29712/203307 [33:48:47<197:33:22,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29713/203307 [33:48:51<197:33:19,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29713/203307 [33:48:51<197:33:19,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29714/203307 [33:48:55<197:33:17,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29714/203307 [33:48:55<197:33:17,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29715/203307 [33:48:59<197:33:10,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29715/203307 [33:48:59<197:33:10,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29716/203307 [33:49:04<197:33:08,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29716/203307 [33:49:04<197:33:08,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29717/203307 [33:49:07<197:33:01,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29717/203307 [33:49:07<197:33:01,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29718/203307 [33:49:11<197:32:58,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29718/203307 [33:49:11<197:32:58,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29719/203307 [33:49:15<197:32:52,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29719/203307 [33:49:15<197:32:52,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29720/203307 [33:49:20<197:32:49,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29720/203307 [33:49:20<197:32:49,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29721/203307 [33:49:24<197:32:46,  0.24it/s, v_num=t5e6, training/loss=0.0836]Epoch 0:  15%|█▍        | 29721/203307 [33:49:24<197:32:46,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29722/203307 [33:49:28<197:32:44,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29722/203307 [33:49:28<197:32:44,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29723/203307 [33:49:32<197:32:40,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29723/203307 [33:49:32<197:32:40,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29724/203307 [33:49:36<197:32:33,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29724/203307 [33:49:36<197:32:33,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29725/203307 [33:49:40<197:32:31,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29725/203307 [33:49:40<197:32:31,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29726/203307 [33:49:44<197:32:25,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29726/203307 [33:49:44<197:32:25,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29727/203307 [33:49:49<197:32:23,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29727/203307 [33:49:49<197:32:23,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29728/203307 [33:49:53<197:32:19,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29728/203307 [33:49:53<197:32:19,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29729/203307 [33:49:57<197:32:13,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29729/203307 [33:49:57<197:32:13,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29730/203307 [33:50:01<197:32:10,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29730/203307 [33:50:01<197:32:10,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29731/203307 [33:50:05<197:32:08,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29731/203307 [33:50:05<197:32:08,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29732/203307 [33:50:09<197:32:04,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29732/203307 [33:50:09<197:32:04,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29733/203307 [33:50:14<197:32:02,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29733/203307 [33:50:14<197:32:02,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29734/203307 [33:50:18<197:31:56,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29734/203307 [33:50:18<197:31:56,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29735/203307 [33:50:21<197:31:49,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29735/203307 [33:50:21<197:31:49,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29736/203307 [33:50:26<197:31:47,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29736/203307 [33:50:26<197:31:47,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29737/203307 [33:50:30<197:31:44,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29737/203307 [33:50:30<197:31:44,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29738/203307 [33:50:34<197:31:41,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29738/203307 [33:50:34<197:31:41,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29739/203307 [33:50:38<197:31:35,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29739/203307 [33:50:38<197:31:35,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29740/203307 [33:50:43<197:31:33,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29740/203307 [33:50:43<197:31:33,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29741/203307 [33:50:47<197:31:31,  0.24it/s, v_num=t5e6, training/loss=0.0829]Epoch 0:  15%|█▍        | 29741/203307 [33:50:47<197:31:31,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29742/203307 [33:50:51<197:31:28,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29742/203307 [33:50:51<197:31:28,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29743/203307 [33:50:55<197:31:22,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29743/203307 [33:50:55<197:31:22,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29744/203307 [33:50:59<197:31:19,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29744/203307 [33:50:59<197:31:19,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29745/203307 [33:51:03<197:31:13,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29745/203307 [33:51:03<197:31:13,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29746/203307 [33:51:08<197:31:12,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29746/203307 [33:51:08<197:31:12,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29747/203307 [33:51:11<197:31:05,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29747/203307 [33:51:11<197:31:05,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29748/203307 [33:51:16<197:31:03,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29748/203307 [33:51:16<197:31:03,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29749/203307 [33:51:20<197:30:57,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29749/203307 [33:51:20<197:30:57,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29750/203307 [33:51:24<197:30:53,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29750/203307 [33:51:24<197:30:53,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29751/203307 [33:51:28<197:30:51,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29751/203307 [33:51:28<197:30:51,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29752/203307 [33:51:32<197:30:44,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29752/203307 [33:51:32<197:30:44,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29753/203307 [33:51:36<197:30:42,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29753/203307 [33:51:36<197:30:42,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29754/203307 [33:51:41<197:30:40,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29754/203307 [33:51:41<197:30:40,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29755/203307 [33:51:45<197:30:37,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29755/203307 [33:51:45<197:30:37,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29756/203307 [33:51:49<197:30:31,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29756/203307 [33:51:49<197:30:31,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29757/203307 [33:51:53<197:30:29,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29757/203307 [33:51:53<197:30:29,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29758/203307 [33:51:57<197:30:23,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29758/203307 [33:51:57<197:30:23,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29759/203307 [33:52:01<197:30:21,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29759/203307 [33:52:01<197:30:21,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29760/203307 [33:52:05<197:30:15,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29760/203307 [33:52:05<197:30:15,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29761/203307 [33:52:09<197:30:09,  0.24it/s, v_num=t5e6, training/loss=0.0779]Epoch 0:  15%|█▍        | 29761/203307 [33:52:09<197:30:09,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29762/203307 [33:52:13<197:30:06,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29762/203307 [33:52:13<197:30:06,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29763/203307 [33:52:18<197:30:04,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29763/203307 [33:52:18<197:30:04,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29764/203307 [33:52:21<197:29:58,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29764/203307 [33:52:21<197:29:58,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29765/203307 [33:52:25<197:29:52,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29765/203307 [33:52:25<197:29:52,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29766/203307 [33:52:30<197:29:50,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29766/203307 [33:52:30<197:29:50,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29767/203307 [33:52:33<197:29:43,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29767/203307 [33:52:33<197:29:44,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29768/203307 [33:52:38<197:29:41,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29768/203307 [33:52:38<197:29:41,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29769/203307 [33:52:41<197:29:35,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29769/203307 [33:52:41<197:29:35,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29770/203307 [33:52:46<197:29:32,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29770/203307 [33:52:46<197:29:32,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29771/203307 [33:52:50<197:29:29,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29771/203307 [33:52:50<197:29:29,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29772/203307 [33:52:54<197:29:26,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29772/203307 [33:52:54<197:29:26,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29773/203307 [33:52:58<197:29:19,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29773/203307 [33:52:58<197:29:19,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29774/203307 [33:53:02<197:29:17,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29774/203307 [33:53:02<197:29:17,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29775/203307 [33:53:06<197:29:10,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29775/203307 [33:53:06<197:29:10,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29776/203307 [33:53:10<197:29:04,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29776/203307 [33:53:10<197:29:04,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29777/203307 [33:53:14<197:29:01,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29777/203307 [33:53:14<197:29:01,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29778/203307 [33:53:18<197:28:55,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29778/203307 [33:53:18<197:28:55,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29779/203307 [33:53:22<197:28:53,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29779/203307 [33:53:22<197:28:53,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29780/203307 [33:53:26<197:28:50,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29780/203307 [33:53:26<197:28:50,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29781/203307 [33:53:30<197:28:43,  0.24it/s, v_num=t5e6, training/loss=0.0752]Epoch 0:  15%|█▍        | 29781/203307 [33:53:30<197:28:43,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29782/203307 [33:53:34<197:28:37,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29782/203307 [33:53:34<197:28:37,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29783/203307 [33:53:38<197:28:35,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29783/203307 [33:53:38<197:28:35,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29784/203307 [33:53:42<197:28:29,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29784/203307 [33:53:42<197:28:29,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29785/203307 [33:53:46<197:28:26,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29785/203307 [33:53:46<197:28:26,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29786/203307 [33:53:51<197:28:23,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29786/203307 [33:53:51<197:28:23,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29787/203307 [33:53:54<197:28:16,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29787/203307 [33:53:54<197:28:16,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29788/203307 [33:53:59<197:28:14,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29788/203307 [33:53:59<197:28:14,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29789/203307 [33:54:03<197:28:12,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29789/203307 [33:54:03<197:28:12,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29790/203307 [33:54:07<197:28:05,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29790/203307 [33:54:07<197:28:05,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29791/203307 [33:54:11<197:27:59,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29791/203307 [33:54:11<197:27:59,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29792/203307 [33:54:15<197:27:57,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29792/203307 [33:54:15<197:27:57,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29793/203307 [33:54:19<197:27:50,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29793/203307 [33:54:19<197:27:51,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29794/203307 [33:54:23<197:27:48,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29794/203307 [33:54:23<197:27:48,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29795/203307 [33:54:27<197:27:44,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29795/203307 [33:54:27<197:27:44,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29796/203307 [33:54:31<197:27:41,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29796/203307 [33:54:31<197:27:41,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29797/203307 [33:54:35<197:27:35,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29797/203307 [33:54:35<197:27:35,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29798/203307 [33:54:39<197:27:31,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29798/203307 [33:54:39<197:27:31,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29799/203307 [33:54:43<197:27:24,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29799/203307 [33:54:43<197:27:24,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29800/203307 [33:54:47<197:27:22,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29800/203307 [33:54:47<197:27:22,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29801/203307 [33:54:51<197:27:15,  0.24it/s, v_num=t5e6, training/loss=0.0797]Epoch 0:  15%|█▍        | 29801/203307 [33:54:51<197:27:15,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29802/203307 [33:54:55<197:27:09,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29802/203307 [33:54:55<197:27:09,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29803/203307 [33:54:59<197:27:06,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29803/203307 [33:54:59<197:27:06,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29804/203307 [33:55:03<197:27:03,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29804/203307 [33:55:03<197:27:03,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29805/203307 [33:55:08<197:27:00,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29805/203307 [33:55:08<197:27:00,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29806/203307 [33:55:12<197:26:56,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29806/203307 [33:55:12<197:26:56,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29807/203307 [33:55:15<197:26:50,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29807/203307 [33:55:16<197:26:50,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29808/203307 [33:55:19<197:26:44,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29808/203307 [33:55:19<197:26:44,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29809/203307 [33:55:24<197:26:42,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29809/203307 [33:55:24<197:26:42,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29810/203307 [33:55:27<197:26:36,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29810/203307 [33:55:27<197:26:36,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29811/203307 [33:55:32<197:26:33,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29811/203307 [33:55:32<197:26:33,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29812/203307 [33:55:36<197:26:27,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29812/203307 [33:55:36<197:26:27,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29813/203307 [33:55:40<197:26:24,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29813/203307 [33:55:40<197:26:24,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29814/203307 [33:55:44<197:26:21,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29814/203307 [33:55:44<197:26:21,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29815/203307 [33:55:48<197:26:18,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29815/203307 [33:55:48<197:26:18,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29816/203307 [33:55:52<197:26:12,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29816/203307 [33:55:52<197:26:12,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29817/203307 [33:55:56<197:26:06,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29817/203307 [33:55:56<197:26:06,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29818/203307 [33:56:00<197:26:04,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29818/203307 [33:56:00<197:26:04,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29819/203307 [33:56:04<197:25:58,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29819/203307 [33:56:04<197:25:58,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29820/203307 [33:56:09<197:25:56,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29820/203307 [33:56:09<197:25:56,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29821/203307 [33:56:13<197:25:52,  0.24it/s, v_num=t5e6, training/loss=0.0793]Epoch 0:  15%|█▍        | 29821/203307 [33:56:13<197:25:52,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29822/203307 [33:56:17<197:25:49,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29822/203307 [33:56:17<197:25:49,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29823/203307 [33:56:21<197:25:43,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29823/203307 [33:56:21<197:25:43,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29824/203307 [33:56:25<197:25:40,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29824/203307 [33:56:25<197:25:40,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29825/203307 [33:56:29<197:25:34,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29825/203307 [33:56:29<197:25:34,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29826/203307 [33:56:33<197:25:32,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29826/203307 [33:56:33<197:25:32,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29827/203307 [33:56:37<197:25:26,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29827/203307 [33:56:37<197:25:26,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29828/203307 [33:56:41<197:25:19,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29828/203307 [33:56:41<197:25:19,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29829/203307 [33:56:45<197:25:18,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29829/203307 [33:56:45<197:25:18,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29830/203307 [33:56:50<197:25:15,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29830/203307 [33:56:50<197:25:15,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29831/203307 [33:56:54<197:25:13,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29831/203307 [33:56:54<197:25:13,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29832/203307 [33:56:58<197:25:09,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29832/203307 [33:56:58<197:25:09,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29833/203307 [33:57:02<197:25:03,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29833/203307 [33:57:02<197:25:03,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29834/203307 [33:57:06<197:24:57,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29834/203307 [33:57:06<197:24:57,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29835/203307 [33:57:10<197:24:55,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29835/203307 [33:57:10<197:24:55,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29836/203307 [33:57:14<197:24:49,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29836/203307 [33:57:14<197:24:49,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29837/203307 [33:57:18<197:24:47,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29837/203307 [33:57:18<197:24:47,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29838/203307 [33:57:23<197:24:45,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29838/203307 [33:57:23<197:24:45,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29839/203307 [33:57:27<197:24:39,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29839/203307 [33:57:27<197:24:39,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29840/203307 [33:57:31<197:24:37,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29840/203307 [33:57:31<197:24:37,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29841/203307 [33:57:35<197:24:34,  0.24it/s, v_num=t5e6, training/loss=0.0913]Epoch 0:  15%|█▍        | 29841/203307 [33:57:35<197:24:34,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29842/203307 [33:57:39<197:24:28,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29842/203307 [33:57:39<197:24:28,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29843/203307 [33:57:43<197:24:22,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29843/203307 [33:57:43<197:24:22,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29844/203307 [33:57:48<197:24:21,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29844/203307 [33:57:48<197:24:21,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29845/203307 [33:57:51<197:24:15,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29845/203307 [33:57:51<197:24:15,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29846/203307 [33:57:56<197:24:13,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29846/203307 [33:57:56<197:24:13,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29847/203307 [33:58:00<197:24:07,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29847/203307 [33:58:00<197:24:07,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29848/203307 [33:58:04<197:24:05,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29848/203307 [33:58:04<197:24:05,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29849/203307 [33:58:08<197:24:01,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29849/203307 [33:58:08<197:24:01,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29850/203307 [33:58:12<197:23:58,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29850/203307 [33:58:12<197:23:58,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29851/203307 [33:58:16<197:23:52,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29851/203307 [33:58:16<197:23:52,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29852/203307 [33:58:21<197:23:50,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29852/203307 [33:58:21<197:23:50,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29853/203307 [33:58:24<197:23:44,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29853/203307 [33:58:24<197:23:44,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29854/203307 [33:58:28<197:23:39,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29854/203307 [33:58:28<197:23:39,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29855/203307 [33:58:33<197:23:38,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29855/203307 [33:58:33<197:23:38,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29856/203307 [33:58:37<197:23:32,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29856/203307 [33:58:37<197:23:32,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29857/203307 [33:58:41<197:23:29,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29857/203307 [33:58:41<197:23:29,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29858/203307 [33:58:45<197:23:27,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29858/203307 [33:58:45<197:23:27,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29859/203307 [33:58:49<197:23:21,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29859/203307 [33:58:49<197:23:21,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29860/203307 [33:58:53<197:23:15,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29860/203307 [33:58:53<197:23:15,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29861/203307 [33:58:58<197:23:14,  0.24it/s, v_num=t5e6, training/loss=0.0912]Epoch 0:  15%|█▍        | 29861/203307 [33:58:58<197:23:14,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29862/203307 [33:59:01<197:23:08,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29862/203307 [33:59:01<197:23:08,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29863/203307 [33:59:06<197:23:06,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29863/203307 [33:59:06<197:23:06,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29864/203307 [33:59:10<197:23:00,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29864/203307 [33:59:10<197:23:00,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29865/203307 [33:59:13<197:22:53,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29865/203307 [33:59:13<197:22:53,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29866/203307 [33:59:18<197:22:51,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29866/203307 [33:59:18<197:22:51,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29867/203307 [33:59:22<197:22:49,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29867/203307 [33:59:22<197:22:49,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29868/203307 [33:59:26<197:22:43,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29868/203307 [33:59:26<197:22:43,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29869/203307 [33:59:30<197:22:37,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29869/203307 [33:59:30<197:22:37,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29870/203307 [33:59:34<197:22:35,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29870/203307 [33:59:34<197:22:36,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29871/203307 [33:59:39<197:22:32,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29871/203307 [33:59:39<197:22:33,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29872/203307 [33:59:43<197:22:30,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29872/203307 [33:59:43<197:22:30,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29873/203307 [33:59:47<197:22:24,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29873/203307 [33:59:47<197:22:24,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29874/203307 [33:59:51<197:22:21,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29874/203307 [33:59:51<197:22:21,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29875/203307 [33:59:55<197:22:15,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29875/203307 [33:59:55<197:22:15,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29876/203307 [33:59:59<197:22:13,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29876/203307 [33:59:59<197:22:13,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29877/203307 [34:00:03<197:22:07,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29877/203307 [34:00:03<197:22:07,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29878/203307 [34:00:07<197:22:05,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29878/203307 [34:00:07<197:22:05,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29879/203307 [34:00:11<197:21:59,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29879/203307 [34:00:11<197:21:59,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29880/203307 [34:00:15<197:21:56,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29880/203307 [34:00:15<197:21:56,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29881/203307 [34:00:20<197:21:55,  0.24it/s, v_num=t5e6, training/loss=0.0926]Epoch 0:  15%|█▍        | 29881/203307 [34:00:20<197:21:55,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29882/203307 [34:00:24<197:21:49,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29882/203307 [34:00:24<197:21:49,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29883/203307 [34:00:28<197:21:46,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29883/203307 [34:00:28<197:21:46,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29884/203307 [34:00:32<197:21:43,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29884/203307 [34:00:32<197:21:43,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29885/203307 [34:00:37<197:21:39,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29885/203307 [34:00:37<197:21:39,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29886/203307 [34:00:40<197:21:34,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29886/203307 [34:00:40<197:21:34,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29887/203307 [34:00:45<197:21:31,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29887/203307 [34:00:45<197:21:31,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29888/203307 [34:00:49<197:21:28,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29888/203307 [34:00:49<197:21:28,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29889/203307 [34:00:54<197:21:26,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29889/203307 [34:00:54<197:21:26,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29890/203307 [34:00:57<197:21:20,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29890/203307 [34:00:57<197:21:20,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29891/203307 [34:01:01<197:21:14,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29891/203307 [34:01:01<197:21:14,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29892/203307 [34:01:05<197:21:12,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29892/203307 [34:01:05<197:21:12,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29893/203307 [34:01:10<197:21:09,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29893/203307 [34:01:10<197:21:09,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29894/203307 [34:01:14<197:21:05,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29894/203307 [34:01:14<197:21:05,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29895/203307 [34:01:18<197:20:59,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29895/203307 [34:01:18<197:20:59,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29896/203307 [34:01:22<197:20:58,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29896/203307 [34:01:22<197:20:58,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29897/203307 [34:01:26<197:20:52,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29897/203307 [34:01:26<197:20:52,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29898/203307 [34:01:30<197:20:50,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29898/203307 [34:01:30<197:20:50,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29899/203307 [34:01:34<197:20:44,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29899/203307 [34:01:34<197:20:44,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29900/203307 [34:01:39<197:20:41,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29900/203307 [34:01:39<197:20:41,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29901/203307 [34:01:42<197:20:35,  0.24it/s, v_num=t5e6, training/loss=0.0895]Epoch 0:  15%|█▍        | 29901/203307 [34:01:42<197:20:35,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29902/203307 [34:01:47<197:20:32,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29902/203307 [34:01:47<197:20:32,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29903/203307 [34:01:51<197:20:29,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29903/203307 [34:01:51<197:20:29,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29904/203307 [34:01:55<197:20:26,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29904/203307 [34:01:55<197:20:26,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29905/203307 [34:02:00<197:20:23,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29905/203307 [34:02:00<197:20:23,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29906/203307 [34:02:03<197:20:17,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29906/203307 [34:02:03<197:20:17,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29907/203307 [34:02:08<197:20:14,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29907/203307 [34:02:08<197:20:14,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29908/203307 [34:02:11<197:20:08,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29908/203307 [34:02:11<197:20:08,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29909/203307 [34:02:16<197:20:06,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29909/203307 [34:02:16<197:20:06,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29910/203307 [34:02:20<197:20:03,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29910/203307 [34:02:20<197:20:03,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29911/203307 [34:02:24<197:19:58,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29911/203307 [34:02:24<197:19:58,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29912/203307 [34:02:28<197:19:54,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29912/203307 [34:02:28<197:19:54,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29913/203307 [34:02:33<197:19:53,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29913/203307 [34:02:33<197:19:53,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29914/203307 [34:02:37<197:19:47,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29914/203307 [34:02:37<197:19:47,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29915/203307 [34:02:41<197:19:45,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29915/203307 [34:02:41<197:19:45,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29916/203307 [34:02:45<197:19:39,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29916/203307 [34:02:45<197:19:39,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29917/203307 [34:02:49<197:19:34,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29917/203307 [34:02:49<197:19:34,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29918/203307 [34:02:53<197:19:32,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29918/203307 [34:02:53<197:19:32,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29919/203307 [34:02:58<197:19:29,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29919/203307 [34:02:58<197:19:29,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29920/203307 [34:03:01<197:19:23,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29920/203307 [34:03:01<197:19:23,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29921/203307 [34:03:06<197:19:21,  0.24it/s, v_num=t5e6, training/loss=0.0853]Epoch 0:  15%|█▍        | 29921/203307 [34:03:06<197:19:21,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29922/203307 [34:03:10<197:19:20,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29922/203307 [34:03:10<197:19:20,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29923/203307 [34:03:14<197:19:15,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29923/203307 [34:03:14<197:19:15,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29924/203307 [34:03:19<197:19:13,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29924/203307 [34:03:19<197:19:13,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29925/203307 [34:03:22<197:19:07,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29925/203307 [34:03:22<197:19:07,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29926/203307 [34:03:27<197:19:04,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29926/203307 [34:03:27<197:19:04,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29927/203307 [34:03:31<197:18:58,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29927/203307 [34:03:31<197:18:58,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29928/203307 [34:03:35<197:18:56,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29928/203307 [34:03:35<197:18:56,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29929/203307 [34:03:39<197:18:49,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29929/203307 [34:03:39<197:18:49,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29930/203307 [34:03:43<197:18:48,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29930/203307 [34:03:43<197:18:48,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29931/203307 [34:03:47<197:18:42,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29931/203307 [34:03:47<197:18:42,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29932/203307 [34:03:51<197:18:36,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29932/203307 [34:03:51<197:18:37,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29933/203307 [34:03:55<197:18:35,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29933/203307 [34:03:55<197:18:35,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29934/203307 [34:03:59<197:18:29,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29934/203307 [34:03:59<197:18:29,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29935/203307 [34:04:03<197:18:26,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29935/203307 [34:04:03<197:18:26,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29936/203307 [34:04:08<197:18:23,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29936/203307 [34:04:08<197:18:23,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29937/203307 [34:04:12<197:18:17,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29937/203307 [34:04:12<197:18:17,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29938/203307 [34:04:16<197:18:14,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29938/203307 [34:04:16<197:18:14,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29939/203307 [34:04:20<197:18:12,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29939/203307 [34:04:20<197:18:12,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29940/203307 [34:04:24<197:18:05,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29940/203307 [34:04:24<197:18:05,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29941/203307 [34:04:28<197:18:04,  0.24it/s, v_num=t5e6, training/loss=0.0879]Epoch 0:  15%|█▍        | 29941/203307 [34:04:28<197:18:04,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29942/203307 [34:04:32<197:17:58,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29942/203307 [34:04:32<197:17:58,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29943/203307 [34:04:36<197:17:51,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29943/203307 [34:04:36<197:17:51,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29944/203307 [34:04:40<197:17:49,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29944/203307 [34:04:40<197:17:49,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29945/203307 [34:04:44<197:17:45,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29945/203307 [34:04:44<197:17:45,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29946/203307 [34:04:49<197:17:42,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29946/203307 [34:04:49<197:17:42,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29947/203307 [34:04:52<197:17:36,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29947/203307 [34:04:52<197:17:36,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29948/203307 [34:04:57<197:17:34,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29948/203307 [34:04:57<197:17:34,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29949/203307 [34:05:01<197:17:27,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29949/203307 [34:05:01<197:17:27,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29950/203307 [34:05:05<197:17:25,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29950/203307 [34:05:05<197:17:25,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29951/203307 [34:05:09<197:17:19,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29951/203307 [34:05:09<197:17:19,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29952/203307 [34:05:13<197:17:16,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29952/203307 [34:05:13<197:17:16,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29953/203307 [34:05:17<197:17:10,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29953/203307 [34:05:17<197:17:10,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29954/203307 [34:05:21<197:17:07,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29954/203307 [34:05:21<197:17:07,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29955/203307 [34:05:25<197:17:04,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29955/203307 [34:05:25<197:17:04,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29956/203307 [34:05:30<197:17:02,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29956/203307 [34:05:30<197:17:02,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29957/203307 [34:05:34<197:16:59,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29957/203307 [34:05:34<197:16:59,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29958/203307 [34:05:38<197:16:53,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29958/203307 [34:05:38<197:16:53,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29959/203307 [34:05:42<197:16:50,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29959/203307 [34:05:42<197:16:50,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29960/203307 [34:05:46<197:16:45,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29960/203307 [34:05:46<197:16:45,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29961/203307 [34:05:50<197:16:42,  0.24it/s, v_num=t5e6, training/loss=0.0821]Epoch 0:  15%|█▍        | 29961/203307 [34:05:50<197:16:42,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29962/203307 [34:05:55<197:16:39,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29962/203307 [34:05:55<197:16:39,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29963/203307 [34:05:59<197:16:36,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29963/203307 [34:05:59<197:16:36,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29964/203307 [34:06:03<197:16:31,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29964/203307 [34:06:03<197:16:31,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29965/203307 [34:06:07<197:16:29,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29965/203307 [34:06:07<197:16:29,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29966/203307 [34:06:12<197:16:26,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29966/203307 [34:06:12<197:16:26,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29967/203307 [34:06:16<197:16:23,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29967/203307 [34:06:16<197:16:23,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29968/203307 [34:06:20<197:16:18,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29968/203307 [34:06:20<197:16:18,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29969/203307 [34:06:24<197:16:12,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29969/203307 [34:06:24<197:16:12,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29970/203307 [34:06:28<197:16:09,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29970/203307 [34:06:28<197:16:09,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29971/203307 [34:06:32<197:16:07,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29971/203307 [34:06:32<197:16:07,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29972/203307 [34:06:36<197:16:01,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29972/203307 [34:06:36<197:16:01,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29973/203307 [34:06:40<197:15:55,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29973/203307 [34:06:40<197:15:55,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29974/203307 [34:06:44<197:15:53,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29974/203307 [34:06:44<197:15:53,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29975/203307 [34:06:49<197:15:50,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29975/203307 [34:06:49<197:15:50,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29976/203307 [34:06:53<197:15:47,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29976/203307 [34:06:53<197:15:47,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29977/203307 [34:06:57<197:15:41,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29977/203307 [34:06:57<197:15:42,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29978/203307 [34:07:01<197:15:39,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29978/203307 [34:07:01<197:15:39,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29979/203307 [34:07:05<197:15:33,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29979/203307 [34:07:05<197:15:33,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29980/203307 [34:07:09<197:15:30,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29980/203307 [34:07:09<197:15:30,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29981/203307 [34:07:13<197:15:25,  0.24it/s, v_num=t5e6, training/loss=0.0932]Epoch 0:  15%|█▍        | 29981/203307 [34:07:13<197:15:25,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29982/203307 [34:07:18<197:15:23,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29982/203307 [34:07:18<197:15:23,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29983/203307 [34:07:21<197:15:17,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29983/203307 [34:07:21<197:15:17,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29984/203307 [34:07:26<197:15:14,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29984/203307 [34:07:26<197:15:14,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29985/203307 [34:07:30<197:15:11,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29985/203307 [34:07:30<197:15:11,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29986/203307 [34:07:34<197:15:05,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29986/203307 [34:07:34<197:15:05,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29987/203307 [34:07:38<197:15:02,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29987/203307 [34:07:38<197:15:02,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29988/203307 [34:07:42<197:14:59,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29988/203307 [34:07:42<197:14:59,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29989/203307 [34:07:46<197:14:53,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29989/203307 [34:07:46<197:14:53,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29990/203307 [34:07:50<197:14:46,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29990/203307 [34:07:50<197:14:46,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29991/203307 [34:07:54<197:14:44,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29991/203307 [34:07:54<197:14:44,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29992/203307 [34:07:58<197:14:37,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29992/203307 [34:07:58<197:14:37,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29993/203307 [34:08:02<197:14:35,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29993/203307 [34:08:02<197:14:35,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29994/203307 [34:08:06<197:14:28,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29994/203307 [34:08:06<197:14:28,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29995/203307 [34:08:10<197:14:22,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29995/203307 [34:08:10<197:14:22,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29996/203307 [34:08:14<197:14:19,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29996/203307 [34:08:14<197:14:19,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29997/203307 [34:08:18<197:14:17,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29997/203307 [34:08:18<197:14:17,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29998/203307 [34:08:22<197:14:10,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29998/203307 [34:08:22<197:14:10,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29999/203307 [34:08:26<197:14:04,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 29999/203307 [34:08:26<197:14:04,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 30000/203307 [34:08:30<197:14:02,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 30000/203307 [34:08:30<197:14:02,  0.24it/s, v_num=t5e6, training/loss=0.0764]
Validation: |          | 0/? [00:00<?, ?it/s][A
Validation:   0%|          | 0/1 [00:00<?, ?it/s][A


Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s][A[A

Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:26,  1.15it/s][A[A

Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:24,  1.15it/s][A[A

Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:23,  1.17it/s][A[A

Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:22,  1.17it/s][A[A

Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:21,  1.17it/s][A[A

Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:20,  1.17it/s][A[A

Sampling (mamba memory):  54%|█████▎    | 107/200 [00:05<01:19,  1.17it/s][A[A

Sampling (mamba memory):  54%|█████▍    | 108/200 [00:06<01:18,  1.17it/s][A[A

Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:18,  1.17it/s][A[A

Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:17,  1.17it/s][A[A

Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:26,  1.15it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:25,  1.15it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:24,  1.15it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:23,  1.15it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:22,  1.15it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:21,  1.15it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:20,  1.16it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:06<01:19,  1.16it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:18,  1.16it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:18,  1.15it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:17,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:27,  1.13it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:26,  1.13it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:25,  1.13it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:24,  1.13it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:24,  1.13it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:23,  1.13it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:22,  1.13it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:21,  1.13it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:20,  1.13it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:19,  1.14it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:17,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:28,  1.12it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:27,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:26,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:25,  1.12it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:24,  1.12it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:23,  1.12it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:22,  1.13it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:21,  1.14it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:19,  1.14it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:18,  1.14it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:17,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:28,  1.12it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:27,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:26,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:25,  1.12it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:24,  1.12it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:23,  1.12it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:22,  1.12it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:21,  1.12it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:21,  1.12it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:20,  1.12it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:19,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:28,  1.12it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:27,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:26,  1.12it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:25,  1.12it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:25,  1.12it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:24,  1.11it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:23,  1.12it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:22,  1.12it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:21,  1.12it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:20,  1.11it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:19,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:30,  1.09it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:29,  1.09it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:28,  1.09it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:27,  1.09it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:26,  1.10it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:25,  1.10it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:24,  1.10it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:23,  1.10it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:22,  1.10it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:09<01:22,  1.10it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:10<01:21,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:32,  1.08it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:30,  1.09it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:29,  1.08it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:29,  1.08it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:28,  1.08it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:27,  1.07it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:26,  1.07it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:25,  1.07it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:25,  1.07it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:09<01:24,  1.07it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:10<01:23,  1.0Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:16,  1.17it/s][A[A

Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:15,  1.16it/s][A[A

Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:14,  1.16it/s][A[A

Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:13,  1.17it/s][A[A

Sampling (mamba memory):  57%|█████▊    | 115/200 [00:12<01:13,  1.16it/s][A[A

Sampling (mamba memory):  58%|█████▊    | 116/200 [00:13<01:12,  1.16it/s][A[A

Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:11,  1.17it/s][A[A

Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:10,  1.17it/s][A[A

Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:09,  1.16it/s][A[A

Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:08,  1.16it/s][A[A

Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:07,  1.16it/s][A[A

Sampling (mamba memory):  61%|██████    | 122/200 [00:18<01:07,  1.16it/s][A[A

5it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:16,  1.15it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:15,  1.15it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:15,  1.14it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:14,  1.14it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:13<01:13,  1.14it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:13,  1.14it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:12,  1.13it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:11,  1.13it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:10,  1.13it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:10,  1.13it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:09,  1.12it/s]Sampling (mamba memory):  62%|██████▏   | 123/4it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:17,  1.14it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:16,  1.14it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:15,  1.14it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:14,  1.14it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:14,  1.13it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:13,  1.13it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:12,  1.13it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:11,  1.13it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:10,  1.13it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:10,  1.13it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:09,  1.12it/s]Sampling (mamba memory):  62%|██████▏   | 123/4it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:17,  1.14it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:16,  1.13it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:16,  1.13it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:15,  1.13it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:14,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:14,  1.12it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:13,  1.11it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:13,  1.11it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:12,  1.11it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:11,  1.11it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:10,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 123/Sampling (mamba memory):  62%|██████▏   | 123/200 [00:19<01:06,  1.16it/s][A[A

2it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:18,  1.12it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:17,  1.12it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:17,  1.11it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:16,  1.11it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:15,  1.11it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:15,  1.10it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:14,  1.10it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:13,  1.10it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:13,  1.09it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:12,  1.09it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:11,  1.09it/s]Sampling (mamba memory):  62%|██████▏   | 123/1it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:19,  1.11it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:18,  1.11it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:17,  1.11it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:16,  1.11it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:16,  1.10it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:15,  1.10it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:14,  1.10it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:13,  1.10it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:12,  1.10it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:12,  1.10it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:11,  1.09it/s]Sampling (mamba memory):  62%|██████▏   | 123/0it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:20,  1.09it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:19,  1.09it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:18,  1.09it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:18,  1.09it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:17,  1.09it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:16,  1.08it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:15,  1.08it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:14,  1.08it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:14,  1.08it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:19<01:13,  1.08it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:20<01:12,  1.07it/s]Sampling (mamba memory):  62%|██████▏   | 123/Sampling (mamba memory):  62%|██████▏   | 124/200 [00:20<01:06,  1.15it/s][A[A

7it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:11<01:22,  1.07it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:12<01:21,  1.07it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:13<01:20,  1.07it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:14<01:20,  1.06it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:19,  1.06it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:18,  1.05it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:18,  1.05it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:16,  1.05it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:16,  1.05it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:19<01:14,  1.06it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:20<01:14,  1.05it/s]Sampling (mamba memory):  62%|██████▏   | 123/Sampling (mamba memory):  62%|██████▎   | 125/200 [00:21<01:05,  1.14it/s][A[A

Sampling (mamba memory):  63%|██████▎   | 126/200 [00:22<01:05,  1.14it/s][A[A

Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:04,  1.13it/s][A[A

Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:03,  1.13it/s][A[A

Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:02,  1.13it/s][A[A

Sampling (mamba memory):  65%|██████▌   | 130/200 [00:25<01:01,  1.13it/s][A[A

Sampling (mamba memory):  66%|██████▌   | 131/200 [00:26<01:01,  1.13it/s][A[A

Sampling (mamba memory):  66%|██████▌   | 132/200 [00:27<01:00,  1.13it/s][A[A

Sampling (mamba memory):  66%|██████▋   | 133/200 [00:28<00:59,  1.13it/s][A[A

Sampling (mamba memory):  67%|██████▋   | 134/200 [00:29<00:58,  1.13it/s][A[A

200 [00:20<01:08,  1.12it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:07,  1.12it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:21<01:07,  1.12it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:22<01:06,  1.11it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:05,  1.11it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:04,  1.11it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:03,  1.11it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:03,  1.11it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:02,  1.11it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:01,  1.10it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:00,  1.10it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<00:59,  1.10it/s]Sampling (mamba 200 [00:20<01:08,  1.12it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:07,  1.12it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:07,  1.11it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:06,  1.11it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:05,  1.11it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:04,  1.11it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:04,  1.11it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:03,  1.10it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:02,  1.10it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:01,  1.10it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:01,  1.10it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:00,  1.09it/s]Sampling (mamba Sampling (mamba memory):  68%|██████▊   | 135/200 [00:30<00:57,  1.13it/s][A[A

200 [00:20<01:09,  1.10it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:08,  1.10it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:08,  1.10it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:07,  1.09it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:06,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:06,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:05,  1.09it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:04,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:03,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:02,  1.09it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:01,  1.08it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:01,  1.08it/s]Sampling (mamba 200 [00:20<01:10,  1.09it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:09,  1.09it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:08,  1.09it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:08,  1.09it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:07,  1.08it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:06,  1.08it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:05,  1.08it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:05,  1.08it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:04,  1.08it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:03,  1.08it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:02,  1.07it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<01:01,  1.07it/s]Sampling (mamba 200 [00:20<01:10,  1.09it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:09,  1.09it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:09,  1.08it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:08,  1.08it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:07,  1.08it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:06,  1.08it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:05,  1.08it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:05,  1.07it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:04,  1.07it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:03,  1.06it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:03,  1.06it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<01:02,  1.06it/s]Sampling (mamba Sampling (mamba memory):  68%|██████▊   | 136/200 [00:31<00:57,  1.12it/s][A[A

200 [00:21<01:11,  1.07it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:22<01:10,  1.07it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:23<01:10,  1.07it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:09,  1.07it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:08,  1.07it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:07,  1.06it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:06,  1.06it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:06,  1.06it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:05,  1.06it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:04,  1.06it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:03,  1.06it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<01:02,  1.05it/s]Sampling (mamba Sampling (mamba memory):  68%|██████▊   | 137/200 [00:32<00:56,  1.12it/s][A[A

200 [00:21<01:13,  1.05it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:22<01:12,  1.05it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:23<01:11,  1.05it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:24<01:10,  1.05it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:25<01:09,  1.05it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:26<01:08,  1.05it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:27<01:07,  1.05it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:28<01:06,  1.05it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:29<01:05,  1.05it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:30<01:04,  1.05it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:31<01:04,  1.04it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:32<01:03,  1.04it/s]Sampling (mamba Sampling (mamba memory):  69%|██████▉   | 138/200 [00:33<00:55,  1.11it/s][A[A

Sampling (mamba memory):  70%|██████▉   | 139/200 [00:34<00:55,  1.11it/s][A[A

Sampling (mamba memory):  70%|███████   | 140/200 [00:34<00:54,  1.10it/s][A[A

Sampling (mamba memory):  70%|███████   | 141/200 [00:35<00:53,  1.10it/s][A[A

Sampling (mamba memory):  71%|███████   | 142/200 [00:36<00:52,  1.10it/s][A[A

Sampling (mamba memory):  72%|███████▏  | 143/200 [00:37<00:52,  1.10it/s][A[A

Sampling (mamba memory):  72%|███████▏  | 144/200 [00:38<00:51,  1.10it/s][A[A

Sampling (mamba memory):  72%|███████▎  | 145/200 [00:39<00:50,  1.09it/s][A[A

memory):  68%|██████▊   | 135/200 [00:31<00:59,  1.10it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:31<00:58,  1.10it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:32<00:57,  1.09it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:33<00:56,  1.09it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:34<00:55,  1.09it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:35<00:54,  1.09it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:36<00:54,  1.09it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:37<00:53,  1.09it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:38<00:52,  1.09it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:51,  1.09it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:50,  1.08it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  73%|███████▎  | 146/200 [00:40<00:49,  1.10it/s][A[A

memory):  68%|██████▊   | 135/200 [00:31<00:59,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:58,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:57,  1.09it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:57,  1.09it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:34<00:56,  1.09it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:35<00:55,  1.09it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:36<00:54,  1.09it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:37<00:53,  1.09it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:38<00:52,  1.08it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:51,  1.08it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:51,  1.07it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:31<01:00,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:59,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:58,  1.07it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:57,  1.07it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:56,  1.07it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:56,  1.07it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:55,  1.07it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:54,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:53,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:52,  1.07it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:51,  1.06it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▎  | 147/200 [00:41<00:48,  1.10it/s][A[A

memory):  68%|██████▊   | 135/200 [00:31<01:00,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<01:00,  1.06it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:59,  1.06it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:58,  1.06it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:57,  1.06it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:56,  1.06it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:56,  1.05it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:55,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:54,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:53,  1.05it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:52,  1.05it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:31<01:01,  1.06it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<01:00,  1.06it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:59,  1.06it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:58,  1.06it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:57,  1.06it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:56,  1.06it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:55,  1.06it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:54,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:54,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:53,  1.05it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:52,  1.05it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:32<01:01,  1.05it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:33<01:01,  1.05it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:34<01:00,  1.05it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:35<00:59,  1.05it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:36<00:58,  1.05it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:37<00:57,  1.05it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:38<00:56,  1.05it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:39<00:55,  1.04it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:40<00:54,  1.04it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:41<00:53,  1.04it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:42<00:53,  1.04it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▍  | 148/200 [00:42<00:47,  1.10it/s][A[A

memory):  68%|██████▊   | 135/200 [00:33<01:02,  1.03it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:34<01:02,  1.03it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:35<01:01,  1.03it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:36<01:00,  1.03it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:37<00:59,  1.02it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:38<00:58,  1.02it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:39<00:57,  1.02it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:39<00:56,  1.03it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:40<00:55,  1.02it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:41<00:54,  1.02it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:42<00:53,  1.02it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▍  | 149/200 [00:43<00:46,  1.10it/s][A[A

Sampling (mamba memory):  75%|███████▌  | 150/200 [00:44<00:45,  1.10it/s][A[A

Sampling (mamba memory):  76%|███████▌  | 151/200 [00:44<00:44,  1.09it/s][A[A

Sampling (mamba memory):  76%|███████▌  | 152/200 [00:45<00:43,  1.09it/s][A[A

Sampling (mamba memory):  76%|███████▋  | 153/200 [00:46<00:43,  1.09it/s][A[A

Sampling (mamba memory):  77%|███████▋  | 154/200 [00:47<00:42,  1.09it/s][A[A

Sampling (mamba memory):  78%|███████▊  | 155/200 [00:48<00:41,  1.08it/s][A[A

Sampling (mamba memory):  78%|███████▊  | 156/200 [00:49<00:40,  1.08it/s][A[A

Sampling (mamba memory):  78%|███████▊  | 157/200 [00:50<00:40,  1.07it/s][A[A

 | 146/200 [00:41<00:50,  1.08it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:49,  1.08it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:48,  1.07it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:43<00:47,  1.07it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:44<00:46,  1.07it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:45<00:45,  1.07it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:46<00:45,  1.06it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:47<00:44,  1.06it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:48<00:43,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:49<00:42,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:50<00:41,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:51<00:40 | 146/200 [00:41<00:50,  1.07it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:49,  1.07it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:48,  1.07it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:47,  1.06it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:47,  1.06it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:46,  1.06it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:45,  1.06it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:44,  1.06it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:43,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:49<00:42,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:50<00:41,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:51<00:40Sampling (mamba memory):  79%|███████▉  | 158/200 [00:51<00:39,  1.07it/s][A[A

 | 146/200 [00:41<00:50,  1.06it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:49,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:49,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:48,  1.06it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:47,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:46,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:45,  1.04it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:45,  1.03it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:44,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:43,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:42,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:41 | 146/200 [00:42<00:51,  1.05it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:50,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:49,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:48,  1.04it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:47,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:47,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:48<00:46,  1.04it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:49<00:45,  1.04it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:50<00:44,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:51<00:43,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:52<00:42,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:53<00:41 | 146/200 [00:42<00:51,  1.05it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:50,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:49,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:48,  1.05it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:47,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:47,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:48<00:46,  1.03it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:49<00:45,  1.03it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:50<00:44,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:51<00:43,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:52<00:42,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:53<00:41Sampling (mamba memory):  80%|███████▉  | 159/200 [00:52<00:38,  1.07it/s][A[A

 | 146/200 [00:43<00:52,  1.04it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:44<00:51,  1.03it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:45<00:50,  1.03it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:46<00:49,  1.02it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:47<00:48,  1.02it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:47,  1.02it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:48<00:46,  1.02it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:49<00:46,  1.02it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:50<00:45,  1.02it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:51<00:44,  1.01it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:52<00:43,  1.01it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:53<00:42Sampling (mamba memory):  80%|████████  | 160/200 [00:53<00:37,  1.07it/s][A[A

 | 146/200 [00:43<00:52,  1.02it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:44<00:51,  1.02it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:45<00:51,  1.02it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:46<00:50,  1.02it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:47<00:49,  1.01it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:48<00:48,  1.00it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:49<00:47,  1.00it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:50<00:47,  1.00s/it]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:51<00:46,  1.00s/it]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:52<00:44,  1.00it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:53<00:44,  1.00s/it]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:54<00:43Sampling (mamba memory):  80%|████████  | 161/200 [00:54<00:36,  1.07it/s][A[A

Sampling (mamba memory):  81%|████████  | 162/200 [00:55<00:35,  1.07it/s][A[A

Sampling (mamba memory):  82%|████████▏ | 163/200 [00:56<00:34,  1.07it/s][A[A

Sampling (mamba memory):  82%|████████▏ | 164/200 [00:57<00:33,  1.06it/s][A[A

Sampling (mamba memory):  82%|████████▎ | 165/200 [00:58<00:33,  1.06it/s][A[A

Sampling (mamba memory):  83%|████████▎ | 166/200 [00:59<00:32,  1.06it/s][A[A

Sampling (mamba memory):  84%|████████▎ | 167/200 [00:59<00:31,  1.05it/s][A[A

Sampling (mamba memory):  84%|████████▍ | 168/200 [01:00<00:30,  1.05it/s][A[A

,  1.05it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:52<00:39,  1.05it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:53<00:38,  1.05it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:54<00:38,  1.05it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:55<00:37,  1.05it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:56<00:36,  1.05it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:57<00:35,  1.05it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:58<00:34,  1.05it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [00:59<00:33,  1.04it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:00<00:32,  1.04it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:01<00:31,  1.03it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:02<00:31,  1.03it/s,  1.05it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:52<00:39,  1.05it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:53<00:38,  1.05it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:54<00:38,  1.05it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:55<00:37,  1.05it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:56<00:36,  1.05it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:57<00:35,  1.05it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:58<00:34,  1.04it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [00:59<00:33,  1.04it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:00<00:32,  1.03it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:01<00:32,  1.03it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:02<00:31,  1.02it/sSampling (mamba memory):  84%|████████▍ | 169/200 [01:01<00:29,  1.05it/s][A[A

,  1.03it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:53<00:40,  1.03it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:54<00:39,  1.03it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:55<00:38,  1.03it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:56<00:37,  1.03it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:57<00:37,  1.03it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:36,  1.03it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:35,  1.02it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:34,  1.02it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:33,  1.03it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:02<00:32,  1.02it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:03<00:31,  1.02it/sSampling (mamba memory):  85%|████████▌ | 170/200 [01:02<00:28,  1.05it/s][A[A

,  1.03it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:54<00:40,  1.03it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:55<00:39,  1.03it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:56<00:39,  1.02it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:56<00:38,  1.02it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:57<00:37,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:36,  1.01it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:35,  1.01it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:34,  1.01it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:33,  1.00it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:02<00:32,  1.00it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:03<00:32,  1.00s/it,  1.03it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:54<00:41,  1.02it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:55<00:40,  1.02it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:56<00:39,  1.02it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:57<00:38,  1.02it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:58<00:37,  1.02it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:59<00:36,  1.01it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:00<00:35,  1.01it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:01<00:34,  1.01it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:02<00:33,  1.00it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:03<00:32,  1.00it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:04<00:31,  1.00it/sSampling (mamba memory):  86%|████████▌ | 171/200 [01:03<00:27,  1.04it/s][A[A

,  1.01it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:54<00:41,  1.01it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:55<00:40,  1.00it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:56<00:39,  1.00it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:57<00:38,  1.00it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:58<00:38,  1.00s/it]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:59<00:37,  1.00s/it]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:00<00:36,  1.01s/it]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:01<00:35,  1.01s/it]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:02<00:34,  1.01s/it]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:03<00:33,  1.01s/it]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:05<00:32,  1.01s/itSampling (mamba memory):  86%|████████▌ | 172/200 [01:04<00:26,  1.04it/s][A[A

,  1.00s/it]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:55<00:42,  1.00s/it]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:56<00:41,  1.00s/it]Sampling (mamba memory):  80%|████████  | 160/200 [00:57<00:40,  1.01s/it]Sampling (mamba memory):  80%|████████  | 161/200 [00:58<00:39,  1.01s/it]Sampling (mamba memory):  81%|████████  | 162/200 [00:59<00:38,  1.01s/it]Sampling (mamba memory):  82%|████████▏ | 163/200 [01:00<00:37,  1.01s/it]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:02<00:36,  1.02s/it]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:03<00:35,  1.03s/it]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:04<00:34,  1.03s/it]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:05<00:33,  1.03s/it]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:06<00:32,  1.03s/itSampling (mamba memory):  86%|████████▋ | 173/200 [01:05<00:25,  1.04it/s][A[A

Sampling (mamba memory):  87%|████████▋ | 174/200 [01:06<00:25,  1.04it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 175/200 [01:07<00:24,  1.04it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 176/200 [01:08<00:23,  1.04it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 177/200 [01:09<00:22,  1.04it/s][A[A

Sampling (mamba memory):  89%|████████▉ | 178/200 [01:10<00:21,  1.04it/s][A[A

Sampling (mamba memory):  90%|████████▉ | 179/200 [01:11<00:20,  1.04it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:03<00:30,  1.03it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:04<00:29,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:05<00:28,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:06<00:27,  1.02it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:07<00:26,  1.02it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:08<00:25,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:09<00:24,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:09<00:23,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:10<00:22,  1.02it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:11<00:21,  1.01it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:12<00:20,  1.01it/s]]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:03<00:30,  1.02it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:04<00:29,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:05<00:28,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:06<00:27,  1.01it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:07<00:26,  1.01it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:08<00:25,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:09<00:24,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:10<00:23,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:11<00:22,  1.01it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:12<00:21,  1.01it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:13<00:20,  1.01it/s]Sampling (mamba memory):  90%|█████████ | 180/200 [01:12<00:19,  1.04it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:04<00:30,  1.02it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:05<00:29,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:06<00:28,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:07<00:27,  1.02it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:08<00:26,  1.02it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:09<00:25,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:10<00:24,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:11<00:23,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:12<00:22,  1.02it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:13<00:21,  1.02it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:14<00:20,  1.01it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:13<00:18,  1.03it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:04<00:31,  1.00s/it]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:05<00:30,  1.00s/it]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:07<00:29,  1.00s/it]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:08<00:28,  1.00s/it]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:09<00:27,  1.00s/it]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:10<00:26,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:11<00:25,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:12<00:24,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:13<00:23,  1.01s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:14<00:22,  1.02s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:15<00:21,  1.02s/it]]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:05<00:31,  1.00s/it]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:06<00:30,  1.00s/it]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:07<00:29,  1.01s/it]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:08<00:28,  1.01s/it]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:09<00:27,  1.01s/it]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:10<00:26,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:11<00:25,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:12<00:24,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:13<00:23,  1.01s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:14<00:22,  1.01s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:15<00:21,  1.01s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:14<00:17,  1.03it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:06<00:31,  1.02s/it]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:07<00:30,  1.02s/it]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:08<00:29,  1.02s/it]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:09<00:28,  1.02s/it]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:10<00:27,  1.02s/it]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:11<00:26,  1.02s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:12<00:25,  1.02s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:13<00:24,  1.02s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:14<00:23,  1.03s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:15<00:22,  1.03s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:16<00:21,  1.03s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:15<00:16,  1.03it/s][A[A

Sampling (mamba memory):  92%|█████████▏| 184/200 [01:16<00:15,  1.03it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:07<00:31,  1.03s/it]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:08<00:30,  1.03s/it]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:09<00:29,  1.03s/it]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:10<00:28,  1.03s/it]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:11<00:27,  1.03s/it]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:12<00:26,  1.03s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:13<00:25,  1.04s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:14<00:24,  1.04s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:15<00:24,  1.04s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:16<00:23,  1.05s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:17<00:22,  1.05s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:17<00:14,  1.03it/s][A[A

Sampling (mamba memory):  93%|█████████▎| 186/200 [01:18<00:13,  1.03it/s][A[A

Sampling (mamba memory):  94%|█████████▎| 187/200 [01:19<00:12,  1.02it/s][A[A

Sampling (mamba memory):  94%|█████████▍| 188/200 [01:20<00:11,  1.02it/s][A[A

Sampling (mamba memory):  94%|█████████▍| 189/200 [01:21<00:10,  1.02it/s][A[A

Sampling (mamba memory):  95%|█████████▌| 190/200 [01:22<00:09,  1.02it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:13<00:19,  1.01it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:14<00:18,  1.01it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:15<00:17,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:16<00:16,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:17<00:15,  1.01it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:18<00:14,  1.01it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:19<00:13,  1.01it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:20<00:12,  1.00it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:21<00:11,  1.00it/s]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:22<00:11,  1.00s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:23<00Sampling (mamba memory):  96%|█████████▌| 191/200 [01:23<00:08,  1.02it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:14<00:19,  1.01it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:15<00:18,  1.01it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:16<00:17,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:17<00:16,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:18<00:15,  1.01it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:19<00:14,  1.01it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:20<00:13,  1.01it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:21<00:12,  1.01it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:22<00:11,  1.01it/s]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:23<00:10,  1.00it/s]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:24<00Sampling (mamba memory):  90%|█████████ | 180/200 [01:15<00:19,  1.01it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:16<00:18,  1.01it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:17<00:17,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:18<00:16,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:19<00:15,  1.01it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:20<00:14,  1.01it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:21<00:13,  1.01it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:22<00:12,  1.00it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:23<00:11,  1.00it/s]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:24<00:11,  1.00s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:25<00Sampling (mamba memory):  96%|█████████▌| 192/200 [01:24<00:07,  1.02it/s][A[A

Sampling (mamba memory):  96%|█████████▋| 193/200 [01:25<00:06,  1.02it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:16<00:20,  1.02s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:17<00:19,  1.02s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:18<00:18,  1.02s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:19<00:17,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:20<00:16,  1.02s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:21<00:15,  1.02s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:22<00:14,  1.02s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:23<00:13,  1.02s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:24<00:12,  1.02s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:25<00:11,  1.03s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:26<00Sampling (mamba memory):  90%|█████████ | 180/200 [01:16<00:20,  1.02s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:17<00:19,  1.02s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:18<00:18,  1.02s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:19<00:17,  1.02s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:20<00:16,  1.02s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:21<00:15,  1.02s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:22<00:14,  1.02s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:23<00:13,  1.02s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:24<00:12,  1.02s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:25<00:11,  1.03s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:26<00Sampling (mamba memory):  97%|█████████▋| 194/200 [01:26<00:05,  1.02it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:17<00:20,  1.04s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:18<00:19,  1.04s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:19<00:18,  1.04s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:20<00:17,  1.03s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:21<00:16,  1.04s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:22<00:15,  1.04s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:23<00:14,  1.04s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:24<00:13,  1.04s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:25<00:12,  1.05s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:26<00:11,  1.05s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:27<00Sampling (mamba memory):  98%|█████████▊| 195/200 [01:27<00:04,  1.02it/s][A[A

Sampling (mamba memory):  98%|█████████▊| 196/200 [01:28<00:03,  1.01it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:18<00:21,  1.05s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:19<00:20,  1.05s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:20<00:18,  1.05s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:21<00:17,  1.06s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:22<00:16,  1.06s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:23<00:15,  1.06s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:25<00:14,  1.06s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:26<00:13,  1.06s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:27<00:12,  1.06s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:28<00:11,  1.07s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:29<00Sampling (mamba memory):  98%|█████████▊| 197/200 [01:29<00:02,  1.01it/s][A[A

Sampling (mamba memory):  99%|█████████▉| 198/200 [01:30<00:01,  1.01it/s][A[A

Sampling (mamba memory): 100%|█████████▉| 199/200 [01:31<00:00,  1.01it/s][A[A

Sampling (mamba memory): 100%|██████████| 200/200 [01:32<00:00,  1.00it/s][A[ASampling (mamba memory): 100%|██████████| 200/200 [01:37<00:00,  1.03it/s]
Validation DataLoader 0:   0%|          | 0/1 [00:00<?, ?it/s][A
:10,  1.00s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:24<00:09,  1.01s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:25<00:08,  1.01s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:26<00:07,  1.01s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:27<00:06,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:28<00:05,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:30<00:04,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:31<00:03,  1.02s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:32<00:02,  1.02s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:33<00:01,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:34<00:00,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:38<00:00,  1.01it/s]
:10,  1.00s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:25<00:09,  1.00s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:26<00:08,  1.00s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:27<00:07,  1.01s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:28<00:06,  1.00s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:29<00:05,  1.00s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:30<00:04,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:31<00:03,  1.02s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:32<00:02,  1.03s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:33<00:01,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:34<00:00,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:39<00:00,  1.01it/s]
:10,  1.00s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:26<00:09,  1.00s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:27<00:08,  1.00s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:28<00:07,  1.01s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:29<00:06,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:30<00:05,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:31<00:04,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:32<00:03,  1.01s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:33<00:02,  1.01s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:34<00:01,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:35<00:00,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:40<00:00,  1.00s/it]
:10,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:27<00:09,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:28<00:08,  1.03s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:29<00:07,  1.03s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:30<00:06,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:31<00:05,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:32<00:04,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:33<00:03,  1.04s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:34<00:02,  1.04s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:35<00:01,  1.04s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:36<00:00,  1.04s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:41<00:00,  1.01s/it]
:10,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:27<00:09,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:28<00:08,  1.03s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:29<00:07,  1.03s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:30<00:06,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:31<00:05,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:32<00:04,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:33<00:03,  1.04s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:34<00:02,  1.04s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:35<00:01,  1.04s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:36<00:00,  1.04s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:41<00:00,  1.02s/it]
:10,  1.05s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:28<00:09,  1.05s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:29<00:08,  1.05s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:31<00:07,  1.06s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:32<00:06,  1.06s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:33<00:05,  1.06s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:34<00:04,  1.06s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:35<00:03,  1.06s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:36<00:02,  1.05s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:37<00:01,  1.05s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:38<00:00,  1.06s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:43<00:00,  1.03s/it]
:10,  1.07s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:30<00:09,  1.07s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:31<00:08,  1.07s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:32<00:07,  1.07s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:33<00:06,  1.07s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:34<00:05,  1.07s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:35<00:04,  1.07s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:36<00:03,  1.07s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:37<00:02,  1.06s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:38<00:01,  1.06s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:39<00:00,  1.06s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:44<00:00,  1.04s/it]
Validation DataLoader 0: 100%|██████████| 1/1 [01:37<00:00,  0.01it/s][A
                                                                      [AEpoch 0:  15%|█▍        | 30000/203307 [34:10:26<197:25:14,  0.24it/s, v_num=t5e6, training/loss=0.0764]Epoch 0:  15%|█▍        | 30000/203307 [34:10:26<197:25:14,  0.24it/s, v_num=t5e6, training/loss=0.0764][2026-04-21 22:10:19,629][pytorch_lightning.utilities.rank_zero][INFO] - `Trainer.fit` stopped: `max_steps=30000` reached.
Traceback (most recent call last):
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
OSError: [Errno 16] Device or resource busy: '.nfsa3ec66c997b809390000009d'
Traceback (most recent call last):
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
OSError: [Errno 16] Device or resource busy: '.nfsf00aff1847ba1e55000000a3'
Traceback (most recent call last):
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
OSError: [Errno 16] Device or resource busy: '.nfs8ee042974b5da93c000000a2'
Traceback (most recent call last):
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
OSError: [Errno 16] Device or resource busy: '.nfs14a42632d05e7c6d000000a7'
Traceback (most recent call last):
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
OSError: [Errno 16] Device or resource busy: '.nfsbe3cf7472f23c976000000a9'
Traceback (most recent call last):
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
OSError: [Errno 16] Device or resource busy: '.nfs4192c6d0097bc581000000a8'
Traceback (most recent call last):
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
OSError: [Errno 16] Device or resource busy: '.nfs581c5382f7fea63a000000b9'
Traceback (most recent call last):
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
OSError: [Errno 16] Device or resource busy: '.nfsc1caa218e7e52aae000000ba'
Traceback (most recent call last):
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
OSError: [Errno 16] Device or resource busy: '.nfs6f0df8953e001836000000b2'
Traceback (most recent call last):
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
OSError: [Errno 16] Device or resource busy: '.nfsa8f13bd38d0182cc000000af'
Traceback (most recent call last):
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
OSError: [Errno 16] Device or resource busy: '.nfsfcc1f966ae19269e000000b7'
Traceback (most recent call last):
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
Traceback (most recent call last):
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
Traceback (most recent call last):
Traceback (most recent call last):
Traceback (most recent call last):
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
Traceback (most recent call last):
Traceback (most recent call last):
Traceback (most recent call last):
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
OSError: [Errno 16] Device or resource busy: '.nfsab5483cb9b5bc062000000a5'
OSError: [Errno 16] Device or resource busy: '.nfsa81c8970e3219a0c000000a4'
OSError: [Errno 16] Device or resource busy: '.nfsdc9b55676bed56bd000000a6'
Traceback (most recent call last):
Traceback (most recent call last):
Traceback (most recent call last):
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
OSError: [Errno 16] Device or resource busy: '.nfsae353460346f02db0000009d'
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
OSError: [Errno 16] Device or resource busy: '.nfsf1b01f312babe7020000009f'
OSError: [Errno 16] Device or resource busy: '.nfs73388f720663c0f10000009e'
Traceback (most recent call last):
Traceback (most recent call last):
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
OSError: [Errno 16] Device or resource busy: '.nfs4eb43b0a017a99aa000000aa'
OSError: [Errno 16] Device or resource busy: '.nfscc8455c7a1ea34ac000000ab'
Traceback (most recent call last):
Traceback (most recent call last):
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
OSError: [Errno 16] Device or resource busy: '.nfsa4b91e7b825efa96000000a1'
OSError: [Errno 16] Device or resource busy: '.nfs0d45051b4557d37a000000a0'
Traceback (most recent call last):
Traceback (most recent call last):
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
OSError: [Errno 16] Device or resource busy: '.nfs7b85fe61045a8f84000000b8'
OSError: [Errno 16] Device or resource busy: '.nfs1678da716c552a6d000000bb'
Traceback (most recent call last):
Traceback (most recent call last):
Traceback (most recent call last):
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
OSError: [Errno 16] Device or resource busy: '.nfsa42acf34dcba25ce000000b6'
OSError: [Errno 16] Device or resource busy: '.nfs1ab163cdb5a9523e000000b5'
OSError: [Errno 16] Device or resource busy: '.nfsf5f03d9ce69f3d38000000b4'
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
Traceback (most recent call last):
OSError: [Errno 16] Device or resource busy: '.nfsa28aa0a30c200732000000ad'
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
OSError: [Errno 16] Device or resource busy: '.nfs6d27300dbb44477f000000ac'
OSError: [Errno 16] Device or resource busy: '.nfse170f681254a7b49000000ae'
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
OSError: [Errno 16] Device or resource busy: '.nfs0c3a17684eab1608000000b1'
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
OSError: [Errno 16] Device or resource busy: '.nfs9a879d1a8463f1ff000000b3'
OSError: [Errno 16] Device or resource busy: '.nfs60e6889197b8e09a000000b0'
Traceback (most recent call last):
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
OSError: [Errno 16] Device or resource busy: '.nfs119405b5c27cd404000000bc'
Epoch 0:  15%|█▍        | 30000/203307 [34:10:26<197:25:14,  0.24it/s, v_num=t5e6, training/loss=0.0764]
Traceback (most recent call last):
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
OSError: [Errno 16] Device or resource busy: '.nfscce18bebd8f60b95000000bd'
Traceback (most recent call last):
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
OSError: [Errno 16] Device or resource busy: '.nfs0b856f8198fd1303000000be'
wandb: - 0.000 MB of 0.000 MB uploadedwandb: 
wandb: Run history:
wandb:                           epoch ▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
wandb:                           lpips ▇▄▃█▄▃▁▅▅▂▅▁
wandb:                        lr-AdamW ▁▆██████████████████████████████████████
wandb:               lr-AdamW-momentum ▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
wandb:                             mse ▄▁▁█▂▃▁▃▂▂▄▂
wandb:                            psnr ▄▇▆▁▆▆█▆▆▇▄▅
wandb:             trainer/global_step ▁▁▁▁▂▂▂▂▂▃▃▃▃▃▃▄▄▄▄▄▅▅▅▅▅▅▆▆▆▆▆▇▇▇▇▇▇███
wandb:       training/curriculum_phase ▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
wandb:         training/diffusion_loss █▅█▆▄▄▅▇▃▄▅█▆▄▅▁▄▄▃▃▃▄▄▃▇▄▃▃▁▃▃▃▄▄▄▃▄▂▇▂
wandb:                   training/loss █▇▇▅▄▄▃▄▃▃▃▄▃▃▂▂▃▂▂▂▂▂▂▂▂▃▂▂▂▂▂▂▂▁▂▁▂▂▂▁
wandb:         training/memory_ar_loss ██▄▃▅▃▃▂▂▂▂▁▁▂▁▂▁▁▂▂▃▂▁▂▁▁▁▂▃▃▁▂▃▁▂▂▁▂▁▁
wandb:  training/memory_gap_aux_weight █▇▅▃▂▂▂▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
wandb: training/stage_b_joint_training ▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
wandb: 
wandb: Run summary:
wandb:                           epoch 0
wandb:                           lpips 0.22699
wandb:                        lr-AdamW 2e-05
wandb:               lr-AdamW-momentum 0.9
wandb:                             mse 0.04694
wandb:                            psnr 16.91612
wandb:             trainer/global_step 29999
wandb:       training/curriculum_phase 0.0
wandb:         training/diffusion_loss 0.04718
wandb:                   training/loss 0.07644
wandb:         training/memory_ar_loss 0.11721
wandb:  training/memory_gap_aux_weight 0.1
wandb: training/stage_b_joint_training 1.0
wandb: 
wandb: You can sync this run to the cloud by running:
wandb: wandb sync /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_b_joint_ckpt_40k_fixed/wandb/offline-run-20260420_115938-yw7ct5e6
wandb: Find logs at: ./checkpoints/bimamba_stage_b_joint_ckpt_40k_fixed/wandb/offline-run-20260420_115938-yw7ct5e6/logs
wandb: WARNING The new W&B backend becomes opt-out in version 0.18.0; try it out with `wandb.require("core")`! See https://wandb.me/wandb-core for more information.
Traceback (most recent call last):
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
OSError: [Errno 16] Device or resource busy: '.nfsf9f52201d32c84fa000000bf'
Traceback (most recent call last):
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
OSError: [Errno 16] Device or resource busy: '.nfs090cfc07eeac09bc000000c0'
Traceback (most recent call last):
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
OSError: [Errno 16] Device or resource busy: '.nfs0bc72a7e1752edd7000000c1'
Traceback (most recent call last):
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
OSError: [Errno 16] Device or resource busy: '.nfsa7a99d1c3640392c000000c2'
Traceback (most recent call last):
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/multiprocessing/util.py", line 133, in _remove_temp_dir
    rmtree(tempdir)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 725, in rmtree
    _rmtree_safe_fd(fd, path, onerror)
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 681, in _rmtree_safe_fd
    onerror(os.unlink, fullname, sys.exc_info())
  File "/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/shutil.py", line 679, in _rmtree_safe_fd
    os.unlink(entry.name, dir_fd=topfd)
OSError: [Errno 16] Device or resource busy: '.nfs6574b85045609e97000000c3'
[rank0]:[W421 22:10:30.143106643 ProcessGroupNCCL.cpp:1168] Warning: WARNING: process group has NOT been destroyed before we destruct ProcessGroupNCCL. On normal program exit, the application should call destroy_process_group to ensure that any pending NCCL operations have finished in this process. In rare cases this process can exit before this point and block the progress of another member of the process group. This constraint has always been present,  but this warning has only been added since PyTorch 2.4 (function operator())
(Baseline is not a valid attribute name: .gitattributes:40
(Baseline is not a valid attribute name: .gitattributes:40
Switched to branch 'bimamba'
Your branch is up to date with 'origin/bimamba'.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/hydra/_internal/defaults_list.py:251: UserWarning: In 'training': Defaults list is missing `_self_`. See https://hydra.cc/docs/1.2/upgrades/1.0_to_1.1/default_composition_order for more information
  warnings.warn(msg, UserWarning)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/hydra/_internal/defaults_list.py:251: UserWarning: In 'training': Defaults list is missing `_self_`. See https://hydra.cc/docs/1.2/upgrades/1.0_to_1.1/default_composition_order for more information
  warnings.warn(msg, UserWarning)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/hydra/_internal/defaults_list.py:251: UserWarning: In 'training': Defaults list is missing `_self_`. See https://hydra.cc/docs/1.2/upgrades/1.0_to_1.1/default_composition_order for more information
  warnings.warn(msg, UserWarning)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/hydra/_internal/defaults_list.py:251: UserWarning: In 'training': Defaults list is missing `_self_`. See https://hydra.cc/docs/1.2/upgrades/1.0_to_1.1/default_composition_order for more information
  warnings.warn(msg, UserWarning)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/hydra/_internal/defaults_list.py:251: UserWarning: In 'training': Defaults list is missing `_self_`. See https://hydra.cc/docs/1.2/upgrades/1.0_to_1.1/default_composition_order for more information
  warnings.warn(msg, UserWarning)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/hydra/_internal/defaults_list.py:251: UserWarning: In 'training': Defaults list is missing `_self_`. See https://hydra.cc/docs/1.2/upgrades/1.0_to_1.1/default_composition_order for more information
  warnings.warn(msg, UserWarning)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/hydra/_internal/defaults_list.py:251: UserWarning: In 'training': Defaults list is missing `_self_`. See https://hydra.cc/docs/1.2/upgrades/1.0_to_1.1/default_composition_order for more information
  warnings.warn(msg, UserWarning)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/hydra/_internal/defaults_list.py:251: UserWarning: In 'training': Defaults list is missing `_self_`. See https://hydra.cc/docs/1.2/upgrades/1.0_to_1.1/default_composition_order for more information
  warnings.warn(msg, UserWarning)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/fabric/__init__.py:40: pkg_resources is deprecated as an API. See https://setuptools.pypa.io/en/latest/pkg_resources.html. The pkg_resources package is slated for removal as early as 2025-11-30. Refrain from using this package or pin to Setuptools<81.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/fabric/__init__.py:40: pkg_resources is deprecated as an API. See https://setuptools.pypa.io/en/latest/pkg_resources.html. The pkg_resources package is slated for removal as early as 2025-11-30. Refrain from using this package or pin to Setuptools<81.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/fabric/__init__.py:40: pkg_resources is deprecated as an API. See https://setuptools.pypa.io/en/latest/pkg_resources.html. The pkg_resources package is slated for removal as early as 2025-11-30. Refrain from using this package or pin to Setuptools<81.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/fabric/__init__.py:40: pkg_resources is deprecated as an API. See https://setuptools.pypa.io/en/latest/pkg_resources.html. The pkg_resources package is slated for removal as early as 2025-11-30. Refrain from using this package or pin to Setuptools<81.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/fabric/__init__.py:40: pkg_resources is deprecated as an API. See https://setuptools.pypa.io/en/latest/pkg_resources.html. The pkg_resources package is slated for removal as early as 2025-11-30. Refrain from using this package or pin to Setuptools<81.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/fabric/__init__.py:40: pkg_resources is deprecated as an API. See https://setuptools.pypa.io/en/latest/pkg_resources.html. The pkg_resources package is slated for removal as early as 2025-11-30. Refrain from using this package or pin to Setuptools<81.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/fabric/__init__.py:40: pkg_resources is deprecated as an API. See https://setuptools.pypa.io/en/latest/pkg_resources.html. The pkg_resources package is slated for removal as early as 2025-11-30. Refrain from using this package or pin to Setuptools<81.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/fabric/__init__.py:40: pkg_resources is deprecated as an API. See https://setuptools.pypa.io/en/latest/pkg_resources.html. The pkg_resources package is slated for removal as early as 2025-11-30. Refrain from using this package or pin to Setuptools<81.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/torchvision/models/_utils.py:208: UserWarning: The parameter 'pretrained' is deprecated since 0.13 and may be removed in the future, please use 'weights' instead.
  warnings.warn(
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/torchvision/models/_utils.py:223: UserWarning: Arguments other than a weight enum or `None` for 'weights' are deprecated since 0.13 and may be removed in the future. The current behavior is equivalent to passing `weights=AlexNet_Weights.IMAGENET1K_V1`. You can also use `weights=AlexNet_Weights.DEFAULT` to get the most up-to-date weights.
  warnings.warn(msg)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/torchvision/models/_utils.py:208: UserWarning: The parameter 'pretrained' is deprecated since 0.13 and may be removed in the future, please use 'weights' instead.
  warnings.warn(
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/torchvision/models/_utils.py:223: UserWarning: Arguments other than a weight enum or `None` for 'weights' are deprecated since 0.13 and may be removed in the future. The current behavior is equivalent to passing `weights=AlexNet_Weights.IMAGENET1K_V1`. You can also use `weights=AlexNet_Weights.DEFAULT` to get the most up-to-date weights.
  warnings.warn(msg)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/torchvision/models/_utils.py:208: UserWarning: The parameter 'pretrained' is deprecated since 0.13 and may be removed in the future, please use 'weights' instead.
  warnings.warn(
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/torchvision/models/_utils.py:223: UserWarning: Arguments other than a weight enum or `None` for 'weights' are deprecated since 0.13 and may be removed in the future. The current behavior is equivalent to passing `weights=AlexNet_Weights.IMAGENET1K_V1`. You can also use `weights=AlexNet_Weights.DEFAULT` to get the most up-to-date weights.
  warnings.warn(msg)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/torchvision/models/_utils.py:208: UserWarning: The parameter 'pretrained' is deprecated since 0.13 and may be removed in the future, please use 'weights' instead.
  warnings.warn(
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/torchvision/models/_utils.py:223: UserWarning: Arguments other than a weight enum or `None` for 'weights' are deprecated since 0.13 and may be removed in the future. The current behavior is equivalent to passing `weights=AlexNet_Weights.IMAGENET1K_V1`. You can also use `weights=AlexNet_Weights.DEFAULT` to get the most up-to-date weights.
  warnings.warn(msg)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lpips/lpips.py:107: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
  self.load_state_dict(torch.load(model_path, map_location='cpu'), strict=False)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lpips/lpips.py:107: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
  self.load_state_dict(torch.load(model_path, map_location='cpu'), strict=False)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/torchvision/models/_utils.py:208: UserWarning: The parameter 'pretrained' is deprecated since 0.13 and may be removed in the future, please use 'weights' instead.
  warnings.warn(
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/torchvision/models/_utils.py:223: UserWarning: Arguments other than a weight enum or `None` for 'weights' are deprecated since 0.13 and may be removed in the future. The current behavior is equivalent to passing `weights=AlexNet_Weights.IMAGENET1K_V1`. You can also use `weights=AlexNet_Weights.DEFAULT` to get the most up-to-date weights.
  warnings.warn(msg)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/torchvision/models/_utils.py:208: UserWarning: The parameter 'pretrained' is deprecated since 0.13 and may be removed in the future, please use 'weights' instead.
  warnings.warn(
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/torchvision/models/_utils.py:223: UserWarning: Arguments other than a weight enum or `None` for 'weights' are deprecated since 0.13 and may be removed in the future. The current behavior is equivalent to passing `weights=AlexNet_Weights.IMAGENET1K_V1`. You can also use `weights=AlexNet_Weights.DEFAULT` to get the most up-to-date weights.
  warnings.warn(msg)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lpips/lpips.py:107: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
  self.load_state_dict(torch.load(model_path, map_location='cpu'), strict=False)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lpips/lpips.py:107: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
  self.load_state_dict(torch.load(model_path, map_location='cpu'), strict=False)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lpips/lpips.py:107: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
  self.load_state_dict(torch.load(model_path, map_location='cpu'), strict=False)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lpips/lpips.py:107: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
  self.load_state_dict(torch.load(model_path, map_location='cpu'), strict=False)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/torchvision/models/_utils.py:208: UserWarning: The parameter 'pretrained' is deprecated since 0.13 and may be removed in the future, please use 'weights' instead.
  warnings.warn(
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/torchvision/models/_utils.py:223: UserWarning: Arguments other than a weight enum or `None` for 'weights' are deprecated since 0.13 and may be removed in the future. The current behavior is equivalent to passing `weights=AlexNet_Weights.IMAGENET1K_V1`. You can also use `weights=AlexNet_Weights.DEFAULT` to get the most up-to-date weights.
  warnings.warn(msg)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/torchvision/models/_utils.py:208: UserWarning: The parameter 'pretrained' is deprecated since 0.13 and may be removed in the future, please use 'weights' instead.
  warnings.warn(
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/torchvision/models/_utils.py:223: UserWarning: Arguments other than a weight enum or `None` for 'weights' are deprecated since 0.13 and may be removed in the future. The current behavior is equivalent to passing `weights=AlexNet_Weights.IMAGENET1K_V1`. You can also use `weights=AlexNet_Weights.DEFAULT` to get the most up-to-date weights.
  warnings.warn(msg)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lpips/lpips.py:107: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
  self.load_state_dict(torch.load(model_path, map_location='cpu'), strict=False)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lpips/lpips.py:107: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
  self.load_state_dict(torch.load(model_path, map_location='cpu'), strict=False)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/pytorch/plugins/precision/amp.py:54: `torch.cuda.amp.GradScaler(args...)` is deprecated. Please use `torch.amp.GradScaler('cuda', args...)` instead.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/pytorch/plugins/precision/amp.py:54: `torch.cuda.amp.GradScaler(args...)` is deprecated. Please use `torch.amp.GradScaler('cuda', args...)` instead.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/pytorch/plugins/precision/amp.py:54: `torch.cuda.amp.GradScaler(args...)` is deprecated. Please use `torch.amp.GradScaler('cuda', args...)` instead.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/pytorch/plugins/precision/amp.py:54: `torch.cuda.amp.GradScaler(args...)` is deprecated. Please use `torch.amp.GradScaler('cuda', args...)` instead.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/pytorch/plugins/precision/amp.py:54: `torch.cuda.amp.GradScaler(args...)` is deprecated. Please use `torch.amp.GradScaler('cuda', args...)` instead.
[36mOutputs will be saved to:[39m /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_b_joint_ckpt_40k_fixed
Will load checkpoint from /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_b_joint_ckpt_40k_fixed/checkpoints/epoch0_step30000.ckpt
[36mExecuting task:[39m training out of ['training']
[2026-04-21 22:11:11,018][pytorch_lightning.utilities.rank_zero][INFO] - Using 16bit Automatic Mixed Precision (AMP)
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/pytorch/plugins/precision/amp.py:54: `torch.cuda.amp.GradScaler(args...)` is deprecated. Please use `torch.amp.GradScaler('cuda', args...)` instead.
[2026-04-21 22:11:11,161][pytorch_lightning.utilities.rank_zero][INFO] - GPU available: True (cuda), used: True
[2026-04-21 22:11:11,161][pytorch_lightning.utilities.rank_zero][INFO] - TPU available: False, using: 0 TPU cores
[2026-04-21 22:11:11,161][pytorch_lightning.utilities.rank_zero][INFO] - IPU available: False, using: 0 IPUs
[2026-04-21 22:11:11,161][pytorch_lightning.utilities.rank_zero][INFO] - HPU available: False, using: 0 HPUs
[2026-04-21 22:11:11,163][pytorch_lightning.utilities.rank_zero][INFO] - `Trainer(limit_val_batches=1)` was configured so 1 batch will be used.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/pytorch/plugins/precision/amp.py:54: `torch.cuda.amp.GradScaler(args...)` is deprecated. Please use `torch.amp.GradScaler('cuda', args...)` instead.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/pytorch/plugins/precision/amp.py:54: `torch.cuda.amp.GradScaler(args...)` is deprecated. Please use `torch.amp.GradScaler('cuda', args...)` instead.
INFO: Initializing distributed: GLOBAL_RANK: 3, MEMBER: 4/8
[36mOutputs will be saved to:[39m /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_b_joint_ckpt_40k_fixed
Will load checkpoint from /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_b_joint_ckpt_40k_fixed/checkpoints/epoch0_step30000.ckpt
[36mExecuting task:[39m training out of ['training']
[2026-04-21 22:11:17,060][lightning.fabric.utilities.distributed][INFO] - Initializing distributed: GLOBAL_RANK: 3, MEMBER: 4/8
INFO: Initializing distributed: GLOBAL_RANK: 7, MEMBER: 8/8
[36mOutputs will be saved to:[39m /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_b_joint_ckpt_40k_fixed
Will load checkpoint from /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_b_joint_ckpt_40k_fixed/checkpoints/epoch0_step30000.ckpt
[36mExecuting task:[39m training out of ['training']
[2026-04-21 22:11:17,135][lightning.fabric.utilities.distributed][INFO] - Initializing distributed: GLOBAL_RANK: 7, MEMBER: 8/8
INFO: Initializing distributed: GLOBAL_RANK: 2, MEMBER: 3/8
[36mOutputs will be saved to:[39m /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_b_joint_ckpt_40k_fixed
Will load checkpoint from /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_b_joint_ckpt_40k_fixed/checkpoints/epoch0_step30000.ckpt
[36mExecuting task:[39m training out of ['training']
[2026-04-21 22:11:17,289][lightning.fabric.utilities.distributed][INFO] - Initializing distributed: GLOBAL_RANK: 2, MEMBER: 3/8
INFO: Initializing distributed: GLOBAL_RANK: 1, MEMBER: 2/8
[36mOutputs will be saved to:[39m /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_b_joint_ckpt_40k_fixed
Will load checkpoint from /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_b_joint_ckpt_40k_fixed/checkpoints/epoch0_step30000.ckpt
[36mExecuting task:[39m training out of ['training']
[2026-04-21 22:11:17,405][lightning.fabric.utilities.distributed][INFO] - Initializing distributed: GLOBAL_RANK: 1, MEMBER: 2/8
INFO: Initializing distributed: GLOBAL_RANK: 5, MEMBER: 6/8
[36mOutputs will be saved to:[39m /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_b_joint_ckpt_40k_fixed
Will load checkpoint from /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_b_joint_ckpt_40k_fixed/checkpoints/epoch0_step30000.ckpt
[36mExecuting task:[39m training out of ['training']
[2026-04-21 22:11:17,562][lightning.fabric.utilities.distributed][INFO] - Initializing distributed: GLOBAL_RANK: 5, MEMBER: 6/8
[36mOutputs will be saved to:[39m /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_b_joint_ckpt_40k_fixed
Will load checkpoint from /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_b_joint_ckpt_40k_fixed/checkpoints/epoch0_step30000.ckpt
[36mExecuting task:[39m training out of ['training']
[2026-04-21 22:11:18,086][lightning.fabric.utilities.distributed][INFO] - Initializing distributed: GLOBAL_RANK: 4, MEMBER: 5/8
INFO: Initializing distributed: GLOBAL_RANK: 4, MEMBER: 5/8
[2026-04-21 22:11:18,649][lightning.fabric.utilities.distributed][INFO] - Initializing distributed: GLOBAL_RANK: 0, MEMBER: 1/8
INFO: Initializing distributed: GLOBAL_RANK: 0, MEMBER: 1/8
[36mOutputs will be saved to:[39m /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_b_joint_ckpt_40k_fixed
Will load checkpoint from /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_b_joint_ckpt_40k_fixed/checkpoints/epoch0_step30000.ckpt
[36mExecuting task:[39m training out of ['training']
[2026-04-21 22:11:19,145][lightning.fabric.utilities.distributed][INFO] - Initializing distributed: GLOBAL_RANK: 6, MEMBER: 7/8
INFO: Initializing distributed: GLOBAL_RANK: 6, MEMBER: 7/8
[2026-04-21 22:11:24,944][pytorch_lightning.utilities.rank_zero][INFO] - ----------------------------------------------------------------------------------------------------
distributed_backend=nccl
All distributed processes registered. Starting with 8 processes
----------------------------------------------------------------------------------------------------

wandb: WARNING `resume` will be ignored since W&B syncing is set to `offline`. Starting a new run with run id stage_b_joint_offline.
wandb: Tracking run with wandb version 0.17.9
wandb: W&B syncing is set to `offline` in this directory.  
wandb: Run `wandb online` or set WANDB_MODE=online to enable cloud syncing.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/pytorch/callbacks/model_checkpoint.py:639: Checkpoint directory /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_b_joint_ckpt_40k_fixed/checkpoints exists and is not empty.
[2026-04-21 22:11:41,634][pytorch_lightning.utilities.rank_zero][INFO] - Restoring states from the checkpoint path at /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_b_joint_ckpt_40k_fixed/checkpoints/epoch0_step30000.ckpt
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/fabric/utilities/cloud_io.py:56: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/fabric/utilities/cloud_io.py:56: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/fabric/utilities/cloud_io.py:56: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/fabric/utilities/cloud_io.py:56: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/fabric/utilities/cloud_io.py:56: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/fabric/utilities/cloud_io.py:56: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/fabric/utilities/cloud_io.py:56: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/fabric/utilities/cloud_io.py:56: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
INFO: LOCAL_RANK: 1 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
[2026-04-21 22:11:52,132][lightning.pytorch.accelerators.cuda][INFO] - LOCAL_RANK: 1 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
INFO: LOCAL_RANK: 4 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
[2026-04-21 22:11:52,261][lightning.pytorch.accelerators.cuda][INFO] - LOCAL_RANK: 4 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
INFO: LOCAL_RANK: 2 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
[2026-04-21 22:11:52,337][lightning.pytorch.accelerators.cuda][INFO] - LOCAL_RANK: 2 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
INFO: LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
[2026-04-21 22:11:52,339][lightning.pytorch.accelerators.cuda][INFO] - LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
INFO: LOCAL_RANK: 5 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
[2026-04-21 22:11:52,343][lightning.pytorch.accelerators.cuda][INFO] - LOCAL_RANK: 5 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
INFO: LOCAL_RANK: 7 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
[2026-04-21 22:11:52,347][lightning.pytorch.accelerators.cuda][INFO] - LOCAL_RANK: 7 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
INFO: LOCAL_RANK: 6 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
[2026-04-21 22:11:52,349][lightning.pytorch.accelerators.cuda][INFO] - LOCAL_RANK: 6 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
[2026-04-21 22:11:52,373][lightning.pytorch.accelerators.cuda][INFO] - LOCAL_RANK: 3 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
INFO: LOCAL_RANK: 3 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
INFO: 
  | Name                   | Type                                  | Params
---------------------------------------------------------------------------------
0 | diffusion_model        | DiffusionMamba                        | 609 M 
1 | validation_lpips_model | LearnedPerceptualImagePatchSimilarity | 2.5 M 
2 | vae                    | AutoencoderKL                         | 229 M 
3 | mamba_memory           | BiMambaMemory                         | 4.5 M 
---------------------------------------------------------------------------------
614 M     Trainable params
231 M     Non-trainable params
845 M     Total params
3,383.355 Total estimated model params size (MB)
[2026-04-21 22:11:56,685][lightning.pytorch.callbacks.model_summary][INFO] - 
  | Name                   | Type                                  | Params
---------------------------------------------------------------------------------
0 | diffusion_model        | DiffusionMamba                        | 609 M 
1 | validation_lpips_model | LearnedPerceptualImagePatchSimilarity | 2.5 M 
2 | vae                    | AutoencoderKL                         | 229 M 
3 | mamba_memory           | BiMambaMemory                         | 4.5 M 
---------------------------------------------------------------------------------
614 M     Trainable params
231 M     Non-trainable params
845 M     Total params
3,383.355 Total estimated model params size (MB)
[2026-04-21 22:11:57,502][pytorch_lightning.utilities.rank_zero][INFO] - Restored all states from the checkpoint at /proj/cvl/users/x_fahkh2/WorldMem_Repro/checkpoints/bimamba_stage_b_joint_ckpt_40k_fixed/checkpoints/epoch0_step30000.ckpt
[2026-04-21 22:11:58,669][lightning.pytorch.trainer.connectors.signal_connector][INFO] - SLURM auto-requeueing enabled. Setting signal handlers.
INFO: SLURM auto-requeueing enabled. Setting signal handlers.
INFO: SLURM auto-requeueing enabled. Setting signal handlers.
INFO: SLURM auto-requeueing enabled. Setting signal handlers.
[2026-04-21 22:11:58,669][lightning.pytorch.trainer.connectors.signal_connector][INFO] - SLURM auto-requeueing enabled. Setting signal handlers.
[2026-04-21 22:11:58,669][lightning.pytorch.trainer.connectors.signal_connector][INFO] - SLURM auto-requeueing enabled. Setting signal handlers.
INFO: SLURM auto-requeueing enabled. Setting signal handlers.
INFO: SLURM auto-requeueing enabled. Setting signal handlers.
INFO: SLURM auto-requeueing enabled. Setting signal handlers.
[2026-04-21 22:11:58,669][lightning.pytorch.trainer.connectors.signal_connector][INFO] - SLURM auto-requeueing enabled. Setting signal handlers.
[2026-04-21 22:11:58,669][lightning.pytorch.trainer.connectors.signal_connector][INFO] - SLURM auto-requeueing enabled. Setting signal handlers.
[2026-04-21 22:11:58,669][lightning.pytorch.trainer.connectors.signal_connector][INFO] - SLURM auto-requeueing enabled. Setting signal handlers.
INFO: SLURM auto-requeueing enabled. Setting signal handlers.
[2026-04-21 22:11:58,669][lightning.pytorch.trainer.connectors.signal_connector][INFO] - SLURM auto-requeueing enabled. Setting signal handlers.
INFO: SLURM auto-requeueing enabled. Setting signal handlers.
[2026-04-21 22:11:58,669][lightning.pytorch.trainer.connectors.signal_connector][INFO] - SLURM auto-requeueing enabled. Setting signal handlers.
/proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/pytorch/loops/training_epoch_loop.py:154: You're resuming from a checkpoint that ended before the epoch ended. This can cause unreliable results if further training is done. Consider using an end-of-epoch checkpoint
Training: |          | 0/? [00:00<?, ?it/s]Training:   0%|          | 0/203307 [00:00<?, ?it/s]Epoch 0:   0%|          | 0/203307 [00:00<?, ?it/s] 
Validation: |          | 0/? [00:00<?, ?it/s][A
Validation:   0%|          | 0/1 [00:00<?, ?it/s][A


Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s][A[A/proj/cvl/users/x_fahkh2/WorldMem_Repro/algorithms/worldmem/models/mamba_memory.py:173: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(enabled=False):
Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]/proj/cvl/users/x_fahkh2/WorldMem_Repro/algorithms/worldmem/models/mamba_memory.py:173: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(enabled=False):


Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]/proj/cvl/users/x_fahkh2/WorldMem_Repro/algorithms/worldmem/models/mamba_memory.py:173: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(enabled=False):
Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]/proj/cvl/users/x_fahkh2/WorldMem_Repro/algorithms/worldmem/models/mamba_memory.py:173: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(enabled=False):
Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]/proj/cvl/users/x_fahkh2/WorldMem_Repro/algorithms/worldmem/models/mamba_memory.py:173: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(enabled=False):
Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]/proj/cvl/users/x_fahkh2/WorldMem_Repro/algorithms/worldmem/models/mamba_memory.py:173: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(enabled=False):
Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]/proj/cvl/users/x_fahkh2/WorldMem_Repro/algorithms/worldmem/models/mamba_memory.py:173: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(enabled=False):
Sampling (mamba memory):  50%|█████     | 101/200 [00:01<02:19,  1.41s/it][A[A

Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]/proj/cvl/users/x_fahkh2/WorldMem_Repro/algorithms/worldmem/models/mamba_memory.py:173: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(enabled=False):
Sampling (mamba memory):  51%|█████     | 102/200 [00:02<01:52,  1.15s/it][A[A

Sampling (mamba memory):  52%|█████▏    | 103/200 [00:03<01:45,  1.08s/it][A[A

Sampling (mamba memory):  52%|█████▏    | 104/200 [00:04<01:40,  1.05s/it][A[A

Sampling (mamba memory):  52%|█████▎    | 105/200 [00:05<01:36,  1.01s/it][A[A

Sampling (mamba memory):  53%|█████▎    | 106/200 [00:06<01:33,  1.01it/s][A[A

Sampling (mamba memory):  54%|█████▎    | 107/200 [00:07<01:31,  1.01it/s][A[A

Sampling (mamba memory):  54%|█████▍    | 108/200 [00:08<01:31,  1.01it/s][A[A

Sampling (mamba memory):  55%|█████▍    | 109/200 [00:09<01:30,  1.01it/s][A[A

Sampling (mamba memory):  55%|█████▌    | 110/200 [00:10<01:29,  1.00it/s][A[A

Sampling (mamba memory):  50%|█████     | 101/200 [00:01<02:17,  1.39s/it]Sampling (mamba memory):  51%|█████     | 102/200 [00:02<01:51,  1.14s/it]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:03<01:43,  1.07s/it]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:04<01:38,  1.02s/it]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:05<01:34,  1.01it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:06<01:30,  1.04it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:07<01:27,  1.06it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:26,  1.07it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:25,  1.06it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:09<01:26,  1.05it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:10<01:26,  1.03it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:11<0Sampling (mamba memory):  56%|█████▌    | 111/200 [00:11<01:29,  1.00s/it][A[A

Sampling (mamba memory):  56%|█████▌    | 112/200 [00:12<01:27,  1.00it/s][A[A

Sampling (mamba memory):  50%|█████     | 101/200 [00:01<02:21,  1.43s/it]Sampling (mamba memory):  51%|█████     | 102/200 [00:02<01:54,  1.17s/it]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:03<01:44,  1.08s/it]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:04<01:38,  1.03s/it]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:05<01:34,  1.00it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:06<01:33,  1.01it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:07<01:32,  1.01it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:08<01:31,  1.01it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:09<01:30,  1.01it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:10<01:28,  1.02it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:11<01:26,  1.02it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:12<0Sampling (mamba memory):  50%|█████     | 101/200 [00:01<02:23,  1.44s/it]Sampling (mamba memory):  51%|█████     | 102/200 [00:02<01:54,  1.17s/it]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:03<01:43,  1.07s/it]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:04<01:38,  1.02s/it]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:05<01:34,  1.01it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:06<01:32,  1.01it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:07<01:31,  1.02it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:08<01:30,  1.01it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:09<01:29,  1.01it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:10<01:28,  1.02it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:11<01:27,  1.02it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:12<0Sampling (mamba memory):  50%|█████     | 101/200 [00:01<02:20,  1.42s/it]Sampling (mamba memory):  51%|█████     | 102/200 [00:02<01:52,  1.15s/it]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:03<01:43,  1.07s/it]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:04<01:41,  1.05s/it]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:05<01:38,  1.04s/it]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:06<01:35,  1.02s/it]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:07<01:33,  1.00s/it]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:08<01:31,  1.00it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:09<01:30,  1.00it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:10<01:28,  1.01it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:11<01:28,  1.01it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:12<0Sampling (mamba memory):  50%|█████     | 101/200 [00:01<02:28,  1.50s/it]Sampling (mamba memory):  51%|█████     | 102/200 [00:02<01:58,  1.21s/it]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:03<01:47,  1.11s/it]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:04<01:40,  1.05s/it]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:05<01:35,  1.01s/it]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:06<01:32,  1.01it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:07<01:31,  1.01it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:08<01:31,  1.00it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:09<01:31,  1.01s/it]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:10<01:31,  1.01s/it]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:11<01:31,  1.02s/it]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:12<0Sampling (mamba memory):  56%|█████▋    | 113/200 [00:13<01:27,  1.00s/it][A[A

Sampling (mamba memory):  50%|█████     | 101/200 [00:01<02:24,  1.45s/it]Sampling (mamba memory):  51%|█████     | 102/200 [00:02<01:55,  1.18s/it]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:03<01:43,  1.07s/it]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:04<01:38,  1.02s/it]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:05<01:34,  1.00it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:06<01:33,  1.01it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:07<01:31,  1.01it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:08<01:30,  1.02it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:09<01:29,  1.02it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:10<01:28,  1.02it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:11<01:27,  1.02it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:12<0Sampling (mamba memory):  50%|█████     | 101/200 [00:01<02:35,  1.57s/it]Sampling (mamba memory):  51%|█████     | 102/200 [00:02<02:02,  1.25s/it]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:03<01:49,  1.13s/it]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:04<01:42,  1.07s/it]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:05<01:37,  1.03s/it]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:06<01:35,  1.02s/it]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:07<01:34,  1.02s/it]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:08<01:35,  1.04s/it]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:09<01:35,  1.05s/it]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:10<01:34,  1.05s/it]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:11<01:33,  1.05s/it]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:12<0Sampling (mamba memory):  57%|█████▋    | 114/200 [00:14<01:26,  1.01s/it][A[A

Sampling (mamba memory):  57%|█████▊    | 115/200 [00:15<01:25,  1.00s/it][A[A

Sampling (mamba memory):  58%|█████▊    | 116/200 [00:16<01:23,  1.00it/s][A[A

Sampling (mamba memory):  58%|█████▊    | 117/200 [00:17<01:22,  1.01it/s][A[A

Sampling (mamba memory):  59%|█████▉    | 118/200 [00:18<01:20,  1.02it/s][A[A

Sampling (mamba memory):  60%|█████▉    | 119/200 [00:19<01:18,  1.03it/s][A[A

Sampling (mamba memory):  60%|██████    | 120/200 [00:20<01:16,  1.04it/s][A[A

Sampling (mamba memory):  60%|██████    | 121/200 [00:21<01:15,  1.05it/s][A[A

Sampling (mamba memory):  61%|██████    | 122/200 [00:21<01:13,  1.06it/s][A[A

1:26,  1.02it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:12<01:26,  1.01it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:13<01:25,  1.01it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:14<01:24,  1.00it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:15<01:23,  1.00it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:16<01:22,  1.00it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:17<01:21,  1.01it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:18<01:19,  1.02it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:19<01:16,  1.04it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:20<01:14,  1.07it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:21<01:11,  1.09it/s]Sampling (mamba memory):  62%|██████▏   | 123/200 [00:22<01:09,  1.11it/s]Sampling (mamba memory):  62%|██████Sampling (mamba memory):  62%|██████▏   | 123/200 [00:22<01:12,  1.07it/s][A[A

Sampling (mamba memory):  62%|██████▏   | 124/200 [00:23<01:11,  1.07it/s][A[A

1:26,  1.02it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:13<01:25,  1.02it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:14<01:23,  1.02it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:15<01:22,  1.03it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:15<01:20,  1.04it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:16<01:18,  1.05it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:17<01:16,  1.07it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:18<01:14,  1.08it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:19<01:12,  1.10it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:20<01:11,  1.10it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:21<01:10,  1.10it/s]Sampling (mamba memory):  62%|██████▏   | 123/200 [00:22<01:09,  1.11it/s]Sampling (mamba memory):  62%|██████1:25,  1.02it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:13<01:24,  1.03it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:14<01:23,  1.03it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:15<01:22,  1.03it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:15<01:21,  1.04it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:16<01:19,  1.05it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:17<01:16,  1.07it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:18<01:15,  1.07it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:19<01:13,  1.09it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:20<01:12,  1.09it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:21<01:11,  1.09it/s]Sampling (mamba memory):  62%|██████▏   | 123/200 [00:22<01:10,  1.10it/s]Sampling (mamba memory):  62%|██████1:27,  1.00it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:13<01:26,  1.00it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:14<01:25,  1.01it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:15<01:22,  1.03it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:16<01:20,  1.04it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:17<01:18,  1.05it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:18<01:18,  1.05it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:19<01:17,  1.04it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:19<01:15,  1.06it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:20<01:13,  1.07it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:21<01:12,  1.08it/s]Sampling (mamba memory):  62%|██████▏   | 123/200 [00:22<01:10,  1.09it/s]Sampling (mamba memory):  62%|██████1:30,  1.03s/it]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:13<01:29,  1.03s/it]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:14<01:28,  1.03s/it]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:15<01:26,  1.02s/it]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:16<01:24,  1.01s/it]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:17<01:22,  1.01it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:18<01:19,  1.03it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:19<01:16,  1.06it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:20<01:14,  1.08it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:21<01:12,  1.10it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:21<01:10,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 123/200 [00:22<01:09,  1.11it/s]Sampling (mamba memory):  62%|██████Sampling (mamba memory):  62%|██████▎   | 125/200 [00:24<01:10,  1.07it/s][A[A

1:26,  1.02it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:13<01:25,  1.01it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:14<01:24,  1.02it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:15<01:22,  1.03it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:15<01:20,  1.04it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:16<01:18,  1.06it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:17<01:16,  1.07it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:18<01:14,  1.08it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:19<01:13,  1.09it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:20<01:12,  1.09it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:21<01:11,  1.09it/s]Sampling (mamba memory):  62%|██████▏   | 123/200 [00:22<01:10,  1.09it/s]Sampling (mamba memory):  62%|██████1:32,  1.05s/it]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:13<01:31,  1.05s/it]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:14<01:30,  1.05s/it]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:15<01:28,  1.05s/it]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:16<01:26,  1.03s/it]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:17<01:23,  1.01s/it]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:18<01:20,  1.02it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:19<01:18,  1.04it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:20<01:15,  1.06it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:21<01:13,  1.07it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:22<01:12,  1.08it/s]Sampling (mamba memory):  62%|██████▏   | 123/200 [00:23<01:10,  1.09it/s]Sampling (mamba memory):  62%|██████Sampling (mamba memory):  63%|██████▎   | 126/200 [00:25<01:09,  1.07it/s][A[A

Sampling (mamba memory):  64%|██████▎   | 127/200 [00:26<01:07,  1.08it/s][A[A

Sampling (mamba memory):  64%|██████▍   | 128/200 [00:27<01:06,  1.08it/s][A[A

Sampling (mamba memory):  64%|██████▍   | 129/200 [00:28<01:05,  1.08it/s][A[A

Sampling (mamba memory):  65%|██████▌   | 130/200 [00:29<01:04,  1.08it/s][A[A

Sampling (mamba memory):  66%|██████▌   | 131/200 [00:30<01:04,  1.07it/s][A[A

Sampling (mamba memory):  66%|██████▌   | 132/200 [00:31<01:03,  1.07it/s][A[A

Sampling (mamba memory):  66%|██████▋   | 133/200 [00:32<01:02,  1.07it/s][A[A

▏   | 124/200 [00:23<01:07,  1.13it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:24<01:06,  1.13it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:24<01:04,  1.14it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:25<01:03,  1.14it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:26<01:02,  1.14it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:27<01:02,  1.14it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:28<01:01,  1.14it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:29<01:00,  1.14it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:30<00:59,  1.14it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:31<00:58,  1.14it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<00:58,  1.14it/s]Sampling (mamba memory):  68%|██████▊   | 135/200 [00:32<00:57,  1.13it/s]SampSampling (mamba memory):  67%|██████▋   | 134/200 [00:33<01:02,  1.06it/s][A[A

Sampling (mamba memory):  68%|██████▊   | 135/200 [00:34<01:01,  1.05it/s][A[A

Sampling (mamba memory):  68%|██████▊   | 136/200 [00:35<01:00,  1.05it/s][A[A

▏   | 124/200 [00:23<01:09,  1.10it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:24<01:08,  1.10it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:25<01:07,  1.09it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:26<01:06,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:26<01:05,  1.10it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:27<01:04,  1.10it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:28<01:03,  1.10it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:29<01:02,  1.10it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:30<01:01,  1.10it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:31<01:01,  1.09it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:32<01:00,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 135/200 [00:33<00:59,  1.09it/s]Samp▏   | 124/200 [00:23<01:08,  1.11it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:24<01:07,  1.11it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:24<01:06,  1.11it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:25<01:05,  1.11it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:26<01:05,  1.11it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:27<01:04,  1.10it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:28<01:03,  1.10it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:29<01:02,  1.10it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:30<01:02,  1.09it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:31<01:01,  1.09it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:32<01:00,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 135/200 [00:33<01:00,  1.08it/s]Samp▏   | 124/200 [00:23<01:07,  1.12it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:24<01:07,  1.10it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:25<01:06,  1.11it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:26<01:05,  1.12it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:27<01:04,  1.12it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:28<01:03,  1.12it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:29<01:02,  1.11it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:30<01:02,  1.11it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:30<01:01,  1.11it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:31<01:00,  1.11it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:32<00:59,  1.11it/s]Sampling (mamba memory):  68%|██████▊   | 135/200 [00:33<00:58,  1.11it/s]Samp▏   | 124/200 [00:23<01:09,  1.09it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:24<01:08,  1.09it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:25<01:08,  1.09it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:26<01:07,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:27<01:06,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:28<01:05,  1.09it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:29<01:04,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:30<01:03,  1.08it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:30<01:02,  1.08it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:31<01:02,  1.08it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:32<01:01,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 135/200 [00:33<01:00,  1.08it/s]Samp▏   | 124/200 [00:23<01:09,  1.09it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:24<01:08,  1.09it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:25<01:07,  1.09it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:26<01:06,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:26<01:05,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:27<01:05,  1.09it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:28<01:04,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:29<01:03,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:30<01:02,  1.08it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:31<01:02,  1.08it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:32<01:01,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 135/200 [00:33<01:00,  1.08it/s]SampSampling (mamba memory):  68%|██████▊   | 137/200 [00:35<00:59,  1.06it/s][A[A

▏   | 124/200 [00:24<01:09,  1.09it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:25<01:08,  1.09it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:26<01:07,  1.09it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:27<01:06,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:27<01:05,  1.09it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:28<01:05,  1.09it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:29<01:04,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:30<01:03,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:31<01:02,  1.08it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:32<01:01,  1.08it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:33<01:00,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 135/200 [00:34<01:00,  1.08it/s]SampSampling (mamba memory):  69%|██████▉   | 138/200 [00:36<00:58,  1.06it/s][A[A

Sampling (mamba memory):  70%|██████▉   | 139/200 [00:37<00:57,  1.06it/s][A[A

Sampling (mamba memory):  70%|███████   | 140/200 [00:38<00:56,  1.06it/s][A[A

Sampling (mamba memory):  70%|███████   | 141/200 [00:39<00:55,  1.06it/s][A[A

Sampling (mamba memory):  71%|███████   | 142/200 [00:40<00:54,  1.06it/s][A[A

Sampling (mamba memory):  72%|███████▏  | 143/200 [00:41<00:54,  1.05it/s][A[A

Sampling (mamba memory):  72%|███████▏  | 144/200 [00:42<00:53,  1.05it/s][A[A

ling (mamba memory):  68%|██████▊   | 136/200 [00:33<00:56,  1.13it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:34<00:55,  1.13it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:35<00:54,  1.13it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:36<00:53,  1.13it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:37<00:53,  1.13it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:38<00:52,  1.13it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:39<00:52,  1.11it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:40<00:51,  1.11it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:50,  1.11it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:49,  1.12it/s]Sampling (mamba memory):  73%|███████▎  | 146/200 [00:42<00:48,  1.11it/s]Sampling (mamba memory):  74%|███�Sampling (mamba memory):  72%|███████▎  | 145/200 [00:43<00:52,  1.04it/s][A[A

Sampling (mamba memory):  73%|███████▎  | 146/200 [00:44<00:52,  1.04it/s][A[A

ling (mamba memory):  68%|██████▊   | 136/200 [00:34<00:57,  1.11it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:35<00:56,  1.11it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:36<00:56,  1.11it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:37<00:55,  1.10it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:38<00:54,  1.10it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:39<00:53,  1.10it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:39<00:52,  1.10it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:40<00:51,  1.10it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:41<00:51,  1.10it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:42<00:50,  1.10it/s]Sampling (mamba memory):  73%|███████▎  | 146/200 [00:43<00:49,  1.09it/s]Sampling (mamba memory):  74%|███�ling (mamba memory):  68%|██████▊   | 136/200 [00:34<00:59,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:35<00:58,  1.07it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:36<00:57,  1.08it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:36<00:56,  1.08it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:37<00:55,  1.07it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:38<00:54,  1.08it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:39<00:54,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:40<00:53,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:41<00:52,  1.06it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:42<00:51,  1.07it/s]Sampling (mamba memory):  73%|███████▎  | 146/200 [00:43<00:50,  1.07it/s]Sampling (mamba memory):  74%|███�ling (mamba memory):  68%|██████▊   | 136/200 [00:34<00:58,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:35<00:58,  1.09it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:36<00:57,  1.09it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:37<00:56,  1.09it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:37<00:55,  1.09it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:38<00:54,  1.08it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:39<00:54,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:40<00:53,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:41<00:52,  1.06it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:42<00:51,  1.06it/s]Sampling (mamba memory):  73%|███████▎  | 146/200 [00:43<00:50,  1.06it/s]Sampling (mamba memory):  74%|███�Sampling (mamba memory):  74%|███████▎  | 147/200 [00:45<00:51,  1.04it/s][A[A

ling (mamba memory):  68%|██████▊   | 136/200 [00:34<00:59,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:35<00:58,  1.07it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:36<00:57,  1.07it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:37<00:57,  1.06it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:38<00:57,  1.05it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:39<00:56,  1.05it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:40<00:55,  1.04it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:41<00:54,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:42<00:53,  1.05it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:43<00:52,  1.05it/s]Sampling (mamba memory):  73%|███████▎  | 146/200 [00:44<00:51,  1.05it/s]Sampling (mamba memory):  74%|███�ling (mamba memory):  68%|██████▊   | 136/200 [00:34<00:59,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:35<00:58,  1.08it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:36<00:57,  1.09it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:37<00:56,  1.08it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:38<00:55,  1.08it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:38<00:54,  1.07it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:39<00:54,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:40<00:53,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:41<00:52,  1.06it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:42<00:52,  1.06it/s]Sampling (mamba memory):  73%|███████▎  | 146/200 [00:43<00:51,  1.05it/s]Sampling (mamba memory):  74%|███�Sampling (mamba memory):  74%|███████▍  | 148/200 [00:46<00:50,  1.04it/s][A[A

ling (mamba memory):  68%|██████▊   | 136/200 [00:35<00:59,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:36<00:58,  1.08it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:37<00:57,  1.08it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:38<00:56,  1.08it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:39<00:55,  1.08it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:40<00:54,  1.07it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:41<00:55,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:41<00:53,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:42<00:52,  1.06it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:43<00:51,  1.06it/s]Sampling (mamba memory):  73%|███████▎  | 146/200 [00:44<00:50,  1.06it/s]Sampling (mamba memory):  74%|███�Sampling (mamba memory):  74%|███████▍  | 149/200 [00:47<00:49,  1.04it/s][A[A

Sampling (mamba memory):  75%|███████▌  | 150/200 [00:48<00:48,  1.04it/s][A[A

Sampling (mamba memory):  76%|███████▌  | 151/200 [00:49<00:47,  1.03it/s][A[A

Sampling (mamba memory):  76%|███████▌  | 152/200 [00:50<00:46,  1.03it/s][A[A

Sampling (mamba memory):  76%|███████▋  | 153/200 [00:51<00:45,  1.03it/s][A[A

Sampling (mamba memory):  77%|███████▋  | 154/200 [00:52<00:44,  1.02it/s][A[A

�███▎  | 147/200 [00:43<00:47,  1.12it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:46,  1.11it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:45,  1.11it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:45,  1.11it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:44,  1.10it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:48<00:43,  1.10it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:49<00:42,  1.10it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:42,  1.09it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:41,  1.09it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:40,  1.09it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:39,  1.09it/s]Sampling (mamba memory):  79%|███████▉  | 158/20Sampling (mamba memory):  78%|███████▊  | 155/200 [00:53<00:43,  1.02it/s][A[A

Sampling (mamba memory):  78%|███████▊  | 156/200 [00:54<00:43,  1.02it/s][A[A

Sampling (mamba memory):  78%|███████▊  | 157/200 [00:55<00:42,  1.02it/s][A[A

�███▎  | 147/200 [00:44<00:48,  1.09it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:45<00:47,  1.09it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:46<00:46,  1.09it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:47<00:46,  1.08it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:48<00:45,  1.08it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:49<00:44,  1.08it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:50<00:43,  1.08it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:51<00:42,  1.08it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:51<00:41,  1.08it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:52<00:40,  1.08it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:53<00:40,  1.07it/s]Sampling (mamba memory):  79%|███████▉  | 158/20�███▎  | 147/200 [00:44<00:49,  1.07it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:45<00:48,  1.07it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:46<00:47,  1.07it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:47<00:46,  1.07it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:48<00:46,  1.06it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:49<00:45,  1.06it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:50<00:44,  1.06it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:51<00:43,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:51<00:42,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:52<00:41,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:53<00:40,  1.06it/s]Sampling (mamba memory):  79%|███████▉  | 158/20�███▎  | 147/200 [00:44<00:50,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:45<00:49,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:46<00:48,  1.06it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:47<00:47,  1.06it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:48<00:46,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:49<00:45,  1.05it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:50<00:44,  1.05it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:51<00:43,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:52<00:42,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:53<00:41,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:54<00:41,  1.05it/s]Sampling (mamba memory):  79%|███████▉  | 158/20Sampling (mamba memory):  79%|███████▉  | 158/200 [00:56<00:41,  1.02it/s][A[A

�███▎  | 147/200 [00:45<00:50,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:46<00:49,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:47<00:48,  1.05it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:48<00:47,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:48<00:46,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:49<00:45,  1.04it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:50<00:44,  1.05it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:51<00:43,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:52<00:43,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:53<00:42,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:54<00:41,  1.03it/s]Sampling (mamba memory):  79%|███████▉  | 158/20�███▎  | 147/200 [00:44<00:50,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:45<00:49,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:46<00:48,  1.06it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:47<00:47,  1.06it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:48<00:46,  1.06it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:49<00:45,  1.06it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:50<00:44,  1.05it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:51<00:43,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:52<00:43,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:53<00:42,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:54<00:41,  1.03it/s]Sampling (mamba memory):  79%|███████▉  | 158/20�███▎  | 147/200 [00:45<00:50,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:46<00:49,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:47<00:48,  1.06it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:48<00:47,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:49<00:46,  1.05it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:50<00:45,  1.05it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:51<00:44,  1.05it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:52<00:43,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:53<00:42,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:54<00:42,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:55<00:41,  1.05it/s]Sampling (mamba memory):  79%|███████▉  | 158/20Sampling (mamba memory):  80%|███████▉  | 159/200 [00:57<00:40,  1.02it/s][A[A

Sampling (mamba memory):  80%|████████  | 160/200 [00:58<00:39,  1.02it/s][A[A

Sampling (mamba memory):  80%|████████  | 161/200 [00:59<00:38,  1.02it/s][A[A

Sampling (mamba memory):  81%|████████  | 162/200 [01:00<00:37,  1.02it/s][A[A

Sampling (mamba memory):  82%|████████▏ | 163/200 [01:01<00:36,  1.02it/s][A[A

Sampling (mamba memory):  82%|████████▏ | 164/200 [01:02<00:35,  1.02it/s][A[A

0 [00:53<00:38,  1.09it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:54<00:37,  1.09it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:55<00:36,  1.09it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:56<00:35,  1.09it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:57<00:35,  1.08it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:34,  1.08it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:33,  1.08it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:32,  1.08it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:31,  1.07it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:02<00:30,  1.07it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:02<00:30,  1.07it/s]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:04<Sampling (mamba memory):  82%|████████▎ | 165/200 [01:03<00:34,  1.02it/s][A[A

Sampling (mamba memory):  83%|████████▎ | 166/200 [01:04<00:33,  1.02it/s][A[A

Sampling (mamba memory):  84%|████████▎ | 167/200 [01:05<00:32,  1.01it/s][A[A

0 [00:54<00:39,  1.07it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:55<00:38,  1.07it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:56<00:37,  1.07it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:57<00:36,  1.07it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:58<00:35,  1.07it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:59<00:34,  1.06it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:00<00:33,  1.06it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:01<00:33,  1.06it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:02<00:32,  1.06it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:03<00:31,  1.05it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:04<00:30,  1.05it/s]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:05<Sampling (mamba memory):  84%|████████▍ | 168/200 [01:06<00:31,  1.01it/s][A[A

0 [00:54<00:39,  1.06it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:55<00:38,  1.06it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:56<00:37,  1.06it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:57<00:36,  1.06it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:58<00:35,  1.06it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:59<00:35,  1.06it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:00<00:34,  1.06it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:01<00:33,  1.05it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:02<00:32,  1.05it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:03<00:31,  1.04it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:04<00:30,  1.04it/s]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:05<0 [00:55<00:40,  1.04it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:56<00:39,  1.04it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:56<00:38,  1.04it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:57<00:37,  1.04it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:58<00:36,  1.03it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:59<00:36,  1.03it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:00<00:34,  1.03it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:01<00:34,  1.03it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:02<00:33,  1.03it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:03<00:32,  1.02it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:04<00:31,  1.02it/s]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:05<0 [00:55<00:40,  1.04it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:56<00:39,  1.04it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:57<00:38,  1.04it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:58<00:37,  1.04it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:59<00:36,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [01:00<00:35,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:01<00:34,  1.04it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:02<00:33,  1.04it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:03<00:32,  1.04it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:04<00:31,  1.04it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:05<00:30,  1.03it/s]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:06<Sampling (mamba memory):  84%|████████▍ | 169/200 [01:07<00:30,  1.01it/s][A[A

0 [00:55<00:40,  1.04it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:56<00:39,  1.04it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:57<00:38,  1.03it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:58<00:37,  1.03it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:59<00:37,  1.03it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [01:00<00:35,  1.03it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:01<00:35,  1.03it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:02<00:34,  1.02it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:03<00:33,  1.02it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:04<00:32,  1.02it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:04<00:31,  1.02it/s]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:05<0 [00:56<00:40,  1.04it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:57<00:39,  1.04it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:58<00:38,  1.04it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:59<00:37,  1.03it/s]Sampling (mamba memory):  81%|████████  | 162/200 [01:00<00:36,  1.03it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [01:01<00:35,  1.03it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:02<00:34,  1.03it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:03<00:34,  1.03it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:04<00:33,  1.02it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:05<00:32,  1.02it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:06<00:31,  1.01it/s]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:07<Sampling (mamba memory):  85%|████████▌ | 170/200 [01:08<00:29,  1.01it/s][A[A

Sampling (mamba memory):  86%|████████▌ | 171/200 [01:09<00:28,  1.01it/s][A[A

Sampling (mamba memory):  86%|████████▌ | 172/200 [01:10<00:27,  1.01it/s][A[A

Sampling (mamba memory):  86%|████████▋ | 173/200 [01:11<00:26,  1.01it/s][A[A

Sampling (mamba memory):  87%|████████▋ | 174/200 [01:12<00:25,  1.01it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 175/200 [01:13<00:25,  1.01s/it][A[A

00:29,  1.04it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:04<00:28,  1.04it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:05<00:27,  1.04it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:06<00:26,  1.05it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:07<00:25,  1.04it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:08<00:24,  1.04it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:09<00:24,  1.04it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:10<00:23,  1.04it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:11<00:22,  1.04it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:12<00:21,  1.04it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:13<00:20,  1.04it/s]Sampling (mamba memory):  90%|█████████ | 180/200 [01:14<0Sampling (mamba memory):  88%|████████▊ | 176/200 [01:14<00:24,  1.00s/it][A[A

Sampling (mamba memory):  88%|████████▊ | 177/200 [01:15<00:23,  1.00s/it][A[A

Sampling (mamba memory):  89%|████████▉ | 178/200 [01:16<00:22,  1.01s/it][A[A

00:29,  1.05it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:06<00:28,  1.05it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:07<00:27,  1.04it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:08<00:26,  1.04it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:09<00:25,  1.04it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:09<00:25,  1.04it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:10<00:24,  1.04it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:11<00:23,  1.04it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:12<00:22,  1.04it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:13<00:21,  1.03it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:14<00:20,  1.03it/s]Sampling (mamba memory):  90%|█████████ | 180/200 [01:15<0Sampling (mamba memory):  90%|████████▉ | 179/200 [01:17<00:21,  1.01s/it][A[A

00:29,  1.03it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:06<00:29,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:07<00:28,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:08<00:27,  1.01it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:09<00:26,  1.01it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:10<00:25,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:11<00:24,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:12<00:23,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:13<00:22,  1.00it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:14<00:21,  1.00it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:15<00:20,  1.00it/s]Sampling (mamba memory):  90%|█████████ | 180/200 [01:16<000:30,  1.02it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:06<00:29,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:07<00:28,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:08<00:27,  1.01it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:09<00:26,  1.01it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:10<00:25,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:11<00:24,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:12<00:23,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:13<00:22,  1.01it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:14<00:21,  1.01it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:15<00:20,  1.00it/s]Sampling (mamba memory):  90%|█████████ | 180/200 [01:16<000:30,  1.03it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:07<00:29,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:08<00:28,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:09<00:27,  1.02it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:10<00:26,  1.02it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:11<00:25,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:12<00:24,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:13<00:23,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:14<00:22,  1.02it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:15<00:21,  1.01it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:16<00:20,  1.00it/s]Sampling (mamba memory):  90%|█████████ | 180/200 [01:17<0Sampling (mamba memory):  90%|█████████ | 180/200 [01:18<00:20,  1.01s/it][A[A

00:30,  1.02it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:06<00:29,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:07<00:28,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:08<00:27,  1.02it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:09<00:26,  1.02it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:10<00:25,  1.01it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:11<00:24,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:12<00:23,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:13<00:22,  1.02it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:14<00:21,  1.02it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:15<00:20,  1.02it/s]Sampling (mamba memory):  90%|█████████ | 180/200 [01:16<000:30,  1.01it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:08<00:29,  1.00it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:09<00:28,  1.00it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:10<00:27,  1.00it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:11<00:27,  1.00s/it]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:12<00:26,  1.00s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:13<00:25,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:14<00:24,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:15<00:23,  1.01s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:16<00:22,  1.01s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:17<00:21,  1.01s/it]Sampling (mamba memory):  90%|█████████ | 180/200 [01:18<0Sampling (mamba memory):  90%|█████████ | 181/200 [01:19<00:19,  1.01s/it][A[A

Sampling (mamba memory):  91%|█████████ | 182/200 [01:20<00:18,  1.02s/it][A[A

Sampling (mamba memory):  92%|█████████▏| 183/200 [01:21<00:17,  1.02s/it][A[A

Sampling (mamba memory):  92%|█████████▏| 184/200 [01:22<00:16,  1.02s/it][A[A

Sampling (mamba memory):  92%|█████████▎| 185/200 [01:23<00:15,  1.02s/it][A[A

Sampling (mamba memory):  93%|█████████▎| 186/200 [01:24<00:14,  1.02s/it][A[A

0:19,  1.04it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:15<00:18,  1.04it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:16<00:17,  1.04it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:17<00:16,  1.04it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:18<00:15,  1.04it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:19<00:14,  1.04it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:20<00:13,  1.03it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:21<00:12,  1.03it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:22<00:11,  1.03it/s]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:23<00:10,  1.02it/s]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:24<00:09,  1.02it/s]Sampling (mamba memory):  96%|█████████▌|Sampling (mamba memory):  94%|█████████▎| 187/200 [01:25<00:13,  1.02s/it][A[A

Sampling (mamba memory):  94%|█████████▍| 188/200 [01:26<00:12,  1.03s/it][A[A

0:19,  1.03it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:16<00:18,  1.03it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:17<00:17,  1.03it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:18<00:16,  1.03it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:19<00:15,  1.03it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:20<00:14,  1.02it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:21<00:13,  1.02it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:22<00:12,  1.02it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:23<00:11,  1.02it/s]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:24<00:10,  1.02it/s]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:25<00:09,  1.01it/s]Sampling (mamba memory):  96%|█████████▌|Sampling (mamba memory):  94%|█████████▍| 189/200 [01:27<00:11,  1.03s/it][A[A

0:19,  1.00it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:17<00:19,  1.00s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:18<00:18,  1.00s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:19<00:17,  1.00s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:20<00:16,  1.01s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:21<00:15,  1.01s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:22<00:14,  1.01s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:23<00:13,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:24<00:12,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:25<00:11,  1.02s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:26<00:10,  1.02s/it]Sampling (mamba memory):  96%|█████████▌|Sampling (mamba memory):  95%|█████████▌| 190/200 [01:28<00:10,  1.03s/it][A[A

0:19,  1.00it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:17<00:18,  1.00it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:18<00:17,  1.00it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:19<00:16,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:20<00:15,  1.01it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:21<00:14,  1.01it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:22<00:13,  1.01it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:23<00:12,  1.01it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:24<00:11,  1.00it/s]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:25<00:10,  1.00it/s]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:26<00:09,  1.00it/s]Sampling (mamba memory):  96%|█████████▌|0:20,  1.01s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:18<00:19,  1.01s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:19<00:18,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:20<00:17,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:21<00:16,  1.01s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:22<00:15,  1.01s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:23<00:14,  1.00s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:24<00:13,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:25<00:12,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:26<00:11,  1.01s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:27<00:10,  1.01s/it]Sampling (mamba memory):  96%|█████████▌|0:19,  1.02it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:17<00:18,  1.01it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:18<00:17,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:19<00:16,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:20<00:15,  1.01it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:21<00:14,  1.01it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:22<00:13,  1.01it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:23<00:12,  1.00it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:24<00:11,  1.00it/s]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:25<00:11,  1.00s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:26<00:10,  1.01s/it]Sampling (mamba memory):  96%|█████████▌|Sampling (mamba memory):  96%|█████████▌| 191/200 [01:29<00:09,  1.03s/it][A[A

0:20,  1.01s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:19<00:19,  1.02s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:20<00:18,  1.02s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:21<00:17,  1.02s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:22<00:16,  1.02s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:23<00:15,  1.02s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:24<00:14,  1.02s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:25<00:13,  1.02s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:26<00:12,  1.03s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:27<00:11,  1.03s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:28<00:10,  1.03s/it]Sampling (mamba memory):  96%|█████████▌|Sampling (mamba memory):  96%|█████████▌| 192/200 [01:30<00:08,  1.04s/it][A[A

Sampling (mamba memory):  96%|█████████▋| 193/200 [01:31<00:07,  1.04s/it][A[A

Sampling (mamba memory):  97%|█████████▋| 194/200 [01:32<00:06,  1.04s/it][A[A

Sampling (mamba memory):  98%|█████████▊| 195/200 [01:33<00:05,  1.04s/it][A[A

Sampling (mamba memory):  98%|█████████▊| 196/200 [01:34<00:04,  1.04s/it][A[A

Sampling (mamba memory):  98%|█████████▊| 197/200 [01:35<00:03,  1.04s/it][A[A

Sampling (mamba memory):  99%|█████████▉| 198/200 [01:36<00:02,  1.04s/it][A[A

Sampling (mamba memory): 100%|█████████▉| 199/200 [01:37<00:01,  1.04s/it][A[A

 191/200 [01:25<00:08,  1.01it/s]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:26<00:07,  1.01it/s]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:27<00:06,  1.01it/s]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:28<00:05,  1.01it/s]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:29<00:04,  1.01it/s]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:30<00:03,  1.01it/s]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:31<00:02,  1.01it/s]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:32<00:01,  1.01it/s]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:33<00:00,  1.01it/s]Sampling (mamba memory): 100%|██████████| 200/200 [01:34<00:00,  1.01it/s]Sampling (mamba memory): 100%|██████████| 200/200 [01:39<00:00,  1.01it/s]
 191/200 [01:26<00:08,  1.01it/s]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:27<00:07,  1.01it/s]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:28<00:06,  1.00it/s]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:29<00:06,  1.00s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:30<00:05,  1.00s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:31<00:04,  1.00s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:32<00:03,  1.00s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:33<00:02,  1.00s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:34<00:00,  1.00it/s]Sampling (mamba memory): 100%|██████████| 200/200 [01:35<00:00,  1.00it/s]Sampling (mamba memory): 100%|██████████| 200/200 [01:41<00:00,  1.01s/it]
 191/200 [01:27<00:08,  1.00it/s]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:28<00:08,  1.01s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:29<00:07,  1.01s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:30<00:06,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:31<00:05,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:32<00:04,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:33<00:03,  1.00s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:34<00:02,  1.00s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:35<00:01,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:36<00:00,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:42<00:00,  1.02s/it]
 191/200 [01:27<00:09,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:28<00:08,  1.03s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:29<00:07,  1.03s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:30<00:06,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:31<00:05,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:32<00:04,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:33<00:03,  1.03s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:34<00:02,  1.03s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:35<00:01,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:36<00:00,  1.03s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:42<00:00,  1.02s/it]
 191/200 [01:28<00:09,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:29<00:08,  1.01s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:30<00:07,  1.01s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:31<00:06,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:32<00:05,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:33<00:04,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:34<00:03,  1.01s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:35<00:02,  1.01s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:36<00:01,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:37<00:00,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:42<00:00,  1.03s/it]
 191/200 [01:27<00:09,  1.01s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:28<00:08,  1.02s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:29<00:07,  1.02s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:30<00:06,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:31<00:05,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:32<00:04,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:33<00:03,  1.01s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:34<00:02,  1.01s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:35<00:01,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:36<00:00,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:42<00:00,  1.02s/it]
Sampling (mamba memory): 100%|██████████| 200/200 [01:38<00:00,  1.04s/it][A[ASampling (mamba memory): 100%|██████████| 200/200 [01:45<00:00,  1.05s/it]
Validation DataLoader 0:   0%|          | 0/1 [00:00<?, ?it/s][A
 191/200 [01:29<00:09,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:30<00:08,  1.04s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:31<00:07,  1.04s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:32<00:06,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:33<00:05,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:34<00:04,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:35<00:03,  1.02s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:36<00:02,  1.01s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:37<00:01,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:38<00:00,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:43<00:00,  1.04s/it]
Validation DataLoader 0: 100%|██████████| 1/1 [01:46<00:00,  0.01it/s][A[2026-04-21 22:13:51,054][py.warnings][WARNING] - /proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/pytorch/trainer/connectors/logger_connector/result.py:433: It is recommended to use `self.log('mse', ..., sync_dist=True)` when logging on epoch level in distributed setting to accumulate the metric across devices.

[2026-04-21 22:13:51,060][py.warnings][WARNING] - /proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/pytorch/trainer/connectors/logger_connector/result.py:433: It is recommended to use `self.log('psnr', ..., sync_dist=True)` when logging on epoch level in distributed setting to accumulate the metric across devices.

[2026-04-21 22:13:51,060][py.warnings][WARNING] - /proj/cvl/users/x_fahkh2/envs/worldmem/lib/python3.10/site-packages/lightning/pytorch/trainer/connectors/logger_connector/result.py:433: It is recommended to use `self.log('lpips', ..., sync_dist=True)` when logging on epoch level in distributed setting to accumulate the metric across devices.


[2026-04-21 22:13:52,259][py.warnings][WARNING] - /proj/cvl/users/x_fahkh2/WorldMem_Repro/algorithms/worldmem/models/mamba_memory.py:173: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(enabled=False):

[2026-04-21 22:13:52,274][py.warnings][WARNING] - /proj/cvl/users/x_fahkh2/WorldMem_Repro/algorithms/worldmem/models/mamba_memory.py:173: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(enabled=False):

[2026-04-21 22:13:52,311][py.warnings][WARNING] - /proj/cvl/users/x_fahkh2/WorldMem_Repro/algorithms/worldmem/models/mamba_memory.py:173: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(enabled=False):

[2026-04-21 22:13:52,476][py.warnings][WARNING] - /proj/cvl/users/x_fahkh2/WorldMem_Repro/algorithms/worldmem/models/mamba_memory.py:173: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(enabled=False):

[2026-04-21 22:13:52,544][py.warnings][WARNING] - /proj/cvl/users/x_fahkh2/WorldMem_Repro/algorithms/worldmem/models/mamba_memory.py:173: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(enabled=False):

[2026-04-21 22:13:52,608][py.warnings][WARNING] - /proj/cvl/users/x_fahkh2/WorldMem_Repro/algorithms/worldmem/models/mamba_memory.py:173: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(enabled=False):

                                                                      [AEpoch 0:   0%|          | 0/203307 [01:49<?, ?it/s, v_num=line][2026-04-21 22:13:52,746][py.warnings][WARNING] - /proj/cvl/users/x_fahkh2/WorldMem_Repro/algorithms/worldmem/models/mamba_memory.py:173: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(enabled=False):

[2026-04-21 22:13:52,829][py.warnings][WARNING] - /proj/cvl/users/x_fahkh2/WorldMem_Repro/algorithms/worldmem/models/mamba_memory.py:173: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
  with torch.cuda.amp.autocast(enabled=False):

Epoch 0:  15%|█▍        | 30000/203307 [01:54<11:00, 262.20it/s, v_num=line]Epoch 0:  15%|█▍        | 30000/203307 [01:54<11:01, 262.16it/s, v_num=line]Epoch 0:  15%|█▍        | 30001/203307 [01:58<11:22, 253.91it/s, v_num=line]Epoch 0:  15%|█▍        | 30001/203307 [01:58<11:22, 253.89it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30002/203307 [02:02<11:47, 245.12it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30002/203307 [02:02<11:47, 245.10it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30003/203307 [02:06<12:11, 236.80it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30003/203307 [02:06<12:11, 236.79it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30004/203307 [02:12<12:44, 226.81it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30004/203307 [02:12<12:44, 226.81it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30005/203307 [02:16<13:06, 220.27it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30005/203307 [02:16<13:06, 220.27it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30006/203307 [02:20<13:30, 213.95it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30006/203307 [02:20<13:30, 213.95it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30007/203307 [02:24<13:53, 208.00it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30007/203307 [02:24<13:53, 208.00it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30008/203307 [02:28<14:16, 202.29it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30008/203307 [02:28<14:16, 202.29it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30009/203307 [02:32<14:40, 196.86it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30009/203307 [02:32<14:40, 196.86it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30010/203307 [02:36<15:04, 191.57it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30010/203307 [02:36<15:04, 191.57it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30011/203307 [02:40<15:28, 186.65it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30011/203307 [02:40<15:28, 186.64it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30012/203307 [02:45<15:53, 181.83it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30012/203307 [02:45<15:53, 181.83it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30013/203307 [02:49<16:20, 176.75it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30013/203307 [02:49<16:20, 176.75it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30014/203307 [02:54<16:45, 172.41it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30014/203307 [02:54<16:45, 172.41it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30015/203307 [02:58<17:08, 168.47it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30015/203307 [02:58<17:08, 168.47it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30016/203307 [03:02<17:32, 164.71it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30016/203307 [03:02<17:32, 164.71it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30017/203307 [03:06<17:55, 161.13it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30017/203307 [03:06<17:55, 161.12it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30018/203307 [03:10<18:19, 157.64it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30018/203307 [03:10<18:19, 157.64it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30019/203307 [03:14<18:42, 154.32it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30019/203307 [03:14<18:42, 154.32it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30020/203307 [03:18<19:06, 151.16it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30020/203307 [03:18<19:06, 151.16it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30021/203307 [03:23<19:34, 147.52it/s, v_num=line, training/loss=0.075]Epoch 0:  15%|█▍        | 30021/203307 [03:23<19:34, 147.52it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30022/203307 [03:28<20:02, 144.08it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30022/203307 [03:28<20:02, 144.08it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30023/203307 [03:32<20:25, 141.37it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30023/203307 [03:32<20:25, 141.37it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30024/203307 [03:36<20:49, 138.73it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30024/203307 [03:36<20:49, 138.73it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30025/203307 [03:40<21:12, 136.22it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30025/203307 [03:40<21:12, 136.22it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30026/203307 [03:44<21:34, 133.89it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30026/203307 [03:44<21:34, 133.89it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30027/203307 [03:48<21:57, 131.52it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30027/203307 [03:48<21:57, 131.52it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30028/203307 [03:52<22:20, 129.24it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30028/203307 [03:52<22:20, 129.24it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30029/203307 [03:57<22:52, 126.21it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30029/203307 [03:57<22:52, 126.21it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30030/203307 [04:02<23:18, 123.90it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30030/203307 [04:02<23:18, 123.90it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30031/203307 [04:06<23:41, 121.91it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30031/203307 [04:06<23:41, 121.91it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30032/203307 [04:10<24:04, 119.96it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30032/203307 [04:10<24:04, 119.96it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30033/203307 [04:14<24:27, 118.06it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30033/203307 [04:14<24:27, 118.06it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30034/203307 [04:18<24:50, 116.27it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30034/203307 [04:18<24:50, 116.27it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30035/203307 [04:22<25:14, 114.43it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30035/203307 [04:22<25:14, 114.43it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30036/203307 [04:26<25:37, 112.70it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30036/203307 [04:26<25:37, 112.70it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30037/203307 [04:30<26:00, 111.06it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30037/203307 [04:30<26:00, 111.06it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30038/203307 [04:35<26:27, 109.12it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30038/203307 [04:35<26:27, 109.12it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30039/203307 [04:40<26:55, 107.27it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30039/203307 [04:40<26:55, 107.27it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30040/203307 [04:44<27:18, 105.77it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30040/203307 [04:44<27:18, 105.77it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30041/203307 [04:48<27:41, 104.29it/s, v_num=line, training/loss=0.0889]Epoch 0:  15%|█▍        | 30041/203307 [04:48<27:41, 104.29it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30042/203307 [04:52<28:05, 102.82it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30042/203307 [04:52<28:05, 102.82it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30043/203307 [04:56<28:28, 101.42it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30043/203307 [04:56<28:28, 101.42it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30044/203307 [05:00<28:50, 100.12it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30044/203307 [05:00<28:50, 100.11it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30045/203307 [05:04<29:15, 98.70it/s, v_num=line, training/loss=0.0886] Epoch 0:  15%|█▍        | 30045/203307 [05:04<29:15, 98.70it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30046/203307 [05:09<29:43, 97.17it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30046/203307 [05:09<29:43, 97.17it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30047/203307 [05:13<30:07, 95.85it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30047/203307 [05:13<30:07, 95.85it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30048/203307 [05:18<30:35, 94.41it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30048/203307 [05:18<30:35, 94.41it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30049/203307 [05:22<30:57, 93.26it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30049/203307 [05:22<30:57, 93.26it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30050/203307 [05:26<31:20, 92.14it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30050/203307 [05:26<31:20, 92.14it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30051/203307 [05:30<31:43, 91.00it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30051/203307 [05:30<31:43, 91.00it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30052/203307 [05:34<32:06, 89.94it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30052/203307 [05:34<32:06, 89.94it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30053/203307 [05:38<32:29, 88.88it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30053/203307 [05:38<32:29, 88.88it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30054/203307 [05:42<32:56, 87.65it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30054/203307 [05:42<32:56, 87.65it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30055/203307 [05:46<33:19, 86.66it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30055/203307 [05:46<33:19, 86.66it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30056/203307 [05:51<33:46, 85.48it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30056/203307 [05:51<33:46, 85.48it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30057/203307 [05:55<34:10, 84.49it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30057/203307 [05:55<34:10, 84.49it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30058/203307 [05:59<34:33, 83.56it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30058/203307 [05:59<34:33, 83.56it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30059/203307 [06:03<34:56, 82.62it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30059/203307 [06:03<34:56, 82.62it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30060/203307 [06:07<35:20, 81.69it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30060/203307 [06:07<35:20, 81.69it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30061/203307 [06:11<35:43, 80.83it/s, v_num=line, training/loss=0.0886]Epoch 0:  15%|█▍        | 30061/203307 [06:11<35:43, 80.82it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30062/203307 [06:16<36:07, 79.92it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30062/203307 [06:16<36:07, 79.92it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30063/203307 [06:20<36:29, 79.11it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30063/203307 [06:20<36:29, 79.11it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30064/203307 [06:24<36:57, 78.11it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30064/203307 [06:24<36:57, 78.11it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30065/203307 [06:29<37:24, 77.19it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30065/203307 [06:29<37:24, 77.19it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30066/203307 [06:33<37:47, 76.41it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30066/203307 [06:33<37:47, 76.41it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30067/203307 [06:37<38:10, 75.63it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30067/203307 [06:37<38:10, 75.63it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30068/203307 [06:41<38:33, 74.87it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30068/203307 [06:41<38:33, 74.87it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30069/203307 [06:45<38:56, 74.15it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30069/203307 [06:45<38:56, 74.15it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30070/203307 [06:49<39:19, 73.41it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30070/203307 [06:49<39:20, 73.41it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30071/203307 [06:53<39:42, 72.70it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30071/203307 [06:53<39:42, 72.70it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30072/203307 [06:58<40:08, 71.93it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30072/203307 [06:58<40:08, 71.93it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30073/203307 [07:02<40:30, 71.26it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30073/203307 [07:02<40:30, 71.26it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30074/203307 [07:06<40:59, 70.44it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30074/203307 [07:06<40:59, 70.44it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30075/203307 [07:10<41:21, 69.80it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30075/203307 [07:10<41:22, 69.80it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30076/203307 [07:15<41:46, 69.13it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30076/203307 [07:15<41:46, 69.13it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30077/203307 [07:19<42:08, 68.50it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30077/203307 [07:19<42:08, 68.50it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30078/203307 [07:23<42:31, 67.89it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30078/203307 [07:23<42:31, 67.89it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30079/203307 [07:27<42:54, 67.28it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30079/203307 [07:27<42:54, 67.28it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30080/203307 [07:31<43:20, 66.61it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30080/203307 [07:31<43:20, 66.61it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30081/203307 [07:35<43:43, 66.03it/s, v_num=line, training/loss=0.0895]Epoch 0:  15%|█▍        | 30081/203307 [07:35<43:43, 66.03it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30082/203307 [07:40<44:11, 65.33it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30082/203307 [07:40<44:11, 65.33it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30083/203307 [07:44<44:34, 64.77it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30083/203307 [07:44<44:34, 64.77it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30084/203307 [07:48<45:00, 64.16it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30084/203307 [07:48<45:00, 64.16it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30085/203307 [07:52<45:22, 63.63it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30085/203307 [07:52<45:22, 63.63it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30086/203307 [07:57<45:46, 63.07it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30086/203307 [07:57<45:46, 63.07it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30087/203307 [08:00<46:08, 62.56it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30087/203307 [08:00<46:08, 62.56it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30088/203307 [08:05<46:32, 62.03it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30088/203307 [08:05<46:32, 62.03it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30089/203307 [08:09<46:58, 61.45it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30089/203307 [08:09<46:59, 61.45it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30090/203307 [08:13<47:21, 60.95it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30090/203307 [08:13<47:21, 60.95it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30091/203307 [08:18<47:49, 60.37it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30091/203307 [08:18<47:49, 60.37it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30092/203307 [08:22<48:12, 59.89it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30092/203307 [08:22<48:12, 59.89it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30093/203307 [08:26<48:36, 59.38it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30093/203307 [08:26<48:37, 59.38it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30094/203307 [08:30<49:00, 58.91it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30094/203307 [08:30<49:00, 58.91it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30095/203307 [08:34<49:23, 58.45it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30095/203307 [08:34<49:23, 58.45it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30096/203307 [08:38<49:46, 58.00it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30096/203307 [08:38<49:46, 58.00it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30097/203307 [08:43<50:14, 57.45it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30097/203307 [08:43<50:14, 57.45it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30098/203307 [08:47<50:37, 57.02it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30098/203307 [08:47<50:37, 57.02it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30099/203307 [08:51<51:00, 56.60it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30099/203307 [08:51<51:00, 56.60it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30100/203307 [08:56<51:28, 56.09it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30100/203307 [08:56<51:28, 56.09it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30101/203307 [09:00<51:52, 55.66it/s, v_num=line, training/loss=0.0817]Epoch 0:  15%|█▍        | 30101/203307 [09:00<51:52, 55.66it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30102/203307 [09:05<52:18, 55.19it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30102/203307 [09:05<52:18, 55.19it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30103/203307 [09:09<52:41, 54.78it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30103/203307 [09:09<52:41, 54.78it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30104/203307 [09:13<53:02, 54.42it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30104/203307 [09:13<53:03, 54.41it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30105/203307 [09:17<53:26, 54.02it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30105/203307 [09:17<53:26, 54.02it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30106/203307 [09:22<53:53, 53.57it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30106/203307 [09:22<53:53, 53.57it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30107/203307 [09:25<54:15, 53.20it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30107/203307 [09:25<54:15, 53.20it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30108/203307 [09:30<54:44, 52.74it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30108/203307 [09:30<54:44, 52.74it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30109/203307 [09:34<55:07, 52.37it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30109/203307 [09:34<55:07, 52.37it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30110/203307 [09:38<55:30, 52.01it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30110/203307 [09:38<55:30, 52.01it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30111/203307 [09:43<55:54, 51.63it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30111/203307 [09:43<55:54, 51.62it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30112/203307 [09:47<56:17, 51.28it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30112/203307 [09:47<56:17, 51.28it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30113/203307 [09:51<56:40, 50.93it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30113/203307 [09:51<56:40, 50.93it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30114/203307 [09:55<57:04, 50.58it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30114/203307 [09:55<57:04, 50.58it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30115/203307 [10:00<57:31, 50.18it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30115/203307 [10:00<57:31, 50.18it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30116/203307 [10:04<57:54, 49.85it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30116/203307 [10:04<57:54, 49.85it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30117/203307 [10:09<58:22, 49.45it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30117/203307 [10:09<58:22, 49.45it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30118/203307 [10:13<58:45, 49.12it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30118/203307 [10:13<58:45, 49.12it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30119/203307 [10:17<59:09, 48.80it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30119/203307 [10:17<59:09, 48.80it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30120/203307 [10:21<59:33, 48.47it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30120/203307 [10:21<59:33, 48.47it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30121/203307 [10:25<59:57, 48.15it/s, v_num=line, training/loss=0.0822]Epoch 0:  15%|█▍        | 30121/203307 [10:25<59:57, 48.14it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30122/203307 [10:29<1:00:20, 47.84it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30122/203307 [10:29<1:00:20, 47.84it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30123/203307 [10:34<1:00:47, 47.49it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30123/203307 [10:34<1:00:47, 47.49it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30124/203307 [10:38<1:01:09, 47.19it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30124/203307 [10:38<1:01:09, 47.19it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30125/203307 [10:42<1:01:32, 46.90it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30125/203307 [10:42<1:01:32, 46.90it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30126/203307 [10:47<1:02:01, 46.54it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30126/203307 [10:47<1:02:01, 46.54it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30127/203307 [10:51<1:02:24, 46.25it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30127/203307 [10:51<1:02:24, 46.25it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30128/203307 [10:55<1:02:46, 45.97it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30128/203307 [10:55<1:02:47, 45.97it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30129/203307 [10:59<1:03:11, 45.68it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30129/203307 [10:59<1:03:11, 45.68it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30130/203307 [11:03<1:03:34, 45.40it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30130/203307 [11:03<1:03:34, 45.40it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30131/203307 [11:07<1:03:55, 45.15it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30131/203307 [11:07<1:03:55, 45.15it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30132/203307 [11:12<1:04:22, 44.83it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30132/203307 [11:12<1:04:22, 44.83it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30133/203307 [11:16<1:04:45, 44.57it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30133/203307 [11:16<1:04:45, 44.57it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30134/203307 [11:21<1:05:14, 44.24it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30134/203307 [11:21<1:05:14, 44.24it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30135/203307 [11:25<1:05:37, 43.98it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30135/203307 [11:25<1:05:37, 43.98it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30136/203307 [11:29<1:06:00, 43.72it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30136/203307 [11:29<1:06:00, 43.72it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30137/203307 [11:33<1:06:23, 43.47it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30137/203307 [11:33<1:06:23, 43.47it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30138/203307 [11:38<1:06:50, 43.18it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30138/203307 [11:38<1:06:50, 43.18it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30139/203307 [11:42<1:07:13, 42.93it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30139/203307 [11:42<1:07:13, 42.93it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30140/203307 [11:46<1:07:36, 42.69it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30140/203307 [11:46<1:07:36, 42.69it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30141/203307 [11:50<1:08:03, 42.40it/s, v_num=line, training/loss=0.0778]Epoch 0:  15%|█▍        | 30141/203307 [11:50<1:08:03, 42.40it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30142/203307 [11:54<1:08:27, 42.16it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30142/203307 [11:54<1:08:27, 42.16it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30143/203307 [11:59<1:08:55, 41.88it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30143/203307 [11:59<1:08:55, 41.88it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30144/203307 [12:03<1:09:18, 41.64it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30144/203307 [12:03<1:09:18, 41.64it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30145/203307 [12:07<1:09:39, 41.43it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30145/203307 [12:07<1:09:39, 41.43it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30146/203307 [12:11<1:10:03, 41.19it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30146/203307 [12:11<1:10:03, 41.19it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30147/203307 [12:16<1:10:28, 40.95it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30147/203307 [12:16<1:10:28, 40.95it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30148/203307 [12:20<1:10:50, 40.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30148/203307 [12:20<1:10:50, 40.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30149/203307 [12:24<1:11:15, 40.50it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30149/203307 [12:24<1:11:15, 40.50it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30150/203307 [12:28<1:11:39, 40.27it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30150/203307 [12:28<1:11:39, 40.27it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30151/203307 [12:32<1:12:02, 40.06it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30151/203307 [12:32<1:12:02, 40.06it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30152/203307 [12:37<1:12:29, 39.81it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30152/203307 [12:37<1:12:29, 39.81it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30153/203307 [12:41<1:12:52, 39.60it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30153/203307 [12:41<1:12:52, 39.60it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30154/203307 [12:45<1:13:15, 39.39it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30154/203307 [12:45<1:13:15, 39.39it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30155/203307 [12:49<1:13:37, 39.19it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30155/203307 [12:49<1:13:37, 39.19it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30156/203307 [12:53<1:14:02, 38.97it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30156/203307 [12:53<1:14:02, 38.97it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30157/203307 [12:57<1:14:25, 38.78it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30157/203307 [12:57<1:14:25, 38.78it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30158/203307 [13:02<1:14:51, 38.55it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30158/203307 [13:02<1:14:51, 38.55it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30159/203307 [13:06<1:15:13, 38.36it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30159/203307 [13:06<1:15:13, 38.36it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30160/203307 [13:10<1:15:40, 38.13it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30160/203307 [13:10<1:15:40, 38.13it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30161/203307 [13:14<1:16:02, 37.95it/s, v_num=line, training/loss=0.0803]Epoch 0:  15%|█▍        | 30161/203307 [13:14<1:16:02, 37.95it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30162/203307 [13:18<1:16:25, 37.76it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30162/203307 [13:18<1:16:25, 37.76it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30163/203307 [13:22<1:16:48, 37.57it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30163/203307 [13:22<1:16:48, 37.57it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30164/203307 [13:26<1:17:10, 37.39it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30164/203307 [13:26<1:17:10, 37.39it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30165/203307 [13:31<1:17:35, 37.19it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30165/203307 [13:31<1:17:35, 37.19it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30166/203307 [13:35<1:17:58, 37.01it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30166/203307 [13:35<1:17:58, 37.01it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30167/203307 [13:39<1:18:24, 36.80it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30167/203307 [13:39<1:18:24, 36.80it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30168/203307 [13:43<1:18:46, 36.63it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30168/203307 [13:43<1:18:46, 36.63it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30169/203307 [13:48<1:19:13, 36.42it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30169/203307 [13:48<1:19:13, 36.42it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30170/203307 [13:52<1:19:36, 36.25it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30170/203307 [13:52<1:19:36, 36.25it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30171/203307 [13:56<1:19:59, 36.07it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30171/203307 [13:56<1:19:59, 36.07it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30172/203307 [14:00<1:20:21, 35.91it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30172/203307 [14:00<1:20:21, 35.91it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30173/203307 [14:04<1:20:44, 35.74it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30173/203307 [14:04<1:20:44, 35.74it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30174/203307 [14:09<1:21:11, 35.54it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30174/203307 [14:09<1:21:11, 35.54it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30175/203307 [14:13<1:21:37, 35.35it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30175/203307 [14:13<1:21:37, 35.35it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30176/203307 [14:17<1:21:59, 35.19it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30176/203307 [14:17<1:21:59, 35.19it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30177/203307 [14:21<1:22:21, 35.03it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30177/203307 [14:21<1:22:21, 35.03it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30178/203307 [14:26<1:22:49, 34.84it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30178/203307 [14:26<1:22:49, 34.84it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30179/203307 [14:30<1:23:11, 34.68it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30179/203307 [14:30<1:23:11, 34.68it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30180/203307 [14:34<1:23:34, 34.53it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30180/203307 [14:34<1:23:34, 34.53it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30181/203307 [14:37<1:23:55, 34.38it/s, v_num=line, training/loss=0.0875]Epoch 0:  15%|█▍        | 30181/203307 [14:37<1:23:55, 34.38it/s, v_num=line, training/loss=0.072] Epoch 0:  15%|█▍        | 30182/203307 [14:41<1:24:18, 34.22it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30182/203307 [14:41<1:24:18, 34.22it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30183/203307 [14:46<1:24:43, 34.05it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30183/203307 [14:46<1:24:43, 34.05it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30184/203307 [14:50<1:25:09, 33.88it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30184/203307 [14:50<1:25:10, 33.88it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30185/203307 [14:54<1:25:31, 33.74it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30185/203307 [14:54<1:25:31, 33.74it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30186/203307 [14:59<1:25:59, 33.55it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30186/203307 [14:59<1:25:59, 33.55it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30187/203307 [15:03<1:26:21, 33.41it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30187/203307 [15:03<1:26:21, 33.41it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30188/203307 [15:07<1:26:43, 33.27it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30188/203307 [15:07<1:26:43, 33.27it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30189/203307 [15:11<1:27:05, 33.13it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30189/203307 [15:11<1:27:05, 33.13it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30190/203307 [15:15<1:27:28, 32.98it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30190/203307 [15:15<1:27:28, 32.98it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30191/203307 [15:19<1:27:50, 32.85it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30191/203307 [15:19<1:27:50, 32.85it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30192/203307 [15:23<1:28:16, 32.69it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30192/203307 [15:23<1:28:16, 32.69it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30193/203307 [15:28<1:28:40, 32.54it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30193/203307 [15:28<1:28:40, 32.53it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30194/203307 [15:32<1:29:04, 32.39it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30194/203307 [15:32<1:29:04, 32.39it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30195/203307 [15:36<1:29:31, 32.23it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30195/203307 [15:36<1:29:31, 32.23it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30196/203307 [15:40<1:29:54, 32.09it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30196/203307 [15:40<1:29:54, 32.09it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30197/203307 [15:44<1:30:15, 31.96it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30197/203307 [15:44<1:30:15, 31.96it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30198/203307 [15:48<1:30:38, 31.83it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30198/203307 [15:48<1:30:38, 31.83it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30199/203307 [15:52<1:31:01, 31.70it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30199/203307 [15:52<1:31:01, 31.70it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30200/203307 [15:56<1:31:23, 31.57it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30200/203307 [15:56<1:31:23, 31.57it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30201/203307 [16:01<1:31:49, 31.42it/s, v_num=line, training/loss=0.072]Epoch 0:  15%|█▍        | 30201/203307 [16:01<1:31:49, 31.42it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30202/203307 [16:05<1:32:12, 31.29it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30202/203307 [16:05<1:32:13, 31.29it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30203/203307 [16:09<1:32:35, 31.16it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30203/203307 [16:09<1:32:35, 31.16it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30204/203307 [16:14<1:33:02, 31.01it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30204/203307 [16:14<1:33:02, 31.01it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30205/203307 [16:17<1:33:24, 30.89it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30205/203307 [16:17<1:33:24, 30.89it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30206/203307 [16:21<1:33:46, 30.76it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30206/203307 [16:21<1:33:46, 30.76it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30207/203307 [16:25<1:34:09, 30.64it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30207/203307 [16:25<1:34:09, 30.64it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30208/203307 [16:29<1:34:31, 30.52it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30208/203307 [16:29<1:34:31, 30.52it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30209/203307 [16:33<1:34:53, 30.40it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30209/203307 [16:33<1:34:53, 30.40it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30210/203307 [16:38<1:35:20, 30.26it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30210/203307 [16:38<1:35:20, 30.26it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30211/203307 [16:42<1:35:42, 30.14it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30211/203307 [16:42<1:35:42, 30.14it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30212/203307 [16:46<1:36:09, 30.00it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30212/203307 [16:46<1:36:09, 30.00it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30213/203307 [16:50<1:36:31, 29.89it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30213/203307 [16:50<1:36:31, 29.89it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30214/203307 [16:54<1:36:54, 29.77it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30214/203307 [16:54<1:36:54, 29.77it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30215/203307 [16:58<1:37:16, 29.66it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30215/203307 [16:58<1:37:16, 29.66it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30216/203307 [17:02<1:37:39, 29.54it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30216/203307 [17:02<1:37:39, 29.54it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30217/203307 [17:06<1:38:01, 29.43it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30217/203307 [17:06<1:38:01, 29.43it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30218/203307 [17:10<1:38:24, 29.31it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30218/203307 [17:10<1:38:24, 29.31it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30219/203307 [17:15<1:38:50, 29.18it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30219/203307 [17:15<1:38:50, 29.18it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30220/203307 [17:19<1:39:13, 29.07it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30220/203307 [17:19<1:39:13, 29.07it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30221/203307 [17:24<1:39:41, 28.94it/s, v_num=line, training/loss=0.0787]Epoch 0:  15%|█▍        | 30221/203307 [17:24<1:39:41, 28.94it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30222/203307 [17:28<1:40:04, 28.83it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30222/203307 [17:28<1:40:04, 28.83it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30223/203307 [17:32<1:40:26, 28.72it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30223/203307 [17:32<1:40:26, 28.72it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30224/203307 [17:36<1:40:49, 28.61it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30224/203307 [17:36<1:40:49, 28.61it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30225/203307 [17:40<1:41:12, 28.50it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30225/203307 [17:40<1:41:12, 28.50it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30226/203307 [17:44<1:41:35, 28.40it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30226/203307 [17:44<1:41:35, 28.40it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30227/203307 [17:48<1:42:01, 28.28it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30227/203307 [17:48<1:42:01, 28.28it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30228/203307 [17:53<1:42:25, 28.16it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30228/203307 [17:53<1:42:25, 28.16it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30229/203307 [17:57<1:42:49, 28.05it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30229/203307 [17:57<1:42:49, 28.05it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30230/203307 [18:02<1:43:16, 27.93it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30230/203307 [18:02<1:43:16, 27.93it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30231/203307 [18:06<1:43:39, 27.83it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30231/203307 [18:06<1:43:39, 27.83it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30232/203307 [18:10<1:44:00, 27.74it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30232/203307 [18:10<1:44:00, 27.74it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30233/203307 [18:13<1:44:22, 27.64it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30233/203307 [18:13<1:44:22, 27.64it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30234/203307 [18:18<1:44:46, 27.53it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30234/203307 [18:18<1:44:46, 27.53it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30235/203307 [18:22<1:45:09, 27.43it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30235/203307 [18:22<1:45:09, 27.43it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30236/203307 [18:26<1:45:34, 27.32it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30236/203307 [18:26<1:45:34, 27.32it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30237/203307 [18:31<1:46:00, 27.21it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30237/203307 [18:31<1:46:00, 27.21it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30238/203307 [18:36<1:46:27, 27.09it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30238/203307 [18:36<1:46:27, 27.09it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30239/203307 [18:40<1:46:51, 26.99it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30239/203307 [18:40<1:46:51, 26.99it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30240/203307 [18:44<1:47:12, 26.90it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30240/203307 [18:44<1:47:12, 26.90it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30241/203307 [18:48<1:47:36, 26.81it/s, v_num=line, training/loss=0.0869]Epoch 0:  15%|█▍        | 30241/203307 [18:48<1:47:36, 26.81it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30242/203307 [18:52<1:47:59, 26.71it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30242/203307 [18:52<1:47:59, 26.71it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30243/203307 [18:56<1:48:22, 26.62it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30243/203307 [18:56<1:48:22, 26.62it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30244/203307 [19:00<1:48:43, 26.53it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30244/203307 [19:00<1:48:43, 26.53it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30245/203307 [19:04<1:49:08, 26.43it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30245/203307 [19:04<1:49:09, 26.43it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30246/203307 [19:09<1:49:35, 26.32it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30246/203307 [19:09<1:49:35, 26.32it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30247/203307 [19:13<1:50:01, 26.21it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30247/203307 [19:13<1:50:01, 26.21it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30248/203307 [19:17<1:50:23, 26.13it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30248/203307 [19:17<1:50:23, 26.13it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30249/203307 [19:21<1:50:46, 26.04it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30249/203307 [19:21<1:50:46, 26.04it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30250/203307 [19:25<1:51:09, 25.95it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30250/203307 [19:25<1:51:09, 25.95it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30251/203307 [19:29<1:51:32, 25.86it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30251/203307 [19:29<1:51:32, 25.86it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30252/203307 [19:33<1:51:54, 25.77it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30252/203307 [19:33<1:51:54, 25.77it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30253/203307 [19:38<1:52:19, 25.68it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30253/203307 [19:38<1:52:19, 25.68it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30254/203307 [19:42<1:52:42, 25.59it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30254/203307 [19:42<1:52:42, 25.59it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30255/203307 [19:46<1:53:07, 25.50it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30255/203307 [19:46<1:53:07, 25.50it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30256/203307 [19:51<1:53:35, 25.39it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30256/203307 [19:51<1:53:35, 25.39it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30257/203307 [19:55<1:53:57, 25.31it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30257/203307 [19:55<1:53:57, 25.31it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30258/203307 [19:59<1:54:19, 25.23it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30258/203307 [19:59<1:54:19, 25.23it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30259/203307 [20:03<1:54:42, 25.14it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30259/203307 [20:03<1:54:42, 25.14it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30260/203307 [20:07<1:55:04, 25.06it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30260/203307 [20:07<1:55:04, 25.06it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30261/203307 [20:11<1:55:27, 24.98it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▍        | 30261/203307 [20:11<1:55:27, 24.98it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30262/203307 [20:16<1:55:54, 24.88it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30262/203307 [20:16<1:55:54, 24.88it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30263/203307 [20:19<1:56:15, 24.81it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30263/203307 [20:20<1:56:16, 24.81it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30264/203307 [20:24<1:56:43, 24.71it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30264/203307 [20:24<1:56:43, 24.71it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30265/203307 [20:28<1:57:06, 24.63it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30265/203307 [20:28<1:57:06, 24.63it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30266/203307 [20:32<1:57:29, 24.55it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30266/203307 [20:32<1:57:29, 24.55it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30267/203307 [20:36<1:57:52, 24.47it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30267/203307 [20:37<1:57:52, 24.47it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30268/203307 [20:41<1:58:14, 24.39it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30268/203307 [20:41<1:58:14, 24.39it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30269/203307 [20:44<1:58:36, 24.31it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30269/203307 [20:44<1:58:37, 24.31it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30270/203307 [20:48<1:58:59, 24.24it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30270/203307 [20:48<1:58:59, 24.24it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30271/203307 [20:53<1:59:25, 24.15it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30271/203307 [20:53<1:59:25, 24.15it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30272/203307 [20:57<1:59:47, 24.07it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30272/203307 [20:57<1:59:47, 24.07it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30273/203307 [21:02<2:00:14, 23.98it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30273/203307 [21:02<2:00:14, 23.98it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30274/203307 [21:06<2:00:37, 23.91it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30274/203307 [21:06<2:00:37, 23.91it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30275/203307 [21:10<2:00:59, 23.83it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30275/203307 [21:10<2:00:59, 23.83it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30276/203307 [21:14<2:01:22, 23.76it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30276/203307 [21:14<2:01:22, 23.76it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30277/203307 [21:18<2:01:44, 23.69it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30277/203307 [21:18<2:01:44, 23.69it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30278/203307 [21:22<2:02:07, 23.62it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30278/203307 [21:22<2:02:07, 23.61it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30279/203307 [21:26<2:02:32, 23.53it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30279/203307 [21:26<2:02:32, 23.53it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30280/203307 [21:30<2:02:54, 23.46it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30280/203307 [21:30<2:02:54, 23.46it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30281/203307 [21:34<2:03:17, 23.39it/s, v_num=line, training/loss=0.0897]Epoch 0:  15%|█▍        | 30281/203307 [21:34<2:03:17, 23.39it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30282/203307 [21:39<2:03:45, 23.30it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30282/203307 [21:39<2:03:45, 23.30it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30283/203307 [21:43<2:04:07, 23.23it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30283/203307 [21:43<2:04:07, 23.23it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30284/203307 [21:47<2:04:29, 23.16it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30284/203307 [21:47<2:04:29, 23.16it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30285/203307 [21:51<2:04:51, 23.10it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30285/203307 [21:51<2:04:51, 23.10it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30286/203307 [21:55<2:05:13, 23.03it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30286/203307 [21:55<2:05:14, 23.03it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30287/203307 [21:59<2:05:35, 22.96it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30287/203307 [21:59<2:05:36, 22.96it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30288/203307 [22:03<2:06:01, 22.88it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30288/203307 [22:03<2:06:01, 22.88it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30289/203307 [22:07<2:06:23, 22.82it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30289/203307 [22:07<2:06:23, 22.82it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30290/203307 [22:12<2:06:50, 22.73it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30290/203307 [22:12<2:06:50, 22.73it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30291/203307 [22:16<2:07:15, 22.66it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30291/203307 [22:16<2:07:15, 22.66it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30292/203307 [22:20<2:07:37, 22.59it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30292/203307 [22:20<2:07:37, 22.59it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30293/203307 [22:24<2:07:58, 22.53it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30293/203307 [22:24<2:07:59, 22.53it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30294/203307 [22:28<2:08:22, 22.46it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30294/203307 [22:28<2:08:22, 22.46it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30295/203307 [22:32<2:08:44, 22.40it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30295/203307 [22:32<2:08:44, 22.40it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30296/203307 [22:36<2:09:06, 22.33it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30296/203307 [22:36<2:09:06, 22.33it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30297/203307 [22:40<2:09:31, 22.26it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30297/203307 [22:40<2:09:31, 22.26it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30298/203307 [22:44<2:09:54, 22.20it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30298/203307 [22:44<2:09:54, 22.20it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30299/203307 [22:49<2:10:21, 22.12it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30299/203307 [22:49<2:10:21, 22.12it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30300/203307 [22:54<2:10:46, 22.05it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30300/203307 [22:54<2:10:46, 22.05it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30301/203307 [22:58<2:11:08, 21.99it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▍        | 30301/203307 [22:58<2:11:08, 21.99it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30302/203307 [23:02<2:11:30, 21.92it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30302/203307 [23:02<2:11:30, 21.92it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30303/203307 [23:06<2:11:53, 21.86it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30303/203307 [23:06<2:11:53, 21.86it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30304/203307 [23:09<2:12:15, 21.80it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30304/203307 [23:09<2:12:15, 21.80it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30305/203307 [23:14<2:12:40, 21.73it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30305/203307 [23:14<2:12:40, 21.73it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30306/203307 [23:18<2:13:02, 21.67it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30306/203307 [23:18<2:13:03, 21.67it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30307/203307 [23:22<2:13:24, 21.61it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30307/203307 [23:22<2:13:24, 21.61it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30308/203307 [23:27<2:13:52, 21.54it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30308/203307 [23:27<2:13:52, 21.54it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30309/203307 [23:31<2:14:16, 21.47it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30309/203307 [23:31<2:14:16, 21.47it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30310/203307 [23:35<2:14:39, 21.41it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30310/203307 [23:35<2:14:39, 21.41it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30311/203307 [23:39<2:15:01, 21.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30311/203307 [23:39<2:15:01, 21.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30312/203307 [23:43<2:15:23, 21.30it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30312/203307 [23:43<2:15:23, 21.30it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30313/203307 [23:47<2:15:46, 21.23it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30313/203307 [23:47<2:15:46, 21.23it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30314/203307 [23:52<2:16:12, 21.17it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30314/203307 [23:52<2:16:12, 21.17it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30315/203307 [23:55<2:16:34, 21.11it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30315/203307 [23:55<2:16:34, 21.11it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30316/203307 [24:00<2:17:00, 21.04it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30316/203307 [24:00<2:17:00, 21.04it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30317/203307 [24:04<2:17:22, 20.99it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30317/203307 [24:04<2:17:22, 20.99it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30318/203307 [24:09<2:17:48, 20.92it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30318/203307 [24:09<2:17:48, 20.92it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30319/203307 [24:13<2:18:10, 20.87it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30319/203307 [24:13<2:18:10, 20.87it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30320/203307 [24:16<2:18:32, 20.81it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30320/203307 [24:16<2:18:32, 20.81it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30321/203307 [24:20<2:18:54, 20.75it/s, v_num=line, training/loss=0.0877]Epoch 0:  15%|█▍        | 30321/203307 [24:20<2:18:54, 20.75it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30322/203307 [24:24<2:19:17, 20.70it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30322/203307 [24:24<2:19:17, 20.70it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30323/203307 [24:29<2:19:42, 20.64it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30323/203307 [24:29<2:19:42, 20.64it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30324/203307 [24:33<2:20:04, 20.58it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30324/203307 [24:33<2:20:05, 20.58it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30325/203307 [24:38<2:20:31, 20.52it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30325/203307 [24:38<2:20:31, 20.52it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30326/203307 [24:42<2:20:54, 20.46it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30326/203307 [24:42<2:20:54, 20.46it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30327/203307 [24:46<2:21:19, 20.40it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30327/203307 [24:46<2:21:19, 20.40it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30328/203307 [24:50<2:21:41, 20.35it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30328/203307 [24:50<2:21:41, 20.35it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30329/203307 [24:54<2:22:03, 20.29it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30329/203307 [24:54<2:22:03, 20.29it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30330/203307 [24:58<2:22:26, 20.24it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30330/203307 [24:58<2:22:26, 20.24it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30331/203307 [25:03<2:22:52, 20.18it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30331/203307 [25:03<2:22:52, 20.18it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30332/203307 [25:06<2:23:13, 20.13it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30332/203307 [25:07<2:23:14, 20.13it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30333/203307 [25:10<2:23:35, 20.08it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30333/203307 [25:10<2:23:35, 20.08it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30334/203307 [25:15<2:24:03, 20.01it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30334/203307 [25:15<2:24:03, 20.01it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30335/203307 [25:19<2:24:24, 19.96it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30335/203307 [25:19<2:24:24, 19.96it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30336/203307 [25:23<2:24:49, 19.91it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30336/203307 [25:24<2:24:49, 19.91it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30337/203307 [25:27<2:25:11, 19.86it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30337/203307 [25:27<2:25:11, 19.86it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30338/203307 [25:31<2:25:33, 19.80it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30338/203307 [25:31<2:25:33, 19.80it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30339/203307 [25:35<2:25:56, 19.75it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30339/203307 [25:35<2:25:56, 19.75it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30340/203307 [25:40<2:26:20, 19.70it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30340/203307 [25:40<2:26:20, 19.70it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30341/203307 [25:44<2:26:43, 19.65it/s, v_num=line, training/loss=0.0833]Epoch 0:  15%|█▍        | 30341/203307 [25:44<2:26:43, 19.65it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30342/203307 [25:49<2:27:10, 19.59it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30342/203307 [25:49<2:27:10, 19.59it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30343/203307 [25:52<2:27:32, 19.54it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30343/203307 [25:52<2:27:32, 19.54it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30344/203307 [25:56<2:27:54, 19.49it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30344/203307 [25:56<2:27:54, 19.49it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30345/203307 [26:01<2:28:19, 19.43it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30345/203307 [26:01<2:28:19, 19.43it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30346/203307 [26:05<2:28:43, 19.38it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30346/203307 [26:05<2:28:43, 19.38it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30347/203307 [26:09<2:29:04, 19.34it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30347/203307 [26:09<2:29:04, 19.34it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30348/203307 [26:13<2:29:26, 19.29it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30348/203307 [26:13<2:29:26, 19.29it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30349/203307 [26:17<2:29:51, 19.23it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30349/203307 [26:17<2:29:51, 19.23it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30350/203307 [26:21<2:30:15, 19.18it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30350/203307 [26:21<2:30:15, 19.18it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30351/203307 [26:26<2:30:42, 19.13it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30351/203307 [26:26<2:30:42, 19.13it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30352/203307 [26:30<2:31:04, 19.08it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30352/203307 [26:30<2:31:04, 19.08it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30353/203307 [26:34<2:31:26, 19.03it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30353/203307 [26:34<2:31:26, 19.03it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30354/203307 [26:39<2:31:53, 18.98it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30354/203307 [26:39<2:31:53, 18.98it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30355/203307 [26:43<2:32:14, 18.93it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30355/203307 [26:43<2:32:14, 18.93it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30356/203307 [26:47<2:32:36, 18.89it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30356/203307 [26:47<2:32:36, 18.89it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30357/203307 [26:51<2:33:01, 18.84it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30357/203307 [26:51<2:33:01, 18.84it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30358/203307 [26:55<2:33:24, 18.79it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30358/203307 [26:55<2:33:24, 18.79it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30359/203307 [26:59<2:33:46, 18.74it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30359/203307 [26:59<2:33:46, 18.74it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30360/203307 [27:04<2:34:13, 18.69it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30360/203307 [27:04<2:34:13, 18.69it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30361/203307 [27:08<2:34:35, 18.65it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30361/203307 [27:08<2:34:35, 18.65it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30362/203307 [27:12<2:34:58, 18.60it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30362/203307 [27:12<2:34:58, 18.60it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30363/203307 [27:16<2:35:23, 18.55it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30363/203307 [27:16<2:35:23, 18.55it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30364/203307 [27:20<2:35:45, 18.51it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30364/203307 [27:20<2:35:45, 18.51it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30365/203307 [27:24<2:36:07, 18.46it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30365/203307 [27:24<2:36:07, 18.46it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30366/203307 [27:29<2:36:34, 18.41it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30366/203307 [27:29<2:36:34, 18.41it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30367/203307 [27:33<2:36:56, 18.37it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30367/203307 [27:33<2:36:56, 18.37it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30368/203307 [27:38<2:37:23, 18.31it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30368/203307 [27:38<2:37:23, 18.31it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30369/203307 [27:42<2:37:44, 18.27it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30369/203307 [27:42<2:37:45, 18.27it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30370/203307 [27:46<2:38:07, 18.23it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30370/203307 [27:46<2:38:07, 18.23it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30371/203307 [27:49<2:38:29, 18.19it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30371/203307 [27:50<2:38:29, 18.19it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30372/203307 [27:54<2:38:54, 18.14it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30372/203307 [27:54<2:38:54, 18.14it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30373/203307 [27:58<2:39:16, 18.10it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30373/203307 [27:58<2:39:16, 18.10it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30374/203307 [28:02<2:39:39, 18.05it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30374/203307 [28:02<2:39:39, 18.05it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30375/203307 [28:07<2:40:04, 18.00it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30375/203307 [28:07<2:40:05, 18.00it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30376/203307 [28:10<2:40:26, 17.96it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30376/203307 [28:10<2:40:26, 17.96it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30377/203307 [28:15<2:40:53, 17.91it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30377/203307 [28:15<2:40:53, 17.91it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30378/203307 [28:19<2:41:15, 17.87it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30378/203307 [28:19<2:41:16, 17.87it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30379/203307 [28:23<2:41:37, 17.83it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30379/203307 [28:23<2:41:38, 17.83it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30380/203307 [28:27<2:42:00, 17.79it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30380/203307 [28:27<2:42:00, 17.79it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30381/203307 [28:32<2:42:25, 17.74it/s, v_num=line, training/loss=0.0813]Epoch 0:  15%|█▍        | 30381/203307 [28:32<2:42:25, 17.74it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30382/203307 [28:36<2:42:48, 17.70it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30382/203307 [28:36<2:42:48, 17.70it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30383/203307 [28:40<2:43:14, 17.66it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30383/203307 [28:40<2:43:14, 17.66it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30384/203307 [28:44<2:43:36, 17.62it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30384/203307 [28:44<2:43:36, 17.62it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30385/203307 [28:48<2:43:58, 17.58it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30385/203307 [28:48<2:43:58, 17.58it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30386/203307 [28:53<2:44:25, 17.53it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30386/203307 [28:53<2:44:25, 17.53it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30387/203307 [28:57<2:44:47, 17.49it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30387/203307 [28:57<2:44:47, 17.49it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30388/203307 [29:01<2:45:09, 17.45it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30388/203307 [29:01<2:45:09, 17.45it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30389/203307 [29:05<2:45:30, 17.41it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30389/203307 [29:05<2:45:31, 17.41it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30390/203307 [29:09<2:45:57, 17.37it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30390/203307 [29:10<2:45:57, 17.37it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30391/203307 [29:13<2:46:18, 17.33it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30391/203307 [29:13<2:46:19, 17.33it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30392/203307 [29:18<2:46:43, 17.29it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30392/203307 [29:18<2:46:43, 17.29it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30393/203307 [29:22<2:47:05, 17.25it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30393/203307 [29:22<2:47:05, 17.25it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30394/203307 [29:27<2:47:33, 17.20it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30394/203307 [29:27<2:47:33, 17.20it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30395/203307 [29:31<2:47:55, 17.16it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30395/203307 [29:31<2:47:55, 17.16it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30396/203307 [29:34<2:48:17, 17.12it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30396/203307 [29:34<2:48:17, 17.12it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30397/203307 [29:38<2:48:38, 17.09it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30397/203307 [29:38<2:48:39, 17.09it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30398/203307 [29:42<2:49:01, 17.05it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30398/203307 [29:42<2:49:01, 17.05it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30399/203307 [29:47<2:49:26, 17.01it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30399/203307 [29:47<2:49:26, 17.01it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30400/203307 [29:51<2:49:49, 16.97it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30400/203307 [29:51<2:49:49, 16.97it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30401/203307 [29:55<2:50:13, 16.93it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▍        | 30401/203307 [29:55<2:50:13, 16.93it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30402/203307 [29:59<2:50:36, 16.89it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30402/203307 [29:59<2:50:36, 16.89it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30403/203307 [30:04<2:51:03, 16.85it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30403/203307 [30:04<2:51:03, 16.85it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30404/203307 [30:08<2:51:25, 16.81it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30404/203307 [30:08<2:51:25, 16.81it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30405/203307 [30:12<2:51:47, 16.77it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30405/203307 [30:12<2:51:47, 16.77it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30406/203307 [30:16<2:52:10, 16.74it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30406/203307 [30:16<2:52:10, 16.74it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30407/203307 [30:20<2:52:32, 16.70it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30407/203307 [30:20<2:52:32, 16.70it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30408/203307 [30:24<2:52:56, 16.66it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30408/203307 [30:24<2:52:56, 16.66it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30409/203307 [30:29<2:53:21, 16.62it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30409/203307 [30:29<2:53:21, 16.62it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30410/203307 [30:33<2:53:43, 16.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30410/203307 [30:33<2:53:43, 16.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30411/203307 [30:37<2:54:05, 16.55it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30411/203307 [30:37<2:54:05, 16.55it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30412/203307 [30:42<2:54:32, 16.51it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30412/203307 [30:42<2:54:32, 16.51it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30413/203307 [30:46<2:54:54, 16.47it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30413/203307 [30:46<2:54:54, 16.47it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30414/203307 [30:50<2:55:17, 16.44it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30414/203307 [30:50<2:55:17, 16.44it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30415/203307 [30:54<2:55:39, 16.40it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30415/203307 [30:54<2:55:39, 16.40it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30416/203307 [30:57<2:56:01, 16.37it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30416/203307 [30:57<2:56:01, 16.37it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30417/203307 [31:02<2:56:25, 16.33it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30417/203307 [31:02<2:56:25, 16.33it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30418/203307 [31:07<2:56:52, 16.29it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30418/203307 [31:07<2:56:52, 16.29it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30419/203307 [31:10<2:57:13, 16.26it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30419/203307 [31:11<2:57:13, 16.26it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30420/203307 [31:15<2:57:40, 16.22it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30420/203307 [31:15<2:57:40, 16.22it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30421/203307 [31:19<2:58:03, 16.18it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30421/203307 [31:19<2:58:03, 16.18it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30422/203307 [31:23<2:58:25, 16.15it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30422/203307 [31:23<2:58:25, 16.15it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30423/203307 [31:27<2:58:48, 16.11it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30423/203307 [31:27<2:58:48, 16.11it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30424/203307 [31:31<2:59:10, 16.08it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30424/203307 [31:31<2:59:10, 16.08it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30425/203307 [31:35<2:59:31, 16.05it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30425/203307 [31:35<2:59:31, 16.05it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30426/203307 [31:40<2:59:58, 16.01it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30426/203307 [31:40<2:59:58, 16.01it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30427/203307 [31:45<3:00:24, 15.97it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30427/203307 [31:45<3:00:24, 15.97it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30428/203307 [31:49<3:00:47, 15.94it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30428/203307 [31:49<3:00:47, 15.94it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30429/203307 [31:53<3:01:14, 15.90it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30429/203307 [31:54<3:01:14, 15.90it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30430/203307 [31:58<3:01:37, 15.86it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30430/203307 [31:58<3:01:37, 15.86it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30431/203307 [32:02<3:01:59, 15.83it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30431/203307 [32:02<3:01:59, 15.83it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30432/203307 [32:06<3:02:21, 15.80it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30432/203307 [32:06<3:02:21, 15.80it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30433/203307 [32:10<3:02:43, 15.77it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30433/203307 [32:10<3:02:43, 15.77it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30434/203307 [32:14<3:03:06, 15.73it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30434/203307 [32:14<3:03:06, 15.73it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30435/203307 [32:18<3:03:32, 15.70it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30435/203307 [32:18<3:03:32, 15.70it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30436/203307 [32:22<3:03:54, 15.67it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30436/203307 [32:22<3:03:54, 15.67it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30437/203307 [32:26<3:04:16, 15.64it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30437/203307 [32:26<3:04:16, 15.64it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30438/203307 [32:31<3:04:44, 15.60it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30438/203307 [32:31<3:04:44, 15.60it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30439/203307 [32:35<3:05:05, 15.57it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30439/203307 [32:35<3:05:05, 15.57it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30440/203307 [32:39<3:05:27, 15.53it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30440/203307 [32:39<3:05:27, 15.53it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30441/203307 [32:43<3:05:50, 15.50it/s, v_num=line, training/loss=0.0892]Epoch 0:  15%|█▍        | 30441/203307 [32:43<3:05:50, 15.50it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30442/203307 [32:47<3:06:12, 15.47it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30442/203307 [32:47<3:06:12, 15.47it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30443/203307 [32:51<3:06:34, 15.44it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30443/203307 [32:51<3:06:34, 15.44it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30444/203307 [32:55<3:06:59, 15.41it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30444/203307 [32:55<3:06:59, 15.41it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30445/203307 [32:59<3:07:20, 15.38it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30445/203307 [32:59<3:07:20, 15.38it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30446/203307 [33:04<3:07:48, 15.34it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30446/203307 [33:04<3:07:48, 15.34it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30447/203307 [33:08<3:08:10, 15.31it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30447/203307 [33:08<3:08:10, 15.31it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30448/203307 [33:12<3:08:32, 15.28it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30448/203307 [33:12<3:08:32, 15.28it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30449/203307 [33:16<3:08:53, 15.25it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30449/203307 [33:16<3:08:53, 15.25it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30450/203307 [33:20<3:09:16, 15.22it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30450/203307 [33:20<3:09:16, 15.22it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30451/203307 [33:24<3:09:38, 15.19it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30451/203307 [33:24<3:09:38, 15.19it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30452/203307 [33:28<3:10:00, 15.16it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30452/203307 [33:28<3:10:00, 15.16it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30453/203307 [33:32<3:10:25, 15.13it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30453/203307 [33:32<3:10:25, 15.13it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30454/203307 [33:37<3:10:48, 15.10it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30454/203307 [33:37<3:10:48, 15.10it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30455/203307 [33:41<3:11:15, 15.06it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30455/203307 [33:41<3:11:15, 15.06it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30456/203307 [33:45<3:11:37, 15.03it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30456/203307 [33:45<3:11:37, 15.03it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30457/203307 [33:49<3:11:59, 15.00it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30457/203307 [33:49<3:11:59, 15.00it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30458/203307 [33:53<3:12:22, 14.97it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30458/203307 [33:53<3:12:22, 14.97it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30459/203307 [33:58<3:12:45, 14.95it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30459/203307 [33:58<3:12:45, 14.95it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30460/203307 [34:01<3:13:07, 14.92it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30460/203307 [34:01<3:13:07, 14.92it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30461/203307 [34:06<3:13:32, 14.88it/s, v_num=line, training/loss=0.0828]Epoch 0:  15%|█▍        | 30461/203307 [34:06<3:13:32, 14.88it/s, v_num=line, training/loss=0.085] Epoch 0:  15%|█▍        | 30462/203307 [34:11<3:13:58, 14.85it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30462/203307 [34:11<3:13:58, 14.85it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30463/203307 [34:14<3:14:19, 14.82it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30463/203307 [34:15<3:14:19, 14.82it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30464/203307 [34:19<3:14:46, 14.79it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30464/203307 [34:19<3:14:46, 14.79it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30465/203307 [34:23<3:15:08, 14.76it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30465/203307 [34:23<3:15:08, 14.76it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30466/203307 [34:27<3:15:31, 14.73it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30466/203307 [34:27<3:15:31, 14.73it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30467/203307 [34:31<3:15:53, 14.71it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30467/203307 [34:31<3:15:53, 14.71it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30468/203307 [34:35<3:16:16, 14.68it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30468/203307 [34:35<3:16:16, 14.68it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30469/203307 [34:39<3:16:38, 14.65it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30469/203307 [34:39<3:16:38, 14.65it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30470/203307 [34:44<3:17:04, 14.62it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30470/203307 [34:44<3:17:05, 14.62it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30471/203307 [34:48<3:17:28, 14.59it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30471/203307 [34:48<3:17:28, 14.59it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30472/203307 [34:53<3:17:54, 14.55it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30472/203307 [34:53<3:17:54, 14.55it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30473/203307 [34:57<3:18:16, 14.53it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30473/203307 [34:57<3:18:16, 14.53it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30474/203307 [35:01<3:18:39, 14.50it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30474/203307 [35:01<3:18:39, 14.50it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30475/203307 [35:05<3:19:01, 14.47it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30475/203307 [35:05<3:19:01, 14.47it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30476/203307 [35:09<3:19:24, 14.45it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30476/203307 [35:09<3:19:24, 14.45it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30477/203307 [35:13<3:19:46, 14.42it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30477/203307 [35:13<3:19:46, 14.42it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30478/203307 [35:17<3:20:09, 14.39it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30478/203307 [35:17<3:20:09, 14.39it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30479/203307 [35:22<3:20:34, 14.36it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30479/203307 [35:22<3:20:34, 14.36it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30480/203307 [35:26<3:20:58, 14.33it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30480/203307 [35:26<3:20:58, 14.33it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30481/203307 [35:31<3:21:24, 14.30it/s, v_num=line, training/loss=0.085]Epoch 0:  15%|█▍        | 30481/203307 [35:31<3:21:25, 14.30it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▍        | 30482/203307 [35:35<3:21:48, 14.27it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▍        | 30482/203307 [35:35<3:21:48, 14.27it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▍        | 30483/203307 [35:39<3:22:10, 14.25it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▍        | 30483/203307 [35:39<3:22:10, 14.25it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▍        | 30484/203307 [35:43<3:22:32, 14.22it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▍        | 30484/203307 [35:43<3:22:32, 14.22it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▍        | 30485/203307 [35:47<3:22:53, 14.20it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▍        | 30485/203307 [35:47<3:22:53, 14.20it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▍        | 30486/203307 [35:51<3:23:16, 14.17it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▍        | 30486/203307 [35:51<3:23:16, 14.17it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▍        | 30487/203307 [35:55<3:23:41, 14.14it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▍        | 30487/203307 [35:55<3:23:41, 14.14it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▍        | 30488/203307 [35:59<3:24:02, 14.12it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▍        | 30488/203307 [35:59<3:24:02, 14.12it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▍        | 30489/203307 [36:04<3:24:27, 14.09it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▍        | 30489/203307 [36:04<3:24:27, 14.09it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▍        | 30490/203307 [36:09<3:24:55, 14.06it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▍        | 30490/203307 [36:09<3:24:55, 14.06it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▍        | 30491/203307 [36:13<3:25:17, 14.03it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▍        | 30491/203307 [36:13<3:25:17, 14.03it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▍        | 30492/203307 [36:17<3:25:38, 14.01it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▍        | 30492/203307 [36:17<3:25:38, 14.01it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▍        | 30493/203307 [36:20<3:26:00, 13.98it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▍        | 30493/203307 [36:20<3:26:00, 13.98it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▍        | 30494/203307 [36:25<3:26:22, 13.96it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▍        | 30494/203307 [36:25<3:26:22, 13.96it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▍        | 30495/203307 [36:29<3:26:45, 13.93it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▍        | 30495/203307 [36:29<3:26:45, 13.93it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▍        | 30496/203307 [36:33<3:27:10, 13.90it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▍        | 30496/203307 [36:33<3:27:10, 13.90it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▌        | 30497/203307 [36:37<3:27:31, 13.88it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▌        | 30497/203307 [36:37<3:27:31, 13.88it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▌        | 30498/203307 [36:42<3:27:58, 13.85it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▌        | 30498/203307 [36:42<3:27:58, 13.85it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▌        | 30499/203307 [36:46<3:28:20, 13.82it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▌        | 30499/203307 [36:46<3:28:20, 13.82it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▌        | 30500/203307 [36:50<3:28:41, 13.80it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▌        | 30500/203307 [36:50<3:28:41, 13.80it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▌        | 30501/203307 [36:53<3:29:03, 13.78it/s, v_num=line, training/loss=0.0915]Epoch 0:  15%|█▌        | 30501/203307 [36:54<3:29:03, 13.78it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30502/203307 [36:58<3:29:26, 13.75it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30502/203307 [36:58<3:29:26, 13.75it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30503/203307 [37:02<3:29:48, 13.73it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30503/203307 [37:02<3:29:48, 13.73it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30504/203307 [37:06<3:30:10, 13.70it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30504/203307 [37:06<3:30:10, 13.70it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30505/203307 [37:10<3:30:35, 13.68it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30505/203307 [37:10<3:30:35, 13.68it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30506/203307 [37:14<3:30:57, 13.65it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30506/203307 [37:14<3:30:58, 13.65it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30507/203307 [37:19<3:31:24, 13.62it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30507/203307 [37:19<3:31:24, 13.62it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30508/203307 [37:23<3:31:45, 13.60it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30508/203307 [37:23<3:31:46, 13.60it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30509/203307 [37:27<3:32:07, 13.58it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30509/203307 [37:27<3:32:07, 13.58it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30510/203307 [37:31<3:32:29, 13.55it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30510/203307 [37:31<3:32:29, 13.55it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30511/203307 [37:35<3:32:51, 13.53it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30511/203307 [37:35<3:32:51, 13.53it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30512/203307 [37:39<3:33:14, 13.51it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30512/203307 [37:39<3:33:14, 13.51it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30513/203307 [37:43<3:33:39, 13.48it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30513/203307 [37:43<3:33:39, 13.48it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30514/203307 [37:47<3:34:01, 13.46it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30514/203307 [37:47<3:34:01, 13.46it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30515/203307 [37:51<3:34:22, 13.43it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30515/203307 [37:51<3:34:22, 13.43it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30516/203307 [37:56<3:34:50, 13.40it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30516/203307 [37:56<3:34:50, 13.40it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30517/203307 [38:00<3:35:12, 13.38it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30517/203307 [38:00<3:35:12, 13.38it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30518/203307 [38:04<3:35:34, 13.36it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30518/203307 [38:04<3:35:34, 13.36it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30519/203307 [38:08<3:35:56, 13.34it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30519/203307 [38:08<3:35:56, 13.34it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30520/203307 [38:12<3:36:18, 13.31it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30520/203307 [38:12<3:36:19, 13.31it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30521/203307 [38:16<3:36:41, 13.29it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30521/203307 [38:16<3:36:41, 13.29it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30522/203307 [38:21<3:37:07, 13.26it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30522/203307 [38:21<3:37:08, 13.26it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30523/203307 [38:25<3:37:29, 13.24it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30523/203307 [38:25<3:37:29, 13.24it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30524/203307 [38:29<3:37:55, 13.21it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30524/203307 [38:29<3:37:55, 13.21it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30525/203307 [38:34<3:38:20, 13.19it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30525/203307 [38:34<3:38:20, 13.19it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30526/203307 [38:38<3:38:42, 13.17it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30526/203307 [38:38<3:38:42, 13.17it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30527/203307 [38:42<3:39:04, 13.14it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30527/203307 [38:42<3:39:04, 13.14it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30528/203307 [38:46<3:39:26, 13.12it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30528/203307 [38:46<3:39:26, 13.12it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30529/203307 [38:50<3:39:48, 13.10it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30529/203307 [38:50<3:39:48, 13.10it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30530/203307 [38:54<3:40:10, 13.08it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30530/203307 [38:54<3:40:10, 13.08it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30531/203307 [38:58<3:40:35, 13.05it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30531/203307 [38:58<3:40:35, 13.05it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30532/203307 [39:02<3:40:57, 13.03it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30532/203307 [39:02<3:40:57, 13.03it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30533/203307 [39:07<3:41:24, 13.01it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30533/203307 [39:07<3:41:24, 13.01it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30534/203307 [39:12<3:41:50, 12.98it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30534/203307 [39:12<3:41:50, 12.98it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30535/203307 [39:16<3:42:11, 12.96it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30535/203307 [39:16<3:42:11, 12.96it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30536/203307 [39:20<3:42:34, 12.94it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30536/203307 [39:20<3:42:34, 12.94it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30537/203307 [39:24<3:42:55, 12.92it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30537/203307 [39:24<3:42:56, 12.92it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30538/203307 [39:28<3:43:18, 12.89it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30538/203307 [39:28<3:43:18, 12.89it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30539/203307 [39:32<3:43:43, 12.87it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30539/203307 [39:32<3:43:43, 12.87it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30540/203307 [39:36<3:44:04, 12.85it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30540/203307 [39:36<3:44:04, 12.85it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30541/203307 [39:40<3:44:25, 12.83it/s, v_num=line, training/loss=0.0752]Epoch 0:  15%|█▌        | 30541/203307 [39:40<3:44:26, 12.83it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30542/203307 [39:45<3:44:53, 12.80it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30542/203307 [39:45<3:44:53, 12.80it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30543/203307 [39:49<3:45:18, 12.78it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30543/203307 [39:49<3:45:18, 12.78it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30544/203307 [39:53<3:45:40, 12.76it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30544/203307 [39:53<3:45:40, 12.76it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30545/203307 [39:57<3:46:02, 12.74it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30545/203307 [39:57<3:46:02, 12.74it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30546/203307 [40:01<3:46:24, 12.72it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30546/203307 [40:01<3:46:24, 12.72it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30547/203307 [40:05<3:46:46, 12.70it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30547/203307 [40:05<3:46:46, 12.70it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30548/203307 [40:10<3:47:10, 12.67it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30548/203307 [40:10<3:47:10, 12.67it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30549/203307 [40:14<3:47:32, 12.65it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30549/203307 [40:14<3:47:32, 12.65it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30550/203307 [40:18<3:47:58, 12.63it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30550/203307 [40:18<3:47:58, 12.63it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30551/203307 [40:22<3:48:20, 12.61it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30551/203307 [40:22<3:48:20, 12.61it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30552/203307 [40:27<3:48:44, 12.59it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30552/203307 [40:27<3:48:44, 12.59it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30553/203307 [40:31<3:49:05, 12.57it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30553/203307 [40:31<3:49:05, 12.57it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30554/203307 [40:35<3:49:27, 12.55it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30554/203307 [40:35<3:49:27, 12.55it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30555/203307 [40:38<3:49:48, 12.53it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30555/203307 [40:38<3:49:49, 12.53it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30556/203307 [40:42<3:50:10, 12.51it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30556/203307 [40:42<3:50:10, 12.51it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30557/203307 [40:47<3:50:36, 12.49it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30557/203307 [40:47<3:50:36, 12.49it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30558/203307 [40:51<3:50:58, 12.47it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30558/203307 [40:51<3:50:58, 12.47it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30559/203307 [40:56<3:51:24, 12.44it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30559/203307 [40:56<3:51:24, 12.44it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30560/203307 [41:00<3:51:45, 12.42it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30560/203307 [41:00<3:51:45, 12.42it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30561/203307 [41:04<3:52:09, 12.40it/s, v_num=line, training/loss=0.0887]Epoch 0:  15%|█▌        | 30561/203307 [41:04<3:52:09, 12.40it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30562/203307 [41:08<3:52:30, 12.38it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30562/203307 [41:08<3:52:31, 12.38it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30563/203307 [41:12<3:52:52, 12.36it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30563/203307 [41:12<3:52:52, 12.36it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30564/203307 [41:15<3:53:13, 12.34it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30564/203307 [41:15<3:53:13, 12.34it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30565/203307 [41:20<3:53:38, 12.32it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30565/203307 [41:20<3:53:38, 12.32it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30566/203307 [41:24<3:53:59, 12.30it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30566/203307 [41:24<3:53:59, 12.30it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30567/203307 [41:28<3:54:20, 12.29it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30567/203307 [41:28<3:54:21, 12.29it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30568/203307 [41:32<3:54:47, 12.26it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30568/203307 [41:32<3:54:47, 12.26it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30569/203307 [41:36<3:55:08, 12.24it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30569/203307 [41:36<3:55:08, 12.24it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30570/203307 [41:41<3:55:33, 12.22it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30570/203307 [41:41<3:55:33, 12.22it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30571/203307 [41:45<3:55:54, 12.20it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30571/203307 [41:45<3:55:54, 12.20it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30572/203307 [41:49<3:56:16, 12.18it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30572/203307 [41:49<3:56:16, 12.18it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30573/203307 [41:52<3:56:37, 12.17it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30573/203307 [41:52<3:56:37, 12.17it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30574/203307 [41:57<3:57:03, 12.14it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30574/203307 [41:57<3:57:03, 12.14it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30575/203307 [42:01<3:57:24, 12.13it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30575/203307 [42:01<3:57:24, 12.13it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30576/203307 [42:06<3:57:50, 12.10it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30576/203307 [42:06<3:57:50, 12.10it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30577/203307 [42:09<3:58:11, 12.09it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30577/203307 [42:09<3:58:11, 12.09it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30578/203307 [42:13<3:58:33, 12.07it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30578/203307 [42:13<3:58:33, 12.07it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30579/203307 [42:18<3:58:57, 12.05it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30579/203307 [42:18<3:58:57, 12.05it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30580/203307 [42:22<3:59:18, 12.03it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30580/203307 [42:22<3:59:18, 12.03it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30581/203307 [42:25<3:59:39, 12.01it/s, v_num=line, training/loss=0.0883]Epoch 0:  15%|█▌        | 30581/203307 [42:25<3:59:39, 12.01it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30582/203307 [42:29<4:00:01, 11.99it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30582/203307 [42:29<4:00:01, 11.99it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30583/203307 [42:34<4:00:26, 11.97it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30583/203307 [42:34<4:00:26, 11.97it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30584/203307 [42:38<4:00:47, 11.95it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30584/203307 [42:38<4:00:47, 11.95it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30585/203307 [42:42<4:01:13, 11.93it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30585/203307 [42:43<4:01:13, 11.93it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30586/203307 [42:46<4:01:35, 11.92it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30586/203307 [42:46<4:01:35, 11.92it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30587/203307 [42:50<4:01:56, 11.90it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30587/203307 [42:50<4:01:56, 11.90it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30588/203307 [42:55<4:02:20, 11.88it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30588/203307 [42:55<4:02:20, 11.88it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30589/203307 [42:59<4:02:42, 11.86it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30589/203307 [42:59<4:02:42, 11.86it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30590/203307 [43:02<4:03:03, 11.84it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30590/203307 [43:02<4:03:03, 11.84it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30591/203307 [43:07<4:03:28, 11.82it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30591/203307 [43:07<4:03:28, 11.82it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30592/203307 [43:11<4:03:50, 11.81it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30592/203307 [43:11<4:03:50, 11.81it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30593/203307 [43:15<4:04:11, 11.79it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30593/203307 [43:15<4:04:11, 11.79it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30594/203307 [43:19<4:04:37, 11.77it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30594/203307 [43:19<4:04:37, 11.77it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30595/203307 [43:23<4:04:59, 11.75it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30595/203307 [43:23<4:04:59, 11.75it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30596/203307 [43:27<4:05:20, 11.73it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30596/203307 [43:27<4:05:20, 11.73it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30597/203307 [43:32<4:05:44, 11.71it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30597/203307 [43:32<4:05:44, 11.71it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30598/203307 [43:36<4:06:06, 11.70it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30598/203307 [43:36<4:06:06, 11.70it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30599/203307 [43:40<4:06:28, 11.68it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30599/203307 [43:40<4:06:28, 11.68it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30600/203307 [43:44<4:06:53, 11.66it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30600/203307 [43:44<4:06:53, 11.66it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30601/203307 [43:48<4:07:14, 11.64it/s, v_num=line, training/loss=0.0763]Epoch 0:  15%|█▌        | 30601/203307 [43:48<4:07:14, 11.64it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30602/203307 [43:53<4:07:41, 11.62it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30602/203307 [43:53<4:07:41, 11.62it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30603/203307 [43:57<4:08:02, 11.60it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30603/203307 [43:57<4:08:02, 11.60it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30604/203307 [44:01<4:08:24, 11.59it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30604/203307 [44:01<4:08:24, 11.59it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30605/203307 [44:05<4:08:46, 11.57it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30605/203307 [44:05<4:08:46, 11.57it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30606/203307 [44:09<4:09:11, 11.55it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30606/203307 [44:09<4:09:11, 11.55it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30607/203307 [44:13<4:09:32, 11.53it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30607/203307 [44:13<4:09:32, 11.53it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30608/203307 [44:17<4:09:54, 11.52it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30608/203307 [44:17<4:09:54, 11.52it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30609/203307 [44:21<4:10:18, 11.50it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30609/203307 [44:21<4:10:18, 11.50it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30610/203307 [44:25<4:10:40, 11.48it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30610/203307 [44:25<4:10:40, 11.48it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30611/203307 [44:30<4:11:06, 11.46it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30611/203307 [44:30<4:11:06, 11.46it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30612/203307 [44:34<4:11:28, 11.45it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30612/203307 [44:34<4:11:28, 11.45it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30613/203307 [44:38<4:11:49, 11.43it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30613/203307 [44:38<4:11:49, 11.43it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30614/203307 [44:42<4:12:11, 11.41it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30614/203307 [44:42<4:12:11, 11.41it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30615/203307 [44:46<4:12:36, 11.39it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30615/203307 [44:46<4:12:36, 11.39it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30616/203307 [44:50<4:12:57, 11.38it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30616/203307 [44:50<4:12:57, 11.38it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30617/203307 [44:55<4:13:22, 11.36it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30617/203307 [44:55<4:13:22, 11.36it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30618/203307 [44:59<4:13:44, 11.34it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30618/203307 [44:59<4:13:44, 11.34it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30619/203307 [45:03<4:14:05, 11.33it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30619/203307 [45:03<4:14:05, 11.33it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30620/203307 [45:07<4:14:31, 11.31it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30620/203307 [45:07<4:14:31, 11.31it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30621/203307 [45:11<4:14:53, 11.29it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 30621/203307 [45:11<4:14:53, 11.29it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30622/203307 [45:15<4:15:15, 11.27it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30622/203307 [45:15<4:15:15, 11.27it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30623/203307 [45:19<4:15:38, 11.26it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30623/203307 [45:19<4:15:38, 11.26it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30624/203307 [45:24<4:16:02, 11.24it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30624/203307 [45:24<4:16:02, 11.24it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30625/203307 [45:28<4:16:24, 11.22it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30625/203307 [45:28<4:16:24, 11.22it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30626/203307 [45:33<4:16:49, 11.21it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30626/203307 [45:33<4:16:49, 11.21it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30627/203307 [45:36<4:17:11, 11.19it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30627/203307 [45:36<4:17:11, 11.19it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30628/203307 [45:41<4:17:37, 11.17it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30628/203307 [45:41<4:17:37, 11.17it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30629/203307 [45:45<4:17:58, 11.16it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30629/203307 [45:45<4:17:58, 11.16it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30630/203307 [45:49<4:18:19, 11.14it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30630/203307 [45:49<4:18:19, 11.14it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30631/203307 [45:53<4:18:41, 11.13it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30631/203307 [45:53<4:18:41, 11.13it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30632/203307 [45:57<4:19:01, 11.11it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30632/203307 [45:57<4:19:01, 11.11it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30633/203307 [46:01<4:19:26, 11.09it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30633/203307 [46:01<4:19:26, 11.09it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30634/203307 [46:05<4:19:49, 11.08it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30634/203307 [46:05<4:19:49, 11.08it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30635/203307 [46:10<4:20:14, 11.06it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30635/203307 [46:10<4:20:14, 11.06it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30636/203307 [46:14<4:20:35, 11.04it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30636/203307 [46:14<4:20:35, 11.04it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30637/203307 [46:19<4:21:02, 11.02it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30637/203307 [46:19<4:21:02, 11.02it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30638/203307 [46:22<4:21:24, 11.01it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30638/203307 [46:22<4:21:24, 11.01it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30639/203307 [46:26<4:21:45, 10.99it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30639/203307 [46:26<4:21:45, 10.99it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30640/203307 [46:30<4:22:07, 10.98it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30640/203307 [46:30<4:22:07, 10.98it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30641/203307 [46:34<4:22:29, 10.96it/s, v_num=line, training/loss=0.0859]Epoch 0:  15%|█▌        | 30641/203307 [46:34<4:22:29, 10.96it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30642/203307 [46:39<4:22:54, 10.95it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30642/203307 [46:39<4:22:54, 10.95it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30643/203307 [46:43<4:23:19, 10.93it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30643/203307 [46:43<4:23:19, 10.93it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30644/203307 [46:47<4:23:40, 10.91it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30644/203307 [46:47<4:23:40, 10.91it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30645/203307 [46:51<4:24:01, 10.90it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30645/203307 [46:51<4:24:01, 10.90it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30646/203307 [46:56<4:24:28, 10.88it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30646/203307 [46:56<4:24:28, 10.88it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30647/203307 [47:00<4:24:50, 10.87it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30647/203307 [47:00<4:24:50, 10.87it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30648/203307 [47:04<4:25:11, 10.85it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30648/203307 [47:04<4:25:11, 10.85it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30649/203307 [47:08<4:25:33, 10.84it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30649/203307 [47:08<4:25:33, 10.84it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30650/203307 [47:12<4:25:54, 10.82it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30650/203307 [47:12<4:25:54, 10.82it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30651/203307 [47:16<4:26:19, 10.80it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30651/203307 [47:16<4:26:19, 10.80it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30652/203307 [47:21<4:26:44, 10.79it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30652/203307 [47:21<4:26:44, 10.79it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30653/203307 [47:25<4:27:05, 10.77it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30653/203307 [47:25<4:27:05, 10.77it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30654/203307 [47:29<4:27:31, 10.76it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30654/203307 [47:29<4:27:32, 10.76it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30655/203307 [47:33<4:27:53, 10.74it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30655/203307 [47:33<4:27:53, 10.74it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30656/203307 [47:37<4:28:14, 10.73it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30656/203307 [47:37<4:28:14, 10.73it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30657/203307 [47:41<4:28:36, 10.71it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30657/203307 [47:41<4:28:36, 10.71it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30658/203307 [47:45<4:28:58, 10.70it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30658/203307 [47:45<4:28:58, 10.70it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30659/203307 [47:49<4:29:19, 10.68it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30659/203307 [47:49<4:29:19, 10.68it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30660/203307 [47:54<4:29:44, 10.67it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30660/203307 [47:54<4:29:44, 10.67it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30661/203307 [47:58<4:30:08, 10.65it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30661/203307 [47:58<4:30:08, 10.65it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30662/203307 [48:02<4:30:30, 10.64it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30662/203307 [48:02<4:30:30, 10.64it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30663/203307 [48:07<4:30:56, 10.62it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30663/203307 [48:07<4:30:56, 10.62it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30664/203307 [48:11<4:31:18, 10.61it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30664/203307 [48:11<4:31:18, 10.61it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30665/203307 [48:15<4:31:39, 10.59it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30665/203307 [48:15<4:31:39, 10.59it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30666/203307 [48:19<4:32:01, 10.58it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30666/203307 [48:19<4:32:01, 10.58it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30667/203307 [48:23<4:32:23, 10.56it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30667/203307 [48:23<4:32:23, 10.56it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30668/203307 [48:26<4:32:44, 10.55it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30668/203307 [48:26<4:32:44, 10.55it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30669/203307 [48:31<4:33:09, 10.53it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30669/203307 [48:31<4:33:09, 10.53it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30670/203307 [48:35<4:33:31, 10.52it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30670/203307 [48:35<4:33:31, 10.52it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30671/203307 [48:39<4:33:52, 10.51it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30671/203307 [48:39<4:33:52, 10.51it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30672/203307 [48:44<4:34:18, 10.49it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30672/203307 [48:44<4:34:18, 10.49it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30673/203307 [48:48<4:34:40, 10.47it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30673/203307 [48:48<4:34:41, 10.47it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30674/203307 [48:52<4:35:02, 10.46it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30674/203307 [48:52<4:35:02, 10.46it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30675/203307 [48:56<4:35:23, 10.45it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30675/203307 [48:56<4:35:23, 10.45it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30676/203307 [48:59<4:35:44, 10.43it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30676/203307 [48:59<4:35:44, 10.43it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30677/203307 [49:03<4:36:06, 10.42it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30677/203307 [49:03<4:36:06, 10.42it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30678/203307 [49:08<4:36:31, 10.40it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30678/203307 [49:08<4:36:31, 10.40it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30679/203307 [49:12<4:36:52, 10.39it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30679/203307 [49:12<4:36:52, 10.39it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30680/203307 [49:17<4:37:18, 10.38it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30680/203307 [49:17<4:37:18, 10.38it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30681/203307 [49:20<4:37:39, 10.36it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 30681/203307 [49:20<4:37:39, 10.36it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30682/203307 [49:24<4:38:00, 10.35it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30682/203307 [49:24<4:38:01, 10.35it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30683/203307 [49:28<4:38:22, 10.34it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30683/203307 [49:28<4:38:22, 10.34it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30684/203307 [49:32<4:38:43, 10.32it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30684/203307 [49:32<4:38:43, 10.32it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30685/203307 [49:36<4:39:05, 10.31it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30685/203307 [49:36<4:39:05, 10.31it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30686/203307 [49:40<4:39:26, 10.30it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30686/203307 [49:40<4:39:26, 10.30it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30687/203307 [49:45<4:39:51, 10.28it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30687/203307 [49:45<4:39:51, 10.28it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30688/203307 [49:48<4:40:12, 10.27it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30688/203307 [49:48<4:40:12, 10.27it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30689/203307 [49:53<4:40:38, 10.25it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30689/203307 [49:53<4:40:38, 10.25it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30690/203307 [49:57<4:40:59, 10.24it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30690/203307 [49:57<4:40:59, 10.24it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30691/203307 [50:01<4:41:21, 10.23it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30691/203307 [50:01<4:41:21, 10.23it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30692/203307 [50:05<4:41:42, 10.21it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30692/203307 [50:05<4:41:42, 10.21it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30693/203307 [50:09<4:42:05, 10.20it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30693/203307 [50:09<4:42:05, 10.20it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30694/203307 [50:13<4:42:26, 10.19it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30694/203307 [50:13<4:42:26, 10.19it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30695/203307 [50:18<4:42:51, 10.17it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30695/203307 [50:18<4:42:51, 10.17it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30696/203307 [50:22<4:43:15, 10.16it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30696/203307 [50:22<4:43:15, 10.16it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30697/203307 [50:26<4:43:37, 10.14it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30697/203307 [50:26<4:43:37, 10.14it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30698/203307 [50:31<4:44:03, 10.13it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30698/203307 [50:31<4:44:03, 10.13it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30699/203307 [50:35<4:44:24, 10.11it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30699/203307 [50:35<4:44:24, 10.11it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30700/203307 [50:38<4:44:45, 10.10it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30700/203307 [50:38<4:44:45, 10.10it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30701/203307 [50:42<4:45:06, 10.09it/s, v_num=line, training/loss=0.0758]Epoch 0:  15%|█▌        | 30701/203307 [50:42<4:45:06, 10.09it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30702/203307 [50:46<4:45:28, 10.08it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30702/203307 [50:46<4:45:28, 10.08it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30703/203307 [50:50<4:45:49, 10.06it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30703/203307 [50:50<4:45:49, 10.06it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30704/203307 [50:55<4:46:14, 10.05it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30704/203307 [50:55<4:46:14, 10.05it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30705/203307 [50:59<4:46:38, 10.04it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30705/203307 [50:59<4:46:38, 10.04it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30706/203307 [51:04<4:47:03, 10.02it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30706/203307 [51:04<4:47:04, 10.02it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30707/203307 [51:08<4:47:25, 10.01it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30707/203307 [51:08<4:47:25, 10.01it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30708/203307 [51:12<4:47:46, 10.00it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30708/203307 [51:12<4:47:46, 10.00it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30709/203307 [51:15<4:48:08,  9.98it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30709/203307 [51:16<4:48:08,  9.98it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30710/203307 [51:19<4:48:29,  9.97it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30710/203307 [51:19<4:48:29,  9.97it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30711/203307 [51:23<4:48:50,  9.96it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30711/203307 [51:23<4:48:50,  9.96it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30712/203307 [51:27<4:49:11,  9.95it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30712/203307 [51:27<4:49:11,  9.95it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30713/203307 [51:32<4:49:36,  9.93it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30713/203307 [51:32<4:49:36,  9.93it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30714/203307 [51:36<4:50:00,  9.92it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30714/203307 [51:36<4:50:00,  9.92it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30715/203307 [51:41<4:50:26,  9.90it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30715/203307 [51:41<4:50:26,  9.90it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30716/203307 [51:45<4:50:47,  9.89it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30716/203307 [51:45<4:50:47,  9.89it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30717/203307 [51:49<4:51:08,  9.88it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30717/203307 [51:49<4:51:08,  9.88it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30718/203307 [51:52<4:51:29,  9.87it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30718/203307 [51:52<4:51:30,  9.87it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30719/203307 [51:56<4:51:51,  9.86it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30719/203307 [51:56<4:51:51,  9.86it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30720/203307 [52:00<4:52:12,  9.84it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30720/203307 [52:00<4:52:12,  9.84it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30721/203307 [52:05<4:52:36,  9.83it/s, v_num=line, training/loss=0.0814]Epoch 0:  15%|█▌        | 30721/203307 [52:05<4:52:36,  9.83it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30722/203307 [52:09<4:52:57,  9.82it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30722/203307 [52:09<4:52:57,  9.82it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30723/203307 [52:13<4:53:22,  9.80it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30723/203307 [52:13<4:53:22,  9.80it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30724/203307 [52:18<4:53:47,  9.79it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30724/203307 [52:18<4:53:47,  9.79it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30725/203307 [52:21<4:54:08,  9.78it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30725/203307 [52:21<4:54:08,  9.78it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30726/203307 [52:25<4:54:29,  9.77it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30726/203307 [52:25<4:54:29,  9.77it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30727/203307 [52:29<4:54:50,  9.76it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30727/203307 [52:29<4:54:50,  9.76it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30728/203307 [52:33<4:55:11,  9.74it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30728/203307 [52:33<4:55:11,  9.74it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30729/203307 [52:37<4:55:33,  9.73it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30729/203307 [52:37<4:55:33,  9.73it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30730/203307 [52:42<4:55:58,  9.72it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30730/203307 [52:42<4:55:58,  9.72it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30731/203307 [52:46<4:56:19,  9.71it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30731/203307 [52:46<4:56:19,  9.71it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30732/203307 [52:50<4:56:44,  9.69it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30732/203307 [52:50<4:56:44,  9.69it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30733/203307 [52:54<4:57:05,  9.68it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30733/203307 [52:54<4:57:06,  9.68it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30734/203307 [52:58<4:57:27,  9.67it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30734/203307 [52:58<4:57:27,  9.67it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30735/203307 [53:02<4:57:48,  9.66it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30735/203307 [53:02<4:57:49,  9.66it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30736/203307 [53:06<4:58:10,  9.65it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30736/203307 [53:06<4:58:10,  9.65it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30737/203307 [53:10<4:58:30,  9.63it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30737/203307 [53:10<4:58:31,  9.63it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30738/203307 [53:14<4:58:52,  9.62it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30738/203307 [53:14<4:58:52,  9.62it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30739/203307 [53:18<4:59:17,  9.61it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30739/203307 [53:18<4:59:17,  9.61it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30740/203307 [53:22<4:59:38,  9.60it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30740/203307 [53:22<4:59:38,  9.60it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30741/203307 [53:27<5:00:03,  9.58it/s, v_num=line, training/loss=0.0829]Epoch 0:  15%|█▌        | 30741/203307 [53:27<5:00:03,  9.58it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30742/203307 [53:31<5:00:24,  9.57it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30742/203307 [53:31<5:00:24,  9.57it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30743/203307 [53:35<5:00:46,  9.56it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30743/203307 [53:35<5:00:46,  9.56it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30744/203307 [53:39<5:01:07,  9.55it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30744/203307 [53:39<5:01:08,  9.55it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30745/203307 [53:42<5:01:29,  9.54it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30745/203307 [53:42<5:01:29,  9.54it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30746/203307 [53:46<5:01:50,  9.53it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30746/203307 [53:46<5:01:50,  9.53it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30747/203307 [53:51<5:02:15,  9.51it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30747/203307 [53:51<5:02:15,  9.51it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30748/203307 [53:55<5:02:37,  9.50it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30748/203307 [53:55<5:02:37,  9.50it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30749/203307 [53:59<5:02:59,  9.49it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30749/203307 [53:59<5:02:59,  9.49it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30750/203307 [54:04<5:03:24,  9.48it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30750/203307 [54:04<5:03:25,  9.48it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30751/203307 [54:08<5:03:46,  9.47it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30751/203307 [54:08<5:03:46,  9.47it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30752/203307 [54:12<5:04:07,  9.46it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30752/203307 [54:12<5:04:07,  9.46it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30753/203307 [54:15<5:04:29,  9.45it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30753/203307 [54:15<5:04:29,  9.45it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30754/203307 [54:19<5:04:50,  9.43it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30754/203307 [54:19<5:04:50,  9.43it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30755/203307 [54:23<5:05:12,  9.42it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30755/203307 [54:23<5:05:12,  9.42it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30756/203307 [54:28<5:05:36,  9.41it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30756/203307 [54:28<5:05:36,  9.41it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30757/203307 [54:32<5:05:57,  9.40it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30757/203307 [54:32<5:05:57,  9.40it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30758/203307 [54:37<5:06:23,  9.39it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30758/203307 [54:37<5:06:23,  9.39it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30759/203307 [54:41<5:06:47,  9.37it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30759/203307 [54:41<5:06:47,  9.37it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30760/203307 [54:45<5:07:07,  9.36it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30760/203307 [54:45<5:07:08,  9.36it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30761/203307 [54:49<5:07:30,  9.35it/s, v_num=line, training/loss=0.0893]Epoch 0:  15%|█▌        | 30761/203307 [54:49<5:07:30,  9.35it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30762/203307 [54:53<5:07:51,  9.34it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30762/203307 [54:53<5:07:51,  9.34it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30763/203307 [54:57<5:08:12,  9.33it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30763/203307 [54:57<5:08:12,  9.33it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30764/203307 [55:00<5:08:33,  9.32it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30764/203307 [55:00<5:08:33,  9.32it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30765/203307 [55:05<5:08:57,  9.31it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30765/203307 [55:05<5:08:57,  9.31it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30766/203307 [55:09<5:09:19,  9.30it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30766/203307 [55:09<5:09:19,  9.30it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30767/203307 [55:14<5:09:45,  9.28it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30767/203307 [55:14<5:09:45,  9.28it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30768/203307 [55:18<5:10:09,  9.27it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30768/203307 [55:18<5:10:09,  9.27it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30769/203307 [55:22<5:10:31,  9.26it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30769/203307 [55:22<5:10:31,  9.26it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30770/203307 [55:26<5:10:53,  9.25it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30770/203307 [55:26<5:10:53,  9.25it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30771/203307 [55:30<5:11:16,  9.24it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30771/203307 [55:30<5:11:16,  9.24it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30772/203307 [55:34<5:11:36,  9.23it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30772/203307 [55:34<5:11:36,  9.23it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30773/203307 [55:39<5:12:00,  9.22it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30773/203307 [55:39<5:12:00,  9.22it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30774/203307 [55:42<5:12:22,  9.21it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30774/203307 [55:42<5:12:22,  9.21it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30775/203307 [55:47<5:12:44,  9.19it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30775/203307 [55:47<5:12:44,  9.19it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30776/203307 [55:51<5:13:09,  9.18it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30776/203307 [55:51<5:13:09,  9.18it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30777/203307 [55:56<5:13:33,  9.17it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30777/203307 [55:56<5:13:33,  9.17it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30778/203307 [56:00<5:13:55,  9.16it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30778/203307 [56:00<5:13:55,  9.16it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30779/203307 [56:04<5:14:17,  9.15it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30779/203307 [56:04<5:14:17,  9.15it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30780/203307 [56:08<5:14:38,  9.14it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30780/203307 [56:08<5:14:38,  9.14it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30781/203307 [56:12<5:15:00,  9.13it/s, v_num=line, training/loss=0.0807]Epoch 0:  15%|█▌        | 30781/203307 [56:12<5:15:00,  9.13it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30782/203307 [56:16<5:15:25,  9.12it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30782/203307 [56:16<5:15:25,  9.12it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30783/203307 [56:20<5:15:47,  9.11it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30783/203307 [56:20<5:15:47,  9.11it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30784/203307 [56:25<5:16:12,  9.09it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30784/203307 [56:25<5:16:12,  9.09it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30785/203307 [56:29<5:16:34,  9.08it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30785/203307 [56:29<5:16:34,  9.08it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30786/203307 [56:33<5:16:59,  9.07it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30786/203307 [56:33<5:16:59,  9.07it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30787/203307 [56:37<5:17:20,  9.06it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30787/203307 [56:37<5:17:20,  9.06it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30788/203307 [56:41<5:17:41,  9.05it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30788/203307 [56:41<5:17:41,  9.05it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30789/203307 [56:45<5:18:04,  9.04it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30789/203307 [56:45<5:18:04,  9.04it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30790/203307 [56:49<5:18:26,  9.03it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30790/203307 [56:49<5:18:26,  9.03it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30791/203307 [56:54<5:18:50,  9.02it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30791/203307 [56:54<5:18:50,  9.02it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30792/203307 [56:58<5:19:11,  9.01it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30792/203307 [56:58<5:19:11,  9.01it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30793/203307 [57:03<5:19:37,  9.00it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30793/203307 [57:03<5:19:37,  9.00it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30794/203307 [57:07<5:20:00,  8.98it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30794/203307 [57:07<5:20:00,  8.98it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30795/203307 [57:11<5:20:23,  8.97it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30795/203307 [57:11<5:20:23,  8.97it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30796/203307 [57:15<5:20:44,  8.96it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30796/203307 [57:15<5:20:44,  8.96it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30797/203307 [57:19<5:21:05,  8.95it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30797/203307 [57:19<5:21:05,  8.95it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30798/203307 [57:23<5:21:27,  8.94it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30798/203307 [57:23<5:21:27,  8.94it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30799/203307 [57:27<5:21:52,  8.93it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30799/203307 [57:27<5:21:52,  8.93it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30800/203307 [57:31<5:22:13,  8.92it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30800/203307 [57:31<5:22:13,  8.92it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30801/203307 [57:35<5:22:35,  8.91it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 30801/203307 [57:35<5:22:35,  8.91it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30802/203307 [57:40<5:23:02,  8.90it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30802/203307 [57:40<5:23:02,  8.90it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30803/203307 [57:44<5:23:24,  8.89it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30803/203307 [57:44<5:23:24,  8.89it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30804/203307 [57:49<5:23:48,  8.88it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30804/203307 [57:49<5:23:48,  8.88it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30805/203307 [57:53<5:24:10,  8.87it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30805/203307 [57:53<5:24:10,  8.87it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30806/203307 [57:57<5:24:32,  8.86it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30806/203307 [57:57<5:24:32,  8.86it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30807/203307 [58:01<5:24:54,  8.85it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30807/203307 [58:01<5:24:54,  8.85it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30808/203307 [58:06<5:25:19,  8.84it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30808/203307 [58:06<5:25:19,  8.84it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30809/203307 [58:10<5:25:40,  8.83it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30809/203307 [58:10<5:25:40,  8.83it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30810/203307 [58:14<5:26:06,  8.82it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30810/203307 [58:14<5:26:06,  8.82it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30811/203307 [58:18<5:26:28,  8.81it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30811/203307 [58:18<5:26:28,  8.81it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30812/203307 [58:22<5:26:49,  8.80it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30812/203307 [58:22<5:26:49,  8.80it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30813/203307 [58:27<5:27:14,  8.79it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30813/203307 [58:27<5:27:14,  8.79it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30814/203307 [58:31<5:27:36,  8.78it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30814/203307 [58:31<5:27:36,  8.78it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30815/203307 [58:35<5:27:57,  8.77it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30815/203307 [58:35<5:27:57,  8.77it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30816/203307 [58:39<5:28:18,  8.76it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30816/203307 [58:39<5:28:18,  8.76it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30817/203307 [58:43<5:28:43,  8.75it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30817/203307 [58:43<5:28:43,  8.75it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30818/203307 [58:47<5:29:05,  8.74it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30818/203307 [58:47<5:29:05,  8.74it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30819/203307 [58:52<5:29:31,  8.72it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30819/203307 [58:52<5:29:31,  8.72it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30820/203307 [58:56<5:29:52,  8.71it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30820/203307 [58:56<5:29:52,  8.71it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30821/203307 [59:00<5:30:14,  8.71it/s, v_num=line, training/loss=0.0776]Epoch 0:  15%|█▌        | 30821/203307 [59:00<5:30:14,  8.71it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30822/203307 [59:05<5:30:39,  8.69it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30822/203307 [59:05<5:30:39,  8.69it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30823/203307 [59:09<5:31:01,  8.68it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30823/203307 [59:09<5:31:01,  8.68it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30824/203307 [59:13<5:31:22,  8.68it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30824/203307 [59:13<5:31:22,  8.68it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30825/203307 [59:17<5:31:47,  8.66it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30825/203307 [59:17<5:31:47,  8.66it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30826/203307 [59:21<5:32:08,  8.65it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30826/203307 [59:21<5:32:08,  8.65it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30827/203307 [59:25<5:32:30,  8.65it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30827/203307 [59:25<5:32:31,  8.65it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30828/203307 [59:30<5:32:55,  8.63it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30828/203307 [59:30<5:32:55,  8.63it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30829/203307 [59:34<5:33:17,  8.62it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30829/203307 [59:34<5:33:17,  8.62it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30830/203307 [59:38<5:33:39,  8.62it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30830/203307 [59:38<5:33:39,  8.62it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30831/203307 [59:43<5:34:04,  8.60it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30831/203307 [59:43<5:34:04,  8.60it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30832/203307 [59:46<5:34:24,  8.60it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30832/203307 [59:46<5:34:24,  8.60it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30833/203307 [59:50<5:34:46,  8.59it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30833/203307 [59:50<5:34:46,  8.59it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30834/203307 [59:55<5:35:10,  8.58it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30834/203307 [59:55<5:35:10,  8.58it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30835/203307 [59:59<5:35:32,  8.57it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30835/203307 [59:59<5:35:32,  8.57it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30836/203307 [1:00:03<5:35:56,  8.56it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30836/203307 [1:00:03<5:35:56,  8.56it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30837/203307 [1:00:08<5:36:19,  8.55it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30837/203307 [1:00:08<5:36:19,  8.55it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30838/203307 [1:00:12<5:36:41,  8.54it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30838/203307 [1:00:12<5:36:41,  8.54it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30839/203307 [1:00:16<5:37:03,  8.53it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30839/203307 [1:00:16<5:37:03,  8.53it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30840/203307 [1:00:20<5:37:26,  8.52it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30840/203307 [1:00:20<5:37:26,  8.52it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30841/203307 [1:00:24<5:37:48,  8.51it/s, v_num=line, training/loss=0.0757]Epoch 0:  15%|█▌        | 30841/203307 [1:00:24<5:37:48,  8.51it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30842/203307 [1:00:28<5:38:10,  8.50it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30842/203307 [1:00:28<5:38:10,  8.50it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30843/203307 [1:00:33<5:38:34,  8.49it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30843/203307 [1:00:33<5:38:34,  8.49it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30844/203307 [1:00:36<5:38:55,  8.48it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30844/203307 [1:00:36<5:38:55,  8.48it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30845/203307 [1:00:41<5:39:20,  8.47it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30845/203307 [1:00:41<5:39:20,  8.47it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30846/203307 [1:00:45<5:39:42,  8.46it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30846/203307 [1:00:45<5:39:42,  8.46it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30847/203307 [1:00:49<5:40:04,  8.45it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30847/203307 [1:00:49<5:40:04,  8.45it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30848/203307 [1:00:53<5:40:25,  8.44it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30848/203307 [1:00:53<5:40:25,  8.44it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30849/203307 [1:00:58<5:40:49,  8.43it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30849/203307 [1:00:58<5:40:49,  8.43it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30850/203307 [1:01:02<5:41:11,  8.42it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30850/203307 [1:01:02<5:41:11,  8.42it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30851/203307 [1:01:06<5:41:36,  8.41it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30851/203307 [1:01:06<5:41:36,  8.41it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30852/203307 [1:01:10<5:41:56,  8.41it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30852/203307 [1:01:10<5:41:56,  8.41it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30853/203307 [1:01:14<5:42:18,  8.40it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30853/203307 [1:01:14<5:42:18,  8.40it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30854/203307 [1:01:19<5:42:44,  8.39it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30854/203307 [1:01:19<5:42:44,  8.39it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30855/203307 [1:01:23<5:43:05,  8.38it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30855/203307 [1:01:23<5:43:05,  8.38it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30856/203307 [1:01:26<5:43:26,  8.37it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30856/203307 [1:01:26<5:43:26,  8.37it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30857/203307 [1:01:30<5:43:47,  8.36it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30857/203307 [1:01:30<5:43:47,  8.36it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30858/203307 [1:01:35<5:44:11,  8.35it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30858/203307 [1:01:35<5:44:11,  8.35it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30859/203307 [1:01:39<5:44:33,  8.34it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30859/203307 [1:01:39<5:44:33,  8.34it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30860/203307 [1:01:44<5:44:58,  8.33it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30860/203307 [1:01:44<5:44:58,  8.33it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30861/203307 [1:01:48<5:45:20,  8.32it/s, v_num=line, training/loss=0.0769]Epoch 0:  15%|█▌        | 30861/203307 [1:01:48<5:45:20,  8.32it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30862/203307 [1:01:52<5:45:46,  8.31it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30862/203307 [1:01:52<5:45:46,  8.31it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30863/203307 [1:01:56<5:46:08,  8.30it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30863/203307 [1:01:56<5:46:08,  8.30it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30864/203307 [1:02:00<5:46:28,  8.30it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30864/203307 [1:02:00<5:46:28,  8.30it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30865/203307 [1:02:04<5:46:50,  8.29it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30865/203307 [1:02:04<5:46:51,  8.29it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30866/203307 [1:02:09<5:47:13,  8.28it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30866/203307 [1:02:09<5:47:13,  8.28it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30867/203307 [1:02:13<5:47:36,  8.27it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30867/203307 [1:02:13<5:47:36,  8.27it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30868/203307 [1:02:17<5:47:57,  8.26it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30868/203307 [1:02:17<5:47:57,  8.26it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30869/203307 [1:02:21<5:48:21,  8.25it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30869/203307 [1:02:21<5:48:21,  8.25it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30870/203307 [1:02:25<5:48:43,  8.24it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30870/203307 [1:02:25<5:48:43,  8.24it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30871/203307 [1:02:30<5:49:10,  8.23it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30871/203307 [1:02:30<5:49:10,  8.23it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30872/203307 [1:02:34<5:49:31,  8.22it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30872/203307 [1:02:34<5:49:31,  8.22it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30873/203307 [1:02:38<5:49:53,  8.21it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30873/203307 [1:02:38<5:49:53,  8.21it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30874/203307 [1:02:42<5:50:16,  8.20it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30874/203307 [1:02:43<5:50:16,  8.20it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30875/203307 [1:02:47<5:50:39,  8.20it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30875/203307 [1:02:47<5:50:39,  8.20it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30876/203307 [1:02:51<5:51:03,  8.19it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30876/203307 [1:02:51<5:51:03,  8.19it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30877/203307 [1:02:56<5:51:27,  8.18it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30877/203307 [1:02:56<5:51:27,  8.18it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30878/203307 [1:03:00<5:51:50,  8.17it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30878/203307 [1:03:00<5:51:50,  8.17it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30879/203307 [1:03:04<5:52:11,  8.16it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30879/203307 [1:03:04<5:52:11,  8.16it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30880/203307 [1:03:09<5:52:37,  8.15it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30880/203307 [1:03:09<5:52:37,  8.15it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30881/203307 [1:03:13<5:52:59,  8.14it/s, v_num=line, training/loss=0.0879]Epoch 0:  15%|█▌        | 30881/203307 [1:03:13<5:52:59,  8.14it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30882/203307 [1:03:17<5:53:21,  8.13it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30882/203307 [1:03:17<5:53:21,  8.13it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30883/203307 [1:03:21<5:53:43,  8.12it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30883/203307 [1:03:21<5:53:43,  8.12it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30884/203307 [1:03:25<5:54:04,  8.12it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30884/203307 [1:03:25<5:54:04,  8.12it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30885/203307 [1:03:29<5:54:28,  8.11it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30885/203307 [1:03:29<5:54:28,  8.11it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30886/203307 [1:03:34<5:54:52,  8.10it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30886/203307 [1:03:34<5:54:53,  8.10it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30887/203307 [1:03:38<5:55:15,  8.09it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30887/203307 [1:03:38<5:55:15,  8.09it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30888/203307 [1:03:42<5:55:40,  8.08it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30888/203307 [1:03:43<5:55:40,  8.08it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30889/203307 [1:03:47<5:56:02,  8.07it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30889/203307 [1:03:47<5:56:02,  8.07it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30890/203307 [1:03:51<5:56:24,  8.06it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30890/203307 [1:03:51<5:56:24,  8.06it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30891/203307 [1:03:55<5:56:46,  8.05it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30891/203307 [1:03:55<5:56:46,  8.05it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30892/203307 [1:03:59<5:57:06,  8.05it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30892/203307 [1:03:59<5:57:06,  8.05it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30893/203307 [1:04:03<5:57:28,  8.04it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30893/203307 [1:04:03<5:57:28,  8.04it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30894/203307 [1:04:07<5:57:52,  8.03it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30894/203307 [1:04:07<5:57:53,  8.03it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30895/203307 [1:04:12<5:58:17,  8.02it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30895/203307 [1:04:12<5:58:17,  8.02it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30896/203307 [1:04:15<5:58:37,  8.01it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30896/203307 [1:04:15<5:58:37,  8.01it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30897/203307 [1:04:20<5:59:03,  8.00it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30897/203307 [1:04:20<5:59:03,  8.00it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30898/203307 [1:04:24<5:59:25,  7.99it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30898/203307 [1:04:24<5:59:25,  7.99it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30899/203307 [1:04:28<5:59:46,  7.99it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30899/203307 [1:04:28<5:59:47,  7.99it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30900/203307 [1:04:32<6:00:07,  7.98it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30900/203307 [1:04:32<6:00:07,  7.98it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30901/203307 [1:04:36<6:00:29,  7.97it/s, v_num=line, training/loss=0.0898]Epoch 0:  15%|█▌        | 30901/203307 [1:04:36<6:00:29,  7.97it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30902/203307 [1:04:40<6:00:51,  7.96it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30902/203307 [1:04:40<6:00:51,  7.96it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30903/203307 [1:04:45<6:01:16,  7.95it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30903/203307 [1:04:45<6:01:16,  7.95it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30904/203307 [1:04:49<6:01:37,  7.95it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30904/203307 [1:04:49<6:01:37,  7.95it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30905/203307 [1:04:53<6:01:59,  7.94it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30905/203307 [1:04:53<6:01:59,  7.94it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30906/203307 [1:04:58<6:02:25,  7.93it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30906/203307 [1:04:58<6:02:25,  7.93it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30907/203307 [1:05:02<6:02:47,  7.92it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30907/203307 [1:05:02<6:02:47,  7.92it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30908/203307 [1:05:06<6:03:07,  7.91it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30908/203307 [1:05:06<6:03:07,  7.91it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30909/203307 [1:05:10<6:03:29,  7.90it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30909/203307 [1:05:10<6:03:29,  7.90it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30910/203307 [1:05:14<6:03:51,  7.90it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30910/203307 [1:05:14<6:03:51,  7.90it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30911/203307 [1:05:18<6:04:13,  7.89it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30911/203307 [1:05:18<6:04:13,  7.89it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30912/203307 [1:05:22<6:04:37,  7.88it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30912/203307 [1:05:22<6:04:37,  7.88it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30913/203307 [1:05:26<6:04:58,  7.87it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30913/203307 [1:05:26<6:04:58,  7.87it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30914/203307 [1:05:31<6:05:24,  7.86it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30914/203307 [1:05:31<6:05:24,  7.86it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30915/203307 [1:05:35<6:05:46,  7.86it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30915/203307 [1:05:35<6:05:46,  7.86it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30916/203307 [1:05:39<6:06:06,  7.85it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30916/203307 [1:05:39<6:06:06,  7.85it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30917/203307 [1:05:43<6:06:28,  7.84it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30917/203307 [1:05:43<6:06:28,  7.84it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30918/203307 [1:05:47<6:06:51,  7.83it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30918/203307 [1:05:47<6:06:51,  7.83it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30919/203307 [1:05:51<6:07:13,  7.82it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30919/203307 [1:05:51<6:07:13,  7.82it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30920/203307 [1:05:55<6:07:33,  7.82it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30920/203307 [1:05:55<6:07:33,  7.82it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30921/203307 [1:06:00<6:07:57,  7.81it/s, v_num=line, training/loss=0.0818]Epoch 0:  15%|█▌        | 30921/203307 [1:06:00<6:07:57,  7.81it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30922/203307 [1:06:04<6:08:19,  7.80it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30922/203307 [1:06:04<6:08:19,  7.80it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30923/203307 [1:06:08<6:08:44,  7.79it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30923/203307 [1:06:08<6:08:45,  7.79it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30924/203307 [1:06:12<6:09:05,  7.78it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30924/203307 [1:06:12<6:09:05,  7.78it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30925/203307 [1:06:16<6:09:27,  7.78it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30925/203307 [1:06:16<6:09:27,  7.78it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30926/203307 [1:06:20<6:09:49,  7.77it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30926/203307 [1:06:20<6:09:49,  7.77it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30927/203307 [1:06:24<6:10:11,  7.76it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30927/203307 [1:06:24<6:10:11,  7.76it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30928/203307 [1:06:28<6:10:31,  7.75it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30928/203307 [1:06:28<6:10:31,  7.75it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30929/203307 [1:06:33<6:10:55,  7.75it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30929/203307 [1:06:33<6:10:55,  7.75it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30930/203307 [1:06:37<6:11:19,  7.74it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30930/203307 [1:06:37<6:11:19,  7.74it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30931/203307 [1:06:41<6:11:41,  7.73it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30931/203307 [1:06:41<6:11:41,  7.73it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30932/203307 [1:06:46<6:12:06,  7.72it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30932/203307 [1:06:46<6:12:06,  7.72it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30933/203307 [1:06:50<6:12:27,  7.71it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30933/203307 [1:06:50<6:12:27,  7.71it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30934/203307 [1:06:54<6:12:49,  7.71it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30934/203307 [1:06:54<6:12:49,  7.71it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30935/203307 [1:06:58<6:13:11,  7.70it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30935/203307 [1:06:58<6:13:11,  7.70it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30936/203307 [1:07:02<6:13:32,  7.69it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30936/203307 [1:07:02<6:13:32,  7.69it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30937/203307 [1:07:06<6:13:54,  7.68it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30937/203307 [1:07:06<6:13:54,  7.68it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30938/203307 [1:07:11<6:14:18,  7.67it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30938/203307 [1:07:11<6:14:18,  7.67it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30939/203307 [1:07:15<6:14:41,  7.67it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30939/203307 [1:07:15<6:14:41,  7.67it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30940/203307 [1:07:19<6:15:06,  7.66it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30940/203307 [1:07:20<6:15:06,  7.66it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30941/203307 [1:07:24<6:15:28,  7.65it/s, v_num=line, training/loss=0.0788]Epoch 0:  15%|█▌        | 30941/203307 [1:07:24<6:15:28,  7.65it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30942/203307 [1:07:28<6:15:50,  7.64it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30942/203307 [1:07:28<6:15:50,  7.64it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30943/203307 [1:07:32<6:16:11,  7.64it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30943/203307 [1:07:32<6:16:11,  7.64it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30944/203307 [1:07:35<6:16:32,  7.63it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30944/203307 [1:07:35<6:16:32,  7.63it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30945/203307 [1:07:40<6:16:54,  7.62it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30945/203307 [1:07:40<6:16:54,  7.62it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30946/203307 [1:07:44<6:17:16,  7.61it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30946/203307 [1:07:44<6:17:16,  7.61it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30947/203307 [1:07:48<6:17:41,  7.61it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30947/203307 [1:07:48<6:17:41,  7.61it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30948/203307 [1:07:53<6:18:04,  7.60it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30948/203307 [1:07:53<6:18:04,  7.60it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30949/203307 [1:07:57<6:18:30,  7.59it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30949/203307 [1:07:57<6:18:30,  7.59it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30950/203307 [1:08:02<6:18:52,  7.58it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30950/203307 [1:08:02<6:18:52,  7.58it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30951/203307 [1:08:06<6:19:13,  7.57it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30951/203307 [1:08:06<6:19:13,  7.57it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30952/203307 [1:08:09<6:19:34,  7.57it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30952/203307 [1:08:09<6:19:34,  7.57it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30953/203307 [1:08:13<6:19:56,  7.56it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30953/203307 [1:08:14<6:19:56,  7.56it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30954/203307 [1:08:18<6:20:18,  7.55it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30954/203307 [1:08:18<6:20:18,  7.55it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30955/203307 [1:08:22<6:20:42,  7.55it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30955/203307 [1:08:22<6:20:42,  7.55it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30956/203307 [1:08:26<6:21:03,  7.54it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30956/203307 [1:08:26<6:21:03,  7.54it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30957/203307 [1:08:30<6:21:26,  7.53it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30957/203307 [1:08:30<6:21:26,  7.53it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30958/203307 [1:08:35<6:21:52,  7.52it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30958/203307 [1:08:35<6:21:52,  7.52it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30959/203307 [1:08:39<6:22:14,  7.51it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30959/203307 [1:08:39<6:22:14,  7.51it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30960/203307 [1:08:43<6:22:35,  7.51it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30960/203307 [1:08:43<6:22:35,  7.51it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30961/203307 [1:08:47<6:22:56,  7.50it/s, v_num=line, training/loss=0.0858]Epoch 0:  15%|█▌        | 30961/203307 [1:08:47<6:22:57,  7.50it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30962/203307 [1:08:51<6:23:18,  7.49it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30962/203307 [1:08:51<6:23:18,  7.49it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30963/203307 [1:08:55<6:23:39,  7.49it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30963/203307 [1:08:55<6:23:39,  7.49it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30964/203307 [1:09:00<6:24:03,  7.48it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30964/203307 [1:09:00<6:24:03,  7.48it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30965/203307 [1:09:04<6:24:24,  7.47it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30965/203307 [1:09:04<6:24:24,  7.47it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30966/203307 [1:09:08<6:24:50,  7.46it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30966/203307 [1:09:08<6:24:50,  7.46it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30967/203307 [1:09:12<6:25:11,  7.46it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30967/203307 [1:09:12<6:25:11,  7.46it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30968/203307 [1:09:16<6:25:31,  7.45it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30968/203307 [1:09:16<6:25:31,  7.45it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30969/203307 [1:09:20<6:25:53,  7.44it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30969/203307 [1:09:20<6:25:53,  7.44it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30970/203307 [1:09:24<6:26:15,  7.44it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30970/203307 [1:09:24<6:26:15,  7.44it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30971/203307 [1:09:28<6:26:36,  7.43it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30971/203307 [1:09:28<6:26:36,  7.43it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30972/203307 [1:09:32<6:26:56,  7.42it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30972/203307 [1:09:32<6:26:56,  7.42it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30973/203307 [1:09:37<6:27:21,  7.41it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30973/203307 [1:09:37<6:27:21,  7.41it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30974/203307 [1:09:41<6:27:43,  7.41it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30974/203307 [1:09:41<6:27:43,  7.41it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30975/203307 [1:09:45<6:28:08,  7.40it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30975/203307 [1:09:45<6:28:08,  7.40it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30976/203307 [1:09:49<6:28:28,  7.39it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30976/203307 [1:09:49<6:28:28,  7.39it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30977/203307 [1:09:53<6:28:50,  7.39it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30977/203307 [1:09:53<6:28:50,  7.39it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30978/203307 [1:09:57<6:29:11,  7.38it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30978/203307 [1:09:57<6:29:11,  7.38it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30979/203307 [1:10:01<6:29:33,  7.37it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30979/203307 [1:10:01<6:29:33,  7.37it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30980/203307 [1:10:05<6:29:53,  7.37it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30980/203307 [1:10:05<6:29:53,  7.37it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30981/203307 [1:10:10<6:30:17,  7.36it/s, v_num=line, training/loss=0.0956]Epoch 0:  15%|█▌        | 30981/203307 [1:10:10<6:30:17,  7.36it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30982/203307 [1:10:14<6:30:39,  7.35it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30982/203307 [1:10:14<6:30:39,  7.35it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30983/203307 [1:10:18<6:31:00,  7.35it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30983/203307 [1:10:18<6:31:00,  7.35it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30984/203307 [1:10:22<6:31:24,  7.34it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30984/203307 [1:10:22<6:31:24,  7.34it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30985/203307 [1:10:26<6:31:46,  7.33it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30985/203307 [1:10:26<6:31:46,  7.33it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30986/203307 [1:10:30<6:32:08,  7.32it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30986/203307 [1:10:30<6:32:08,  7.32it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30987/203307 [1:10:34<6:32:29,  7.32it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30987/203307 [1:10:34<6:32:29,  7.32it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30988/203307 [1:10:38<6:32:49,  7.31it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30988/203307 [1:10:38<6:32:49,  7.31it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30989/203307 [1:10:42<6:33:11,  7.30it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30989/203307 [1:10:42<6:33:11,  7.30it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30990/203307 [1:10:47<6:33:36,  7.30it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30990/203307 [1:10:47<6:33:36,  7.30it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30991/203307 [1:10:51<6:33:57,  7.29it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30991/203307 [1:10:51<6:33:57,  7.29it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30992/203307 [1:10:55<6:34:22,  7.28it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30992/203307 [1:10:55<6:34:22,  7.28it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30993/203307 [1:11:00<6:34:46,  7.27it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30993/203307 [1:11:00<6:34:46,  7.27it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30994/203307 [1:11:04<6:35:07,  7.27it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30994/203307 [1:11:04<6:35:07,  7.27it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30995/203307 [1:11:08<6:35:29,  7.26it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30995/203307 [1:11:08<6:35:29,  7.26it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30996/203307 [1:11:12<6:35:50,  7.26it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30996/203307 [1:11:12<6:35:50,  7.26it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30997/203307 [1:11:16<6:36:11,  7.25it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30997/203307 [1:11:16<6:36:11,  7.25it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30998/203307 [1:11:20<6:36:33,  7.24it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30998/203307 [1:11:20<6:36:33,  7.24it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30999/203307 [1:11:25<6:36:58,  7.23it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 30999/203307 [1:11:25<6:36:58,  7.23it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 31000/203307 [1:11:28<6:37:18,  7.23it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 31000/203307 [1:11:28<6:37:18,  7.23it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 31001/203307 [1:11:33<6:37:44,  7.22it/s, v_num=line, training/loss=0.0753]Epoch 0:  15%|█▌        | 31001/203307 [1:11:33<6:37:44,  7.22it/s, v_num=line, training/loss=0.078] Epoch 0:  15%|█▌        | 31002/203307 [1:11:38<6:38:09,  7.21it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31002/203307 [1:11:38<6:38:09,  7.21it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31003/203307 [1:11:42<6:38:31,  7.21it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31003/203307 [1:11:42<6:38:31,  7.21it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31004/203307 [1:11:46<6:38:51,  7.20it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31004/203307 [1:11:46<6:38:51,  7.20it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31005/203307 [1:11:50<6:39:13,  7.19it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31005/203307 [1:11:50<6:39:13,  7.19it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31006/203307 [1:11:54<6:39:35,  7.19it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31006/203307 [1:11:54<6:39:35,  7.19it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31007/203307 [1:11:59<6:40:00,  7.18it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31007/203307 [1:11:59<6:40:00,  7.18it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31008/203307 [1:12:02<6:40:20,  7.17it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31008/203307 [1:12:02<6:40:20,  7.17it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31009/203307 [1:12:06<6:40:41,  7.17it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31009/203307 [1:12:06<6:40:41,  7.17it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31010/203307 [1:12:11<6:41:07,  7.16it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31010/203307 [1:12:11<6:41:08,  7.16it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31011/203307 [1:12:16<6:41:31,  7.15it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31011/203307 [1:12:16<6:41:31,  7.15it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31012/203307 [1:12:19<6:41:51,  7.15it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31012/203307 [1:12:19<6:41:51,  7.15it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31013/203307 [1:12:24<6:42:13,  7.14it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31013/203307 [1:12:24<6:42:13,  7.14it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31014/203307 [1:12:28<6:42:35,  7.13it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31014/203307 [1:12:28<6:42:35,  7.13it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31015/203307 [1:12:32<6:42:57,  7.13it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31015/203307 [1:12:32<6:42:57,  7.13it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31016/203307 [1:12:36<6:43:21,  7.12it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31016/203307 [1:12:36<6:43:21,  7.12it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31017/203307 [1:12:40<6:43:43,  7.11it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31017/203307 [1:12:40<6:43:43,  7.11it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31018/203307 [1:12:45<6:44:09,  7.10it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31018/203307 [1:12:45<6:44:09,  7.10it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31019/203307 [1:12:49<6:44:30,  7.10it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31019/203307 [1:12:49<6:44:30,  7.10it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31020/203307 [1:12:54<6:44:54,  7.09it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31020/203307 [1:12:54<6:44:54,  7.09it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31021/203307 [1:12:58<6:45:15,  7.09it/s, v_num=line, training/loss=0.078]Epoch 0:  15%|█▌        | 31021/203307 [1:12:58<6:45:15,  7.09it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31022/203307 [1:13:02<6:45:37,  7.08it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31022/203307 [1:13:02<6:45:37,  7.08it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31023/203307 [1:13:06<6:45:59,  7.07it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31023/203307 [1:13:06<6:45:59,  7.07it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31024/203307 [1:13:10<6:46:19,  7.07it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31024/203307 [1:13:10<6:46:19,  7.07it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31025/203307 [1:13:14<6:46:43,  7.06it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31025/203307 [1:13:14<6:46:43,  7.06it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31026/203307 [1:13:18<6:47:05,  7.05it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31026/203307 [1:13:18<6:47:05,  7.05it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31027/203307 [1:13:23<6:47:30,  7.05it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31027/203307 [1:13:23<6:47:30,  7.05it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31028/203307 [1:13:27<6:47:50,  7.04it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31028/203307 [1:13:27<6:47:50,  7.04it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31029/203307 [1:13:31<6:48:14,  7.03it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31029/203307 [1:13:31<6:48:14,  7.03it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31030/203307 [1:13:35<6:48:35,  7.03it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31030/203307 [1:13:35<6:48:35,  7.03it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31031/203307 [1:13:39<6:48:57,  7.02it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31031/203307 [1:13:39<6:48:57,  7.02it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31032/203307 [1:13:43<6:49:18,  7.02it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31032/203307 [1:13:43<6:49:18,  7.01it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31033/203307 [1:13:48<6:49:42,  7.01it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31033/203307 [1:13:48<6:49:42,  7.01it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31034/203307 [1:13:52<6:50:03,  7.00it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31034/203307 [1:13:52<6:50:03,  7.00it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31035/203307 [1:13:56<6:50:25,  7.00it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31035/203307 [1:13:56<6:50:25,  7.00it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31036/203307 [1:14:00<6:50:50,  6.99it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31036/203307 [1:14:00<6:50:50,  6.99it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31037/203307 [1:14:05<6:51:12,  6.98it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31037/203307 [1:14:05<6:51:12,  6.98it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31038/203307 [1:14:09<6:51:36,  6.98it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31038/203307 [1:14:09<6:51:36,  6.98it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31039/203307 [1:14:13<6:51:58,  6.97it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31039/203307 [1:14:13<6:51:58,  6.97it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31040/203307 [1:14:17<6:52:18,  6.96it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31040/203307 [1:14:17<6:52:18,  6.96it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31041/203307 [1:14:21<6:52:40,  6.96it/s, v_num=line, training/loss=0.0837]Epoch 0:  15%|█▌        | 31041/203307 [1:14:21<6:52:40,  6.96it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31042/203307 [1:14:26<6:53:04,  6.95it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31042/203307 [1:14:26<6:53:04,  6.95it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31043/203307 [1:14:30<6:53:26,  6.94it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31043/203307 [1:14:30<6:53:26,  6.94it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31044/203307 [1:14:34<6:53:50,  6.94it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31044/203307 [1:14:34<6:53:50,  6.94it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31045/203307 [1:14:38<6:54:12,  6.93it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31045/203307 [1:14:38<6:54:12,  6.93it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31046/203307 [1:14:42<6:54:33,  6.93it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31046/203307 [1:14:42<6:54:33,  6.93it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31047/203307 [1:14:47<6:54:58,  6.92it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31047/203307 [1:14:47<6:54:58,  6.92it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31048/203307 [1:14:51<6:55:18,  6.91it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31048/203307 [1:14:51<6:55:18,  6.91it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31049/203307 [1:14:55<6:55:40,  6.91it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31049/203307 [1:14:55<6:55:40,  6.91it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31050/203307 [1:14:59<6:56:02,  6.90it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31050/203307 [1:14:59<6:56:02,  6.90it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31051/203307 [1:15:04<6:56:26,  6.89it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31051/203307 [1:15:04<6:56:26,  6.89it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31052/203307 [1:15:07<6:56:46,  6.89it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31052/203307 [1:15:07<6:56:46,  6.89it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31053/203307 [1:15:12<6:57:12,  6.88it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31053/203307 [1:15:12<6:57:12,  6.88it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31054/203307 [1:15:16<6:57:34,  6.88it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31054/203307 [1:15:16<6:57:34,  6.88it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31055/203307 [1:15:20<6:57:55,  6.87it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31055/203307 [1:15:20<6:57:55,  6.87it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31056/203307 [1:15:25<6:58:19,  6.86it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31056/203307 [1:15:25<6:58:19,  6.86it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31057/203307 [1:15:29<6:58:41,  6.86it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31057/203307 [1:15:29<6:58:41,  6.86it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31058/203307 [1:15:33<6:59:02,  6.85it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31058/203307 [1:15:33<6:59:02,  6.85it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31059/203307 [1:15:38<6:59:27,  6.84it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31059/203307 [1:15:38<6:59:27,  6.84it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31060/203307 [1:15:41<6:59:47,  6.84it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31060/203307 [1:15:41<6:59:47,  6.84it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31061/203307 [1:15:46<7:00:09,  6.83it/s, v_num=line, training/loss=0.0921]Epoch 0:  15%|█▌        | 31061/203307 [1:15:46<7:00:09,  6.83it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31062/203307 [1:15:50<7:00:36,  6.83it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31062/203307 [1:15:50<7:00:36,  6.83it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31063/203307 [1:15:55<7:00:57,  6.82it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31063/203307 [1:15:55<7:00:57,  6.82it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31064/203307 [1:15:58<7:01:18,  6.81it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31064/203307 [1:15:58<7:01:18,  6.81it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31065/203307 [1:16:03<7:01:42,  6.81it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31065/203307 [1:16:03<7:01:42,  6.81it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31066/203307 [1:16:07<7:02:03,  6.80it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31066/203307 [1:16:07<7:02:03,  6.80it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31067/203307 [1:16:11<7:02:25,  6.80it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31067/203307 [1:16:11<7:02:25,  6.80it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31068/203307 [1:16:16<7:02:49,  6.79it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31068/203307 [1:16:16<7:02:49,  6.79it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31069/203307 [1:16:20<7:03:11,  6.78it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31069/203307 [1:16:20<7:03:11,  6.78it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31070/203307 [1:16:25<7:03:37,  6.78it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31070/203307 [1:16:25<7:03:37,  6.78it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31071/203307 [1:16:29<7:03:59,  6.77it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31071/203307 [1:16:29<7:03:59,  6.77it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31072/203307 [1:16:32<7:04:19,  6.77it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31072/203307 [1:16:32<7:04:19,  6.77it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31073/203307 [1:16:37<7:04:40,  6.76it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31073/203307 [1:16:37<7:04:40,  6.76it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31074/203307 [1:16:41<7:05:05,  6.75it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31074/203307 [1:16:41<7:05:05,  6.75it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31075/203307 [1:16:45<7:05:27,  6.75it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31075/203307 [1:16:45<7:05:27,  6.75it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31076/203307 [1:16:49<7:05:47,  6.74it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31076/203307 [1:16:49<7:05:47,  6.74it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31077/203307 [1:16:54<7:06:11,  6.74it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31077/203307 [1:16:54<7:06:11,  6.74it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31078/203307 [1:16:58<7:06:32,  6.73it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31078/203307 [1:16:58<7:06:32,  6.73it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31079/203307 [1:17:02<7:06:57,  6.72it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31079/203307 [1:17:02<7:06:57,  6.72it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31080/203307 [1:17:06<7:07:18,  6.72it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31080/203307 [1:17:06<7:07:18,  6.72it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31081/203307 [1:17:10<7:07:39,  6.71it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31081/203307 [1:17:10<7:07:39,  6.71it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31082/203307 [1:17:14<7:08:01,  6.71it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31082/203307 [1:17:14<7:08:01,  6.71it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31083/203307 [1:17:19<7:08:24,  6.70it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31083/203307 [1:17:19<7:08:24,  6.70it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31084/203307 [1:17:23<7:08:44,  6.69it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31084/203307 [1:17:23<7:08:44,  6.69it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31085/203307 [1:17:27<7:09:08,  6.69it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31085/203307 [1:17:27<7:09:08,  6.69it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31086/203307 [1:17:31<7:09:29,  6.68it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31086/203307 [1:17:31<7:09:29,  6.68it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31087/203307 [1:17:35<7:09:51,  6.68it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31087/203307 [1:17:35<7:09:51,  6.68it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31088/203307 [1:17:40<7:10:15,  6.67it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31088/203307 [1:17:40<7:10:15,  6.67it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31089/203307 [1:17:44<7:10:37,  6.67it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31089/203307 [1:17:44<7:10:37,  6.67it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31090/203307 [1:17:48<7:10:59,  6.66it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31090/203307 [1:17:48<7:10:59,  6.66it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31091/203307 [1:17:52<7:11:21,  6.65it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31091/203307 [1:17:52<7:11:21,  6.65it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31092/203307 [1:17:56<7:11:44,  6.65it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31092/203307 [1:17:56<7:11:44,  6.65it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31093/203307 [1:18:00<7:12:06,  6.64it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31093/203307 [1:18:00<7:12:06,  6.64it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31094/203307 [1:18:05<7:12:30,  6.64it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31094/203307 [1:18:05<7:12:30,  6.64it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31095/203307 [1:18:09<7:12:51,  6.63it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31095/203307 [1:18:09<7:12:51,  6.63it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31096/203307 [1:18:14<7:13:15,  6.62it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31096/203307 [1:18:14<7:13:16,  6.62it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31097/203307 [1:18:18<7:13:37,  6.62it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31097/203307 [1:18:18<7:13:37,  6.62it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31098/203307 [1:18:22<7:13:59,  6.61it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31098/203307 [1:18:22<7:13:59,  6.61it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31099/203307 [1:18:26<7:14:21,  6.61it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31099/203307 [1:18:26<7:14:21,  6.61it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31100/203307 [1:18:30<7:14:41,  6.60it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31100/203307 [1:18:30<7:14:41,  6.60it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31101/203307 [1:18:34<7:15:05,  6.60it/s, v_num=line, training/loss=0.0842]Epoch 0:  15%|█▌        | 31101/203307 [1:18:34<7:15:05,  6.60it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31102/203307 [1:18:38<7:15:26,  6.59it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31102/203307 [1:18:38<7:15:26,  6.59it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31103/203307 [1:18:43<7:15:51,  6.58it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31103/203307 [1:18:43<7:15:51,  6.58it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31104/203307 [1:18:47<7:16:11,  6.58it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31104/203307 [1:18:47<7:16:11,  6.58it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31105/203307 [1:18:52<7:16:37,  6.57it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31105/203307 [1:18:52<7:16:37,  6.57it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31106/203307 [1:18:56<7:16:58,  6.57it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31106/203307 [1:18:56<7:16:58,  6.57it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31107/203307 [1:19:00<7:17:20,  6.56it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31107/203307 [1:19:00<7:17:20,  6.56it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31108/203307 [1:19:03<7:17:40,  6.56it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31108/203307 [1:19:04<7:17:40,  6.56it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31109/203307 [1:19:08<7:18:02,  6.55it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31109/203307 [1:19:08<7:18:02,  6.55it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31110/203307 [1:19:12<7:18:25,  6.55it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31110/203307 [1:19:12<7:18:25,  6.55it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31111/203307 [1:19:17<7:18:50,  6.54it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31111/203307 [1:19:17<7:18:50,  6.54it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31112/203307 [1:19:20<7:19:10,  6.53it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31112/203307 [1:19:20<7:19:10,  6.53it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31113/203307 [1:19:24<7:19:31,  6.53it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31113/203307 [1:19:24<7:19:31,  6.53it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31114/203307 [1:19:29<7:19:57,  6.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31114/203307 [1:19:29<7:19:57,  6.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31115/203307 [1:19:33<7:20:18,  6.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31115/203307 [1:19:33<7:20:18,  6.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31116/203307 [1:19:37<7:20:39,  6.51it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31116/203307 [1:19:37<7:20:39,  6.51it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31117/203307 [1:19:41<7:21:01,  6.51it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31117/203307 [1:19:41<7:21:01,  6.51it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31118/203307 [1:19:46<7:21:23,  6.50it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31118/203307 [1:19:46<7:21:23,  6.50it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31119/203307 [1:19:50<7:21:47,  6.50it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31119/203307 [1:19:50<7:21:47,  6.50it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31120/203307 [1:19:55<7:22:11,  6.49it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31120/203307 [1:19:55<7:22:11,  6.49it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31121/203307 [1:19:59<7:22:32,  6.48it/s, v_num=line, training/loss=0.0771]Epoch 0:  15%|█▌        | 31121/203307 [1:19:59<7:22:32,  6.48it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31122/203307 [1:20:03<7:22:58,  6.48it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31122/203307 [1:20:03<7:22:58,  6.48it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31123/203307 [1:20:08<7:23:20,  6.47it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31123/203307 [1:20:08<7:23:20,  6.47it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31124/203307 [1:20:11<7:23:40,  6.47it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31124/203307 [1:20:11<7:23:40,  6.47it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31125/203307 [1:20:15<7:24:01,  6.46it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31125/203307 [1:20:15<7:24:01,  6.46it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31126/203307 [1:20:20<7:24:23,  6.46it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31126/203307 [1:20:20<7:24:23,  6.46it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31127/203307 [1:20:24<7:24:44,  6.45it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31127/203307 [1:20:24<7:24:44,  6.45it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31128/203307 [1:20:28<7:25:08,  6.45it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31128/203307 [1:20:28<7:25:08,  6.45it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31129/203307 [1:20:32<7:25:31,  6.44it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31129/203307 [1:20:32<7:25:31,  6.44it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31130/203307 [1:20:36<7:25:52,  6.44it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31130/203307 [1:20:37<7:25:52,  6.44it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31131/203307 [1:20:41<7:26:18,  6.43it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31131/203307 [1:20:41<7:26:18,  6.43it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31132/203307 [1:20:45<7:26:38,  6.42it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31132/203307 [1:20:45<7:26:38,  6.42it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31133/203307 [1:20:49<7:26:59,  6.42it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31133/203307 [1:20:49<7:26:59,  6.42it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31134/203307 [1:20:53<7:27:21,  6.41it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31134/203307 [1:20:53<7:27:21,  6.41it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31135/203307 [1:20:57<7:27:42,  6.41it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31135/203307 [1:20:57<7:27:42,  6.41it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31136/203307 [1:21:01<7:28:02,  6.40it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31136/203307 [1:21:01<7:28:02,  6.40it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31137/203307 [1:21:05<7:28:26,  6.40it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31137/203307 [1:21:06<7:28:26,  6.40it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31138/203307 [1:21:09<7:28:47,  6.39it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31138/203307 [1:21:09<7:28:47,  6.39it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31139/203307 [1:21:13<7:29:08,  6.39it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31139/203307 [1:21:13<7:29:08,  6.39it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31140/203307 [1:21:18<7:29:32,  6.38it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31140/203307 [1:21:18<7:29:32,  6.38it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31141/203307 [1:21:22<7:29:53,  6.38it/s, v_num=line, training/loss=0.0844]Epoch 0:  15%|█▌        | 31141/203307 [1:21:22<7:29:53,  6.38it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31142/203307 [1:21:26<7:30:14,  6.37it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31142/203307 [1:21:26<7:30:14,  6.37it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31143/203307 [1:21:30<7:30:35,  6.37it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31143/203307 [1:21:30<7:30:35,  6.37it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31144/203307 [1:21:34<7:30:55,  6.36it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31144/203307 [1:21:34<7:30:55,  6.36it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31145/203307 [1:21:38<7:31:16,  6.36it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31145/203307 [1:21:38<7:31:16,  6.36it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31146/203307 [1:21:42<7:31:40,  6.35it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31146/203307 [1:21:42<7:31:40,  6.35it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31147/203307 [1:21:47<7:32:02,  6.35it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31147/203307 [1:21:47<7:32:02,  6.35it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31148/203307 [1:21:51<7:32:27,  6.34it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31148/203307 [1:21:51<7:32:27,  6.34it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31149/203307 [1:21:55<7:32:49,  6.34it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31149/203307 [1:21:55<7:32:49,  6.34it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31150/203307 [1:21:59<7:33:10,  6.33it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31150/203307 [1:21:59<7:33:11,  6.33it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31151/203307 [1:22:04<7:33:33,  6.33it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31151/203307 [1:22:04<7:33:33,  6.33it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31152/203307 [1:22:07<7:33:53,  6.32it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31152/203307 [1:22:07<7:33:53,  6.32it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31153/203307 [1:22:12<7:34:14,  6.32it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31153/203307 [1:22:12<7:34:15,  6.32it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31154/203307 [1:22:16<7:34:36,  6.31it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31154/203307 [1:22:16<7:34:36,  6.31it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31155/203307 [1:22:20<7:35:00,  6.31it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31155/203307 [1:22:20<7:35:00,  6.31it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31156/203307 [1:22:24<7:35:20,  6.30it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31156/203307 [1:22:24<7:35:20,  6.30it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31157/203307 [1:22:29<7:35:46,  6.30it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31157/203307 [1:22:29<7:35:46,  6.30it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31158/203307 [1:22:33<7:36:07,  6.29it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31158/203307 [1:22:33<7:36:07,  6.29it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31159/203307 [1:22:37<7:36:28,  6.29it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31159/203307 [1:22:37<7:36:28,  6.29it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31160/203307 [1:22:41<7:36:48,  6.28it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31160/203307 [1:22:41<7:36:48,  6.28it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31161/203307 [1:22:45<7:37:10,  6.28it/s, v_num=line, training/loss=0.0802]Epoch 0:  15%|█▌        | 31161/203307 [1:22:45<7:37:10,  6.28it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31162/203307 [1:22:49<7:37:32,  6.27it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31162/203307 [1:22:49<7:37:32,  6.27it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31163/203307 [1:22:54<7:37:56,  6.27it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31163/203307 [1:22:54<7:37:56,  6.27it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31164/203307 [1:22:58<7:38:19,  6.26it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31164/203307 [1:22:58<7:38:19,  6.26it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31165/203307 [1:23:02<7:38:41,  6.25it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31165/203307 [1:23:02<7:38:41,  6.25it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31166/203307 [1:23:07<7:39:06,  6.25it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31166/203307 [1:23:07<7:39:06,  6.25it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31167/203307 [1:23:11<7:39:28,  6.24it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31167/203307 [1:23:11<7:39:28,  6.24it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31168/203307 [1:23:15<7:39:48,  6.24it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31168/203307 [1:23:15<7:39:48,  6.24it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31169/203307 [1:23:19<7:40:09,  6.23it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31169/203307 [1:23:19<7:40:09,  6.23it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31170/203307 [1:23:23<7:40:31,  6.23it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31170/203307 [1:23:23<7:40:31,  6.23it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31171/203307 [1:23:27<7:40:52,  6.22it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31171/203307 [1:23:27<7:40:52,  6.22it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31172/203307 [1:23:31<7:41:15,  6.22it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31172/203307 [1:23:31<7:41:15,  6.22it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31173/203307 [1:23:36<7:41:38,  6.21it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31173/203307 [1:23:36<7:41:38,  6.21it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31174/203307 [1:23:40<7:42:03,  6.21it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31174/203307 [1:23:40<7:42:03,  6.21it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31175/203307 [1:23:44<7:42:24,  6.20it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31175/203307 [1:23:44<7:42:24,  6.20it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31176/203307 [1:23:48<7:42:44,  6.20it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31176/203307 [1:23:48<7:42:44,  6.20it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31177/203307 [1:23:52<7:43:06,  6.19it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31177/203307 [1:23:52<7:43:06,  6.19it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31178/203307 [1:23:56<7:43:27,  6.19it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31178/203307 [1:23:56<7:43:27,  6.19it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31179/203307 [1:24:00<7:43:49,  6.19it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31179/203307 [1:24:00<7:43:49,  6.19it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31180/203307 [1:24:04<7:44:09,  6.18it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31180/203307 [1:24:04<7:44:09,  6.18it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31181/203307 [1:24:09<7:44:32,  6.18it/s, v_num=line, training/loss=0.0943]Epoch 0:  15%|█▌        | 31181/203307 [1:24:09<7:44:32,  6.18it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31182/203307 [1:24:13<7:44:56,  6.17it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31182/203307 [1:24:13<7:44:56,  6.17it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31183/203307 [1:24:18<7:45:21,  6.16it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31183/203307 [1:24:18<7:45:21,  6.16it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31184/203307 [1:24:22<7:45:42,  6.16it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31184/203307 [1:24:22<7:45:42,  6.16it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31185/203307 [1:24:26<7:46:03,  6.16it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31185/203307 [1:24:26<7:46:03,  6.16it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31186/203307 [1:24:30<7:46:25,  6.15it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31186/203307 [1:24:30<7:46:25,  6.15it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31187/203307 [1:24:34<7:46:46,  6.15it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31187/203307 [1:24:34<7:46:46,  6.15it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31188/203307 [1:24:38<7:47:06,  6.14it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31188/203307 [1:24:38<7:47:06,  6.14it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31189/203307 [1:24:42<7:47:30,  6.14it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31189/203307 [1:24:42<7:47:30,  6.14it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31190/203307 [1:24:46<7:47:51,  6.13it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31190/203307 [1:24:46<7:47:51,  6.13it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31191/203307 [1:24:51<7:48:14,  6.13it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31191/203307 [1:24:51<7:48:14,  6.13it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31192/203307 [1:24:56<7:48:39,  6.12it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31192/203307 [1:24:56<7:48:39,  6.12it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31193/203307 [1:25:00<7:49:00,  6.12it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31193/203307 [1:25:00<7:49:00,  6.12it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31194/203307 [1:25:04<7:49:22,  6.11it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31194/203307 [1:25:04<7:49:22,  6.11it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31195/203307 [1:25:08<7:49:43,  6.11it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31195/203307 [1:25:08<7:49:43,  6.11it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31196/203307 [1:25:12<7:50:03,  6.10it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31196/203307 [1:25:12<7:50:03,  6.10it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31197/203307 [1:25:16<7:50:25,  6.10it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31197/203307 [1:25:16<7:50:25,  6.10it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31198/203307 [1:25:20<7:50:49,  6.09it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31198/203307 [1:25:20<7:50:49,  6.09it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31199/203307 [1:25:24<7:51:10,  6.09it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31199/203307 [1:25:24<7:51:10,  6.09it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31200/203307 [1:25:29<7:51:35,  6.08it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31200/203307 [1:25:29<7:51:35,  6.08it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31201/203307 [1:25:33<7:51:56,  6.08it/s, v_num=line, training/loss=0.0748]Epoch 0:  15%|█▌        | 31201/203307 [1:25:33<7:51:56,  6.08it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31202/203307 [1:25:37<7:52:17,  6.07it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31202/203307 [1:25:37<7:52:17,  6.07it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31203/203307 [1:25:41<7:52:39,  6.07it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31203/203307 [1:25:41<7:52:39,  6.07it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31204/203307 [1:25:45<7:52:59,  6.06it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31204/203307 [1:25:45<7:52:59,  6.06it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31205/203307 [1:25:49<7:53:20,  6.06it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31205/203307 [1:25:49<7:53:20,  6.06it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31206/203307 [1:25:53<7:53:42,  6.06it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31206/203307 [1:25:53<7:53:42,  6.06it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31207/203307 [1:25:58<7:54:06,  6.05it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31207/203307 [1:25:58<7:54:06,  6.05it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31208/203307 [1:26:01<7:54:25,  6.05it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31208/203307 [1:26:01<7:54:25,  6.05it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31209/203307 [1:26:06<7:54:51,  6.04it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31209/203307 [1:26:06<7:54:51,  6.04it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31210/203307 [1:26:10<7:55:12,  6.04it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31210/203307 [1:26:10<7:55:12,  6.04it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31211/203307 [1:26:14<7:55:33,  6.03it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31211/203307 [1:26:14<7:55:33,  6.03it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31212/203307 [1:26:18<7:55:53,  6.03it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31212/203307 [1:26:18<7:55:53,  6.03it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31213/203307 [1:26:22<7:56:15,  6.02it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31213/203307 [1:26:22<7:56:15,  6.02it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31214/203307 [1:26:26<7:56:36,  6.02it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31214/203307 [1:26:26<7:56:36,  6.02it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31215/203307 [1:26:31<7:57:00,  6.01it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31215/203307 [1:26:31<7:57:00,  6.01it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31216/203307 [1:26:35<7:57:19,  6.01it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31216/203307 [1:26:35<7:57:19,  6.01it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31217/203307 [1:26:39<7:57:40,  6.00it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31217/203307 [1:26:39<7:57:41,  6.00it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31218/203307 [1:26:43<7:58:06,  6.00it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31218/203307 [1:26:43<7:58:06,  6.00it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31219/203307 [1:26:47<7:58:27,  5.99it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31219/203307 [1:26:47<7:58:27,  5.99it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31220/203307 [1:26:51<7:58:47,  5.99it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31220/203307 [1:26:51<7:58:47,  5.99it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31221/203307 [1:26:55<7:59:08,  5.99it/s, v_num=line, training/loss=0.0851]Epoch 0:  15%|█▌        | 31221/203307 [1:26:55<7:59:08,  5.99it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31222/203307 [1:26:59<7:59:29,  5.98it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31222/203307 [1:26:59<7:59:29,  5.98it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31223/203307 [1:27:03<7:59:50,  5.98it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31223/203307 [1:27:03<7:59:50,  5.98it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31224/203307 [1:27:08<8:00:14,  5.97it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31224/203307 [1:27:08<8:00:14,  5.97it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31225/203307 [1:27:12<8:00:34,  5.97it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31225/203307 [1:27:12<8:00:34,  5.97it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31226/203307 [1:27:16<8:00:59,  5.96it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31226/203307 [1:27:16<8:00:59,  5.96it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31227/203307 [1:27:21<8:01:23,  5.96it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31227/203307 [1:27:21<8:01:23,  5.96it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31228/203307 [1:27:25<8:01:43,  5.95it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31228/203307 [1:27:25<8:01:43,  5.95it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31229/203307 [1:27:29<8:02:04,  5.95it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31229/203307 [1:27:29<8:02:04,  5.95it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31230/203307 [1:27:33<8:02:25,  5.94it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31230/203307 [1:27:33<8:02:25,  5.94it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31231/203307 [1:27:37<8:02:46,  5.94it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31231/203307 [1:27:37<8:02:46,  5.94it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31232/203307 [1:27:41<8:03:06,  5.94it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31232/203307 [1:27:41<8:03:06,  5.94it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31233/203307 [1:27:45<8:03:30,  5.93it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31233/203307 [1:27:45<8:03:30,  5.93it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31234/203307 [1:27:49<8:03:51,  5.93it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31234/203307 [1:27:49<8:03:51,  5.93it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31235/203307 [1:27:54<8:04:17,  5.92it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31235/203307 [1:27:54<8:04:17,  5.92it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31236/203307 [1:27:58<8:04:40,  5.92it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31236/203307 [1:27:59<8:04:40,  5.92it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31237/203307 [1:28:03<8:05:02,  5.91it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31237/203307 [1:28:03<8:05:02,  5.91it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31238/203307 [1:28:07<8:05:23,  5.91it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31238/203307 [1:28:07<8:05:23,  5.91it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31239/203307 [1:28:11<8:05:44,  5.90it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31239/203307 [1:28:11<8:05:45,  5.90it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31240/203307 [1:28:15<8:06:04,  5.90it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31240/203307 [1:28:15<8:06:04,  5.90it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31241/203307 [1:28:19<8:06:28,  5.90it/s, v_num=line, training/loss=0.0854]Epoch 0:  15%|█▌        | 31241/203307 [1:28:19<8:06:28,  5.90it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31242/203307 [1:28:23<8:06:48,  5.89it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31242/203307 [1:28:23<8:06:48,  5.89it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31243/203307 [1:28:27<8:07:09,  5.89it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31243/203307 [1:28:27<8:07:09,  5.89it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31244/203307 [1:28:32<8:07:33,  5.88it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31244/203307 [1:28:32<8:07:33,  5.88it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31245/203307 [1:28:36<8:07:56,  5.88it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31245/203307 [1:28:36<8:07:56,  5.88it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31246/203307 [1:28:40<8:08:17,  5.87it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31246/203307 [1:28:40<8:08:17,  5.87it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31247/203307 [1:28:44<8:08:39,  5.87it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31247/203307 [1:28:44<8:08:39,  5.87it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31248/203307 [1:28:48<8:08:58,  5.86it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31248/203307 [1:28:48<8:08:59,  5.86it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31249/203307 [1:28:52<8:09:20,  5.86it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31249/203307 [1:28:52<8:09:20,  5.86it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31250/203307 [1:28:57<8:09:44,  5.86it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31250/203307 [1:28:57<8:09:44,  5.86it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31251/203307 [1:29:01<8:10:06,  5.85it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31251/203307 [1:29:01<8:10:06,  5.85it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31252/203307 [1:29:05<8:10:30,  5.85it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31252/203307 [1:29:05<8:10:30,  5.85it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31253/203307 [1:29:09<8:10:51,  5.84it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31253/203307 [1:29:09<8:10:51,  5.84it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31254/203307 [1:29:14<8:11:15,  5.84it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31254/203307 [1:29:14<8:11:15,  5.84it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31255/203307 [1:29:18<8:11:36,  5.83it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31255/203307 [1:29:18<8:11:36,  5.83it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31256/203307 [1:29:22<8:11:55,  5.83it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31256/203307 [1:29:22<8:11:56,  5.83it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31257/203307 [1:29:26<8:12:17,  5.82it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31257/203307 [1:29:26<8:12:17,  5.82it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31258/203307 [1:29:30<8:12:38,  5.82it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31258/203307 [1:29:30<8:12:38,  5.82it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31259/203307 [1:29:34<8:13:02,  5.82it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31259/203307 [1:29:34<8:13:02,  5.82it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31260/203307 [1:29:38<8:13:21,  5.81it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31260/203307 [1:29:38<8:13:21,  5.81it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31261/203307 [1:29:43<8:13:47,  5.81it/s, v_num=line, training/loss=0.0849]Epoch 0:  15%|█▌        | 31261/203307 [1:29:43<8:13:47,  5.81it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31262/203307 [1:29:47<8:14:09,  5.80it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31262/203307 [1:29:47<8:14:09,  5.80it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31263/203307 [1:29:51<8:14:32,  5.80it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31263/203307 [1:29:51<8:14:32,  5.80it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31264/203307 [1:29:55<8:14:51,  5.79it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31264/203307 [1:29:55<8:14:51,  5.79it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31265/203307 [1:29:59<8:15:12,  5.79it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31265/203307 [1:29:59<8:15:12,  5.79it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31266/203307 [1:30:03<8:15:34,  5.79it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31266/203307 [1:30:03<8:15:34,  5.79it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31267/203307 [1:30:08<8:15:58,  5.78it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31267/203307 [1:30:08<8:15:58,  5.78it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31268/203307 [1:30:12<8:16:17,  5.78it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31268/203307 [1:30:12<8:16:17,  5.78it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31269/203307 [1:30:16<8:16:39,  5.77it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31269/203307 [1:30:16<8:16:39,  5.77it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31270/203307 [1:30:21<8:17:04,  5.77it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31270/203307 [1:30:21<8:17:05,  5.77it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31271/203307 [1:30:25<8:17:26,  5.76it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31271/203307 [1:30:25<8:17:26,  5.76it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31272/203307 [1:30:29<8:17:49,  5.76it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31272/203307 [1:30:29<8:17:49,  5.76it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31273/203307 [1:30:33<8:18:10,  5.76it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31273/203307 [1:30:33<8:18:10,  5.76it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31274/203307 [1:30:37<8:18:31,  5.75it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31274/203307 [1:30:37<8:18:31,  5.75it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31275/203307 [1:30:41<8:18:52,  5.75it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31275/203307 [1:30:41<8:18:52,  5.75it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31276/203307 [1:30:46<8:19:15,  5.74it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31276/203307 [1:30:46<8:19:15,  5.74it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31277/203307 [1:30:50<8:19:36,  5.74it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31277/203307 [1:30:50<8:19:36,  5.74it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31278/203307 [1:30:54<8:20:01,  5.73it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31278/203307 [1:30:54<8:20:01,  5.73it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31279/203307 [1:30:58<8:20:23,  5.73it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31279/203307 [1:30:58<8:20:23,  5.73it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31280/203307 [1:31:02<8:20:42,  5.73it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31280/203307 [1:31:02<8:20:42,  5.73it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31281/203307 [1:31:07<8:21:06,  5.72it/s, v_num=line, training/loss=0.0799]Epoch 0:  15%|█▌        | 31281/203307 [1:31:07<8:21:06,  5.72it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31282/203307 [1:31:11<8:21:27,  5.72it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31282/203307 [1:31:11<8:21:27,  5.72it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31283/203307 [1:31:15<8:21:48,  5.71it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31283/203307 [1:31:15<8:21:48,  5.71it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31284/203307 [1:31:19<8:22:08,  5.71it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31284/203307 [1:31:19<8:22:08,  5.71it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31285/203307 [1:31:23<8:22:31,  5.71it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31285/203307 [1:31:23<8:22:31,  5.71it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31286/203307 [1:31:27<8:22:52,  5.70it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31286/203307 [1:31:27<8:22:52,  5.70it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31287/203307 [1:31:32<8:23:18,  5.70it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31287/203307 [1:31:32<8:23:18,  5.70it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31288/203307 [1:31:36<8:23:37,  5.69it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31288/203307 [1:31:36<8:23:38,  5.69it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31289/203307 [1:31:40<8:23:59,  5.69it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31289/203307 [1:31:40<8:24:00,  5.69it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31290/203307 [1:31:45<8:24:23,  5.68it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31290/203307 [1:31:45<8:24:23,  5.68it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31291/203307 [1:31:49<8:24:45,  5.68it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31291/203307 [1:31:49<8:24:45,  5.68it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31292/203307 [1:31:52<8:25:05,  5.68it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31292/203307 [1:31:52<8:25:05,  5.68it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31293/203307 [1:31:57<8:25:29,  5.67it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31293/203307 [1:31:57<8:25:29,  5.67it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31294/203307 [1:32:01<8:25:50,  5.67it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31294/203307 [1:32:01<8:25:50,  5.67it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31295/203307 [1:32:05<8:26:10,  5.66it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31295/203307 [1:32:05<8:26:10,  5.66it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31296/203307 [1:32:10<8:26:34,  5.66it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31296/203307 [1:32:10<8:26:34,  5.66it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31297/203307 [1:32:14<8:26:55,  5.66it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31297/203307 [1:32:14<8:26:55,  5.66it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31298/203307 [1:32:18<8:27:17,  5.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31298/203307 [1:32:18<8:27:17,  5.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31299/203307 [1:32:22<8:27:40,  5.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31299/203307 [1:32:22<8:27:40,  5.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31300/203307 [1:32:26<8:27:59,  5.64it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31300/203307 [1:32:26<8:28:00,  5.64it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31301/203307 [1:32:30<8:28:21,  5.64it/s, v_num=line, training/loss=0.0857]Epoch 0:  15%|█▌        | 31301/203307 [1:32:30<8:28:21,  5.64it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31302/203307 [1:32:35<8:28:45,  5.63it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31302/203307 [1:32:35<8:28:45,  5.63it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31303/203307 [1:32:39<8:29:06,  5.63it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31303/203307 [1:32:39<8:29:06,  5.63it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31304/203307 [1:32:43<8:29:29,  5.63it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31304/203307 [1:32:43<8:29:29,  5.63it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31305/203307 [1:32:47<8:29:51,  5.62it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31305/203307 [1:32:47<8:29:51,  5.62it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31306/203307 [1:32:51<8:30:12,  5.62it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31306/203307 [1:32:51<8:30:12,  5.62it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31307/203307 [1:32:55<8:30:33,  5.61it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31307/203307 [1:32:55<8:30:33,  5.61it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31308/203307 [1:33:00<8:30:57,  5.61it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31308/203307 [1:33:00<8:30:57,  5.61it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31309/203307 [1:33:04<8:31:18,  5.61it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31309/203307 [1:33:04<8:31:18,  5.61it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31310/203307 [1:33:08<8:31:39,  5.60it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31310/203307 [1:33:08<8:31:39,  5.60it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31311/203307 [1:33:13<8:32:04,  5.60it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31311/203307 [1:33:13<8:32:04,  5.60it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31312/203307 [1:33:17<8:32:25,  5.59it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31312/203307 [1:33:17<8:32:25,  5.59it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31313/203307 [1:33:22<8:32:50,  5.59it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31313/203307 [1:33:22<8:32:50,  5.59it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31314/203307 [1:33:26<8:33:11,  5.59it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31314/203307 [1:33:26<8:33:11,  5.59it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31315/203307 [1:33:29<8:33:31,  5.58it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31315/203307 [1:33:30<8:33:31,  5.58it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31316/203307 [1:33:33<8:33:51,  5.58it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31316/203307 [1:33:33<8:33:51,  5.58it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31317/203307 [1:33:38<8:34:15,  5.57it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31317/203307 [1:33:38<8:34:15,  5.57it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31318/203307 [1:33:42<8:34:36,  5.57it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31318/203307 [1:33:42<8:34:36,  5.57it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31319/203307 [1:33:46<8:35:00,  5.57it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31319/203307 [1:33:46<8:35:00,  5.57it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31320/203307 [1:33:50<8:35:20,  5.56it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31320/203307 [1:33:50<8:35:20,  5.56it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31321/203307 [1:33:54<8:35:42,  5.56it/s, v_num=line, training/loss=0.0856]Epoch 0:  15%|█▌        | 31321/203307 [1:33:54<8:35:42,  5.56it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31322/203307 [1:33:59<8:36:07,  5.55it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31322/203307 [1:33:59<8:36:07,  5.55it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31323/203307 [1:34:03<8:36:27,  5.55it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31323/203307 [1:34:03<8:36:27,  5.55it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31324/203307 [1:34:07<8:36:47,  5.55it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31324/203307 [1:34:07<8:36:47,  5.55it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31325/203307 [1:34:11<8:37:08,  5.54it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31325/203307 [1:34:11<8:37:08,  5.54it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31326/203307 [1:34:16<8:37:32,  5.54it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31326/203307 [1:34:16<8:37:32,  5.54it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31327/203307 [1:34:20<8:37:53,  5.53it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31327/203307 [1:34:20<8:37:54,  5.53it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31328/203307 [1:34:24<8:38:16,  5.53it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31328/203307 [1:34:24<8:38:16,  5.53it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31329/203307 [1:34:28<8:38:38,  5.53it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31329/203307 [1:34:28<8:38:38,  5.53it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31330/203307 [1:34:33<8:39:03,  5.52it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31330/203307 [1:34:33<8:39:03,  5.52it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31331/203307 [1:34:37<8:39:23,  5.52it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31331/203307 [1:34:37<8:39:23,  5.52it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31332/203307 [1:34:41<8:39:43,  5.51it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31332/203307 [1:34:41<8:39:43,  5.51it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31333/203307 [1:34:45<8:40:05,  5.51it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31333/203307 [1:34:45<8:40:05,  5.51it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31334/203307 [1:34:49<8:40:26,  5.51it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31334/203307 [1:34:49<8:40:26,  5.51it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31335/203307 [1:34:54<8:40:50,  5.50it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31335/203307 [1:34:54<8:40:50,  5.50it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31336/203307 [1:34:58<8:41:10,  5.50it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31336/203307 [1:34:58<8:41:10,  5.50it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31337/203307 [1:35:02<8:41:35,  5.50it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31337/203307 [1:35:02<8:41:35,  5.50it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31338/203307 [1:35:06<8:41:56,  5.49it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31338/203307 [1:35:06<8:41:56,  5.49it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31339/203307 [1:35:11<8:42:20,  5.49it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31339/203307 [1:35:11<8:42:20,  5.49it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31340/203307 [1:35:15<8:42:39,  5.48it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31340/203307 [1:35:15<8:42:40,  5.48it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31341/203307 [1:35:19<8:43:01,  5.48it/s, v_num=line, training/loss=0.0772]Epoch 0:  15%|█▌        | 31341/203307 [1:35:19<8:43:01,  5.48it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31342/203307 [1:35:23<8:43:22,  5.48it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31342/203307 [1:35:23<8:43:22,  5.48it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31343/203307 [1:35:27<8:43:43,  5.47it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31343/203307 [1:35:27<8:43:43,  5.47it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31344/203307 [1:35:31<8:44:06,  5.47it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31344/203307 [1:35:31<8:44:07,  5.47it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31345/203307 [1:35:36<8:44:29,  5.46it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31345/203307 [1:35:36<8:44:29,  5.46it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31346/203307 [1:35:40<8:44:50,  5.46it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31346/203307 [1:35:40<8:44:51,  5.46it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31347/203307 [1:35:44<8:45:10,  5.46it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31347/203307 [1:35:44<8:45:10,  5.46it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31348/203307 [1:35:48<8:45:34,  5.45it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31348/203307 [1:35:48<8:45:34,  5.45it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31349/203307 [1:35:52<8:45:56,  5.45it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31349/203307 [1:35:52<8:45:56,  5.45it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31350/203307 [1:35:56<8:46:17,  5.45it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31350/203307 [1:35:56<8:46:17,  5.45it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31351/203307 [1:36:00<8:46:36,  5.44it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31351/203307 [1:36:00<8:46:36,  5.44it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31352/203307 [1:36:04<8:46:56,  5.44it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31352/203307 [1:36:04<8:46:56,  5.44it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31353/203307 [1:36:09<8:47:21,  5.43it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31353/203307 [1:36:09<8:47:21,  5.43it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31354/203307 [1:36:13<8:47:45,  5.43it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31354/203307 [1:36:13<8:47:45,  5.43it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31355/203307 [1:36:17<8:48:05,  5.43it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31355/203307 [1:36:17<8:48:05,  5.43it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31356/203307 [1:36:22<8:48:29,  5.42it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31356/203307 [1:36:22<8:48:29,  5.42it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31357/203307 [1:36:26<8:48:50,  5.42it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31357/203307 [1:36:26<8:48:50,  5.42it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31358/203307 [1:36:30<8:49:11,  5.42it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31358/203307 [1:36:30<8:49:11,  5.42it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31359/203307 [1:36:34<8:49:31,  5.41it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31359/203307 [1:36:34<8:49:31,  5.41it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31360/203307 [1:36:38<8:49:51,  5.41it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31360/203307 [1:36:38<8:49:51,  5.41it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31361/203307 [1:36:42<8:50:12,  5.40it/s, v_num=line, training/loss=0.0863]Epoch 0:  15%|█▌        | 31361/203307 [1:36:42<8:50:12,  5.40it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31362/203307 [1:36:46<8:50:36,  5.40it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31362/203307 [1:36:46<8:50:36,  5.40it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31363/203307 [1:36:51<8:50:59,  5.40it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31363/203307 [1:36:51<8:50:59,  5.40it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31364/203307 [1:36:54<8:51:18,  5.39it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31364/203307 [1:36:54<8:51:18,  5.39it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31365/203307 [1:36:59<8:51:43,  5.39it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31365/203307 [1:36:59<8:51:43,  5.39it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31366/203307 [1:37:03<8:52:04,  5.39it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31366/203307 [1:37:03<8:52:04,  5.39it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31367/203307 [1:37:07<8:52:23,  5.38it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31367/203307 [1:37:07<8:52:23,  5.38it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31368/203307 [1:37:11<8:52:43,  5.38it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31368/203307 [1:37:11<8:52:43,  5.38it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31369/203307 [1:37:15<8:53:04,  5.38it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31369/203307 [1:37:15<8:53:04,  5.38it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31370/203307 [1:37:19<8:53:25,  5.37it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31370/203307 [1:37:19<8:53:25,  5.37it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31371/203307 [1:37:23<8:53:48,  5.37it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31371/203307 [1:37:23<8:53:48,  5.37it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31372/203307 [1:37:27<8:54:07,  5.36it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31372/203307 [1:37:27<8:54:07,  5.36it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31373/203307 [1:37:31<8:54:28,  5.36it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31373/203307 [1:37:31<8:54:28,  5.36it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31374/203307 [1:37:36<8:54:53,  5.36it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31374/203307 [1:37:36<8:54:53,  5.36it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31375/203307 [1:37:40<8:55:13,  5.35it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31375/203307 [1:37:40<8:55:13,  5.35it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31376/203307 [1:37:43<8:55:32,  5.35it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31376/203307 [1:37:43<8:55:32,  5.35it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31377/203307 [1:37:48<8:55:54,  5.35it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31377/203307 [1:37:48<8:55:54,  5.35it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31378/203307 [1:37:52<8:56:15,  5.34it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31378/203307 [1:37:52<8:56:15,  5.34it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31379/203307 [1:37:56<8:56:35,  5.34it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31379/203307 [1:37:56<8:56:35,  5.34it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31380/203307 [1:38:00<8:56:58,  5.34it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31380/203307 [1:38:00<8:56:58,  5.34it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31381/203307 [1:38:04<8:57:20,  5.33it/s, v_num=line, training/loss=0.0848]Epoch 0:  15%|█▌        | 31381/203307 [1:38:04<8:57:20,  5.33it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31382/203307 [1:38:09<8:57:45,  5.33it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31382/203307 [1:38:09<8:57:45,  5.33it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31383/203307 [1:38:13<8:58:04,  5.33it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31383/203307 [1:38:13<8:58:04,  5.33it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31384/203307 [1:38:16<8:58:23,  5.32it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31384/203307 [1:38:16<8:58:23,  5.32it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31385/203307 [1:38:20<8:58:44,  5.32it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31385/203307 [1:38:20<8:58:44,  5.32it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31386/203307 [1:38:24<8:59:05,  5.32it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31386/203307 [1:38:25<8:59:05,  5.32it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31387/203307 [1:38:28<8:59:24,  5.31it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31387/203307 [1:38:28<8:59:24,  5.31it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31388/203307 [1:38:32<8:59:44,  5.31it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31388/203307 [1:38:32<8:59:44,  5.31it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31389/203307 [1:38:37<9:00:07,  5.30it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31389/203307 [1:38:37<9:00:07,  5.30it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31390/203307 [1:38:41<9:00:28,  5.30it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31390/203307 [1:38:41<9:00:29,  5.30it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31391/203307 [1:38:45<9:00:52,  5.30it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31391/203307 [1:38:45<9:00:52,  5.30it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31392/203307 [1:38:49<9:01:12,  5.29it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31392/203307 [1:38:49<9:01:12,  5.29it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31393/203307 [1:38:53<9:01:33,  5.29it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31393/203307 [1:38:53<9:01:33,  5.29it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31394/203307 [1:38:57<9:01:53,  5.29it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31394/203307 [1:38:57<9:01:53,  5.29it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31395/203307 [1:39:01<9:02:13,  5.28it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31395/203307 [1:39:01<9:02:13,  5.28it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31396/203307 [1:39:05<9:02:33,  5.28it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31396/203307 [1:39:05<9:02:33,  5.28it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31397/203307 [1:39:09<9:02:56,  5.28it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31397/203307 [1:39:09<9:02:56,  5.28it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31398/203307 [1:39:14<9:03:19,  5.27it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31398/203307 [1:39:14<9:03:19,  5.27it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31399/203307 [1:39:17<9:03:39,  5.27it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31399/203307 [1:39:17<9:03:39,  5.27it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31400/203307 [1:39:22<9:04:02,  5.27it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31400/203307 [1:39:22<9:04:02,  5.27it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31401/203307 [1:39:26<9:04:24,  5.26it/s, v_num=line, training/loss=0.0871]Epoch 0:  15%|█▌        | 31401/203307 [1:39:26<9:04:24,  5.26it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31402/203307 [1:39:30<9:04:45,  5.26it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31402/203307 [1:39:30<9:04:45,  5.26it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31403/203307 [1:39:34<9:05:04,  5.26it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31403/203307 [1:39:34<9:05:04,  5.26it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31404/203307 [1:39:38<9:05:24,  5.25it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31404/203307 [1:39:38<9:05:24,  5.25it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31405/203307 [1:39:42<9:05:45,  5.25it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31405/203307 [1:39:42<9:05:45,  5.25it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31406/203307 [1:39:46<9:06:09,  5.25it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31406/203307 [1:39:46<9:06:09,  5.25it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31407/203307 [1:39:51<9:06:32,  5.24it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31407/203307 [1:39:51<9:06:32,  5.24it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31408/203307 [1:39:55<9:06:55,  5.24it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31408/203307 [1:39:55<9:06:55,  5.24it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31409/203307 [1:39:59<9:07:16,  5.23it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31409/203307 [1:39:59<9:07:16,  5.23it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31410/203307 [1:40:03<9:07:37,  5.23it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31410/203307 [1:40:03<9:07:37,  5.23it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31411/203307 [1:40:07<9:07:57,  5.23it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31411/203307 [1:40:07<9:07:57,  5.23it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31412/203307 [1:40:11<9:08:17,  5.23it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31412/203307 [1:40:11<9:08:17,  5.23it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31413/203307 [1:40:15<9:08:38,  5.22it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31413/203307 [1:40:15<9:08:38,  5.22it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31414/203307 [1:40:19<9:08:59,  5.22it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31414/203307 [1:40:19<9:08:59,  5.22it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31415/203307 [1:40:24<9:09:22,  5.21it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31415/203307 [1:40:24<9:09:22,  5.21it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31416/203307 [1:40:28<9:09:45,  5.21it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31416/203307 [1:40:28<9:09:45,  5.21it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31417/203307 [1:40:33<9:10:10,  5.21it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31417/203307 [1:40:33<9:10:10,  5.21it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31418/203307 [1:40:37<9:10:31,  5.20it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31418/203307 [1:40:37<9:10:31,  5.20it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31419/203307 [1:40:41<9:10:50,  5.20it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31419/203307 [1:40:41<9:10:51,  5.20it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31420/203307 [1:40:45<9:11:11,  5.20it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31420/203307 [1:40:45<9:11:11,  5.20it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31421/203307 [1:40:49<9:11:31,  5.19it/s, v_num=line, training/loss=0.0866]Epoch 0:  15%|█▌        | 31421/203307 [1:40:49<9:11:31,  5.19it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31422/203307 [1:40:53<9:11:52,  5.19it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31422/203307 [1:40:53<9:11:52,  5.19it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31423/203307 [1:40:57<9:12:15,  5.19it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31423/203307 [1:40:57<9:12:15,  5.19it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31424/203307 [1:41:01<9:12:35,  5.18it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31424/203307 [1:41:01<9:12:35,  5.18it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31425/203307 [1:41:06<9:12:58,  5.18it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31425/203307 [1:41:06<9:12:58,  5.18it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31426/203307 [1:41:10<9:13:23,  5.18it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31426/203307 [1:41:10<9:13:23,  5.18it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31427/203307 [1:41:14<9:13:43,  5.17it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31427/203307 [1:41:14<9:13:43,  5.17it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31428/203307 [1:41:18<9:14:02,  5.17it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31428/203307 [1:41:18<9:14:02,  5.17it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31429/203307 [1:41:22<9:14:24,  5.17it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31429/203307 [1:41:22<9:14:24,  5.17it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31430/203307 [1:41:26<9:14:45,  5.16it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31430/203307 [1:41:26<9:14:45,  5.16it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31431/203307 [1:41:30<9:15:05,  5.16it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31431/203307 [1:41:30<9:15:05,  5.16it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31432/203307 [1:41:34<9:15:28,  5.16it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31432/203307 [1:41:34<9:15:28,  5.16it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31433/203307 [1:41:38<9:15:48,  5.15it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31433/203307 [1:41:38<9:15:48,  5.15it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31434/203307 [1:41:43<9:16:13,  5.15it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31434/203307 [1:41:43<9:16:13,  5.15it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31435/203307 [1:41:47<9:16:33,  5.15it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31435/203307 [1:41:47<9:16:33,  5.15it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31436/203307 [1:41:51<9:16:52,  5.14it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31436/203307 [1:41:51<9:16:52,  5.14it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31437/203307 [1:41:55<9:17:12,  5.14it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31437/203307 [1:41:55<9:17:13,  5.14it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31438/203307 [1:41:59<9:17:34,  5.14it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31438/203307 [1:41:59<9:17:34,  5.14it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31439/203307 [1:42:03<9:17:53,  5.13it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31439/203307 [1:42:03<9:17:53,  5.13it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31440/203307 [1:42:06<9:18:12,  5.13it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31440/203307 [1:42:06<9:18:12,  5.13it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31441/203307 [1:42:11<9:18:35,  5.13it/s, v_num=line, training/loss=0.0912]Epoch 0:  15%|█▌        | 31441/203307 [1:42:11<9:18:35,  5.13it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31442/203307 [1:42:15<9:18:56,  5.12it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31442/203307 [1:42:15<9:18:56,  5.12it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31443/203307 [1:42:19<9:19:19,  5.12it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31443/203307 [1:42:19<9:19:19,  5.12it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31444/203307 [1:42:23<9:19:39,  5.12it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31444/203307 [1:42:23<9:19:39,  5.12it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31445/203307 [1:42:27<9:19:59,  5.11it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31445/203307 [1:42:27<9:19:59,  5.11it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31446/203307 [1:42:31<9:20:20,  5.11it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31446/203307 [1:42:31<9:20:20,  5.11it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31447/203307 [1:42:35<9:20:39,  5.11it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31447/203307 [1:42:35<9:20:39,  5.11it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31448/203307 [1:42:39<9:20:59,  5.11it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31448/203307 [1:42:39<9:20:59,  5.11it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31449/203307 [1:42:43<9:21:23,  5.10it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31449/203307 [1:42:43<9:21:23,  5.10it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31450/203307 [1:42:47<9:21:43,  5.10it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31450/203307 [1:42:47<9:21:43,  5.10it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31451/203307 [1:42:51<9:22:03,  5.10it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31451/203307 [1:42:51<9:22:03,  5.10it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31452/203307 [1:42:56<9:22:26,  5.09it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31452/203307 [1:42:56<9:22:26,  5.09it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31453/203307 [1:43:00<9:22:47,  5.09it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31453/203307 [1:43:00<9:22:47,  5.09it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31454/203307 [1:43:04<9:23:08,  5.09it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31454/203307 [1:43:04<9:23:08,  5.09it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31455/203307 [1:43:08<9:23:28,  5.08it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31455/203307 [1:43:08<9:23:28,  5.08it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31456/203307 [1:43:11<9:23:47,  5.08it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31456/203307 [1:43:11<9:23:47,  5.08it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31457/203307 [1:43:15<9:24:08,  5.08it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31457/203307 [1:43:15<9:24:08,  5.08it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31458/203307 [1:43:20<9:24:32,  5.07it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31458/203307 [1:43:20<9:24:32,  5.07it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31459/203307 [1:43:24<9:24:51,  5.07it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31459/203307 [1:43:24<9:24:51,  5.07it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31460/203307 [1:43:28<9:25:14,  5.07it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31460/203307 [1:43:28<9:25:14,  5.07it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31461/203307 [1:43:33<9:25:37,  5.06it/s, v_num=line, training/loss=0.0884]Epoch 0:  15%|█▌        | 31461/203307 [1:43:33<9:25:37,  5.06it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31462/203307 [1:43:37<9:25:58,  5.06it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31462/203307 [1:43:37<9:25:58,  5.06it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31463/203307 [1:43:41<9:26:18,  5.06it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31463/203307 [1:43:41<9:26:18,  5.06it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31464/203307 [1:43:45<9:26:38,  5.05it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31464/203307 [1:43:45<9:26:38,  5.05it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31465/203307 [1:43:49<9:26:59,  5.05it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31465/203307 [1:43:49<9:26:59,  5.05it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31466/203307 [1:43:53<9:27:21,  5.05it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31466/203307 [1:43:53<9:27:21,  5.05it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31467/203307 [1:43:57<9:27:43,  5.04it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31467/203307 [1:43:57<9:27:43,  5.04it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31468/203307 [1:44:01<9:28:03,  5.04it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31468/203307 [1:44:01<9:28:03,  5.04it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31469/203307 [1:44:06<9:28:28,  5.04it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31469/203307 [1:44:06<9:28:28,  5.04it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31470/203307 [1:44:10<9:28:51,  5.03it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31470/203307 [1:44:10<9:28:51,  5.03it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31471/203307 [1:44:14<9:29:11,  5.03it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31471/203307 [1:44:14<9:29:11,  5.03it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31472/203307 [1:44:18<9:29:31,  5.03it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31472/203307 [1:44:18<9:29:31,  5.03it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31473/203307 [1:44:22<9:29:52,  5.03it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31473/203307 [1:44:22<9:29:52,  5.03it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31474/203307 [1:44:26<9:30:13,  5.02it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31474/203307 [1:44:26<9:30:13,  5.02it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31475/203307 [1:44:31<9:30:36,  5.02it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31475/203307 [1:44:31<9:30:36,  5.02it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31476/203307 [1:44:35<9:30:56,  5.02it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31476/203307 [1:44:35<9:30:56,  5.02it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31477/203307 [1:44:39<9:31:16,  5.01it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31477/203307 [1:44:39<9:31:16,  5.01it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31478/203307 [1:44:43<9:31:41,  5.01it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31478/203307 [1:44:43<9:31:41,  5.01it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31479/203307 [1:44:48<9:32:04,  5.01it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31479/203307 [1:44:48<9:32:04,  5.01it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31480/203307 [1:44:52<9:32:24,  5.00it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31480/203307 [1:44:52<9:32:24,  5.00it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31481/203307 [1:44:56<9:32:45,  5.00it/s, v_num=line, training/loss=0.0785]Epoch 0:  15%|█▌        | 31481/203307 [1:44:56<9:32:45,  5.00it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31482/203307 [1:45:00<9:33:06,  5.00it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31482/203307 [1:45:00<9:33:06,  5.00it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31483/203307 [1:45:04<9:33:26,  4.99it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31483/203307 [1:45:04<9:33:26,  4.99it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31484/203307 [1:45:08<9:33:50,  4.99it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31484/203307 [1:45:08<9:33:51,  4.99it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31485/203307 [1:45:13<9:34:11,  4.99it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31485/203307 [1:45:13<9:34:11,  4.99it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31486/203307 [1:45:17<9:34:36,  4.98it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31486/203307 [1:45:17<9:34:36,  4.98it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31487/203307 [1:45:21<9:34:55,  4.98it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31487/203307 [1:45:21<9:34:55,  4.98it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31488/203307 [1:45:25<9:35:18,  4.98it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31488/203307 [1:45:25<9:35:18,  4.98it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31489/203307 [1:45:29<9:35:38,  4.97it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31489/203307 [1:45:29<9:35:38,  4.97it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31490/203307 [1:45:34<9:35:59,  4.97it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31490/203307 [1:45:34<9:35:59,  4.97it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31491/203307 [1:45:37<9:36:20,  4.97it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31491/203307 [1:45:37<9:36:20,  4.97it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31492/203307 [1:45:41<9:36:39,  4.97it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31492/203307 [1:45:41<9:36:39,  4.97it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31493/203307 [1:45:46<9:37:02,  4.96it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31493/203307 [1:45:46<9:37:02,  4.96it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31494/203307 [1:45:50<9:37:23,  4.96it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31494/203307 [1:45:50<9:37:23,  4.96it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31495/203307 [1:45:54<9:37:47,  4.96it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31495/203307 [1:45:54<9:37:47,  4.96it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31496/203307 [1:45:58<9:38:06,  4.95it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31496/203307 [1:45:58<9:38:06,  4.95it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31497/203307 [1:46:03<9:38:29,  4.95it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31497/203307 [1:46:03<9:38:29,  4.95it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31498/203307 [1:46:07<9:38:50,  4.95it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31498/203307 [1:46:07<9:38:50,  4.95it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31499/203307 [1:46:10<9:39:09,  4.94it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31499/203307 [1:46:10<9:39:09,  4.94it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31500/203307 [1:46:14<9:39:28,  4.94it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31500/203307 [1:46:14<9:39:28,  4.94it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31501/203307 [1:46:19<9:39:51,  4.94it/s, v_num=line, training/loss=0.0797]Epoch 0:  15%|█▌        | 31501/203307 [1:46:19<9:39:51,  4.94it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 31502/203307 [1:46:23<9:40:12,  4.94it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 31502/203307 [1:46:23<9:40:12,  4.94it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 31503/203307 [1:46:26<9:40:31,  4.93it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 31503/203307 [1:46:26<9:40:31,  4.93it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 31504/203307 [1:46:31<9:40:54,  4.93it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 31504/203307 [1:46:31<9:40:54,  4.93it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 31505/203307 [1:46:35<9:41:15,  4.93it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 31505/203307 [1:46:35<9:41:15,  4.93it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 31506/203307 [1:46:39<9:41:38,  4.92it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 31506/203307 [1:46:39<9:41:38,  4.92it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 31507/203307 [1:46:43<9:41:58,  4.92it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 31507/203307 [1:46:43<9:41:58,  4.92it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 31508/203307 [1:46:47<9:42:17,  4.92it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 31508/203307 [1:46:47<9:42:17,  4.92it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 31509/203307 [1:46:51<9:42:38,  4.91it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 31509/203307 [1:46:51<9:42:38,  4.91it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 31510/203307 [1:46:56<9:43:02,  4.91it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 31510/203307 [1:46:56<9:43:02,  4.91it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 31511/203307 [1:46:59<9:43:21,  4.91it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 31511/203307 [1:47:00<9:43:21,  4.91it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 31512/203307 [1:47:04<9:43:44,  4.90it/s, v_num=line, training/loss=0.0793]Epoch 0:  15%|█▌        | 31512/203307 [1:47:04<9:43:44,  4.90it/s, v_num=line, training/loss=0.0793]Epoch 0:  16%|█▌        | 31513/203307 [1:47:08<9:44:04,  4.90it/s, v_num=line, training/loss=0.0793]Epoch 0:  16%|█▌        | 31513/203307 [1:47:08<9:44:04,  4.90it/s, v_num=line, training/loss=0.0793]Epoch 0:  16%|█▌        | 31514/203307 [1:47:12<9:44:25,  4.90it/s, v_num=line, training/loss=0.0793]Epoch 0:  16%|█▌        | 31514/203307 [1:47:12<9:44:25,  4.90it/s, v_num=line, training/loss=0.0793]Epoch 0:  16%|█▌        | 31515/203307 [1:47:16<9:44:48,  4.90it/s, v_num=line, training/loss=0.0793]Epoch 0:  16%|█▌        | 31515/203307 [1:47:16<9:44:48,  4.90it/s, v_num=line, training/loss=0.0793]Epoch 0:  16%|█▌        | 31516/203307 [1:47:20<9:45:08,  4.89it/s, v_num=line, training/loss=0.0793]Epoch 0:  16%|█▌        | 31516/203307 [1:47:20<9:45:08,  4.89it/s, v_num=line, training/loss=0.0793]Epoch 0:  16%|█▌        | 31517/203307 [1:47:24<9:45:28,  4.89it/s, v_num=line, training/loss=0.0793]Epoch 0:  16%|█▌        | 31517/203307 [1:47:24<9:45:28,  4.89it/s, v_num=line, training/loss=0.0793]Epoch 0:  16%|█▌        | 31518/203307 [1:47:28<9:45:49,  4.89it/s, v_num=line, training/loss=0.0793]Epoch 0:  16%|█▌        | 31518/203307 [1:47:28<9:45:49,  4.89it/s, v_num=line, training/loss=0.0793]Epoch 0:  16%|█▌        | 31519/203307 [1:47:33<9:46:12,  4.88it/s, v_num=line, training/loss=0.0793]Epoch 0:  16%|█▌        | 31519/203307 [1:47:33<9:46:12,  4.88it/s, v_num=line, training/loss=0.0793]Epoch 0:  16%|█▌        | 31520/203307 [1:47:37<9:46:31,  4.88it/s, v_num=line, training/loss=0.0793]Epoch 0:  16%|█▌        | 31520/203307 [1:47:37<9:46:31,  4.88it/s, v_num=line, training/loss=0.0793]Epoch 0:  16%|█▌        | 31521/203307 [1:47:41<9:46:55,  4.88it/s, v_num=line, training/loss=0.0793]Epoch 0:  16%|█▌        | 31521/203307 [1:47:41<9:46:55,  4.88it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31522/203307 [1:47:45<9:47:16,  4.88it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31522/203307 [1:47:45<9:47:16,  4.88it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31523/203307 [1:47:49<9:47:35,  4.87it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31523/203307 [1:47:49<9:47:35,  4.87it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31524/203307 [1:47:54<9:47:59,  4.87it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31524/203307 [1:47:54<9:47:59,  4.87it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31525/203307 [1:47:58<9:48:20,  4.87it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31525/203307 [1:47:58<9:48:20,  4.87it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31526/203307 [1:48:02<9:48:40,  4.86it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31526/203307 [1:48:02<9:48:40,  4.86it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31527/203307 [1:48:06<9:49:03,  4.86it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31527/203307 [1:48:06<9:49:03,  4.86it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31528/203307 [1:48:10<9:49:23,  4.86it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31528/203307 [1:48:10<9:49:23,  4.86it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31529/203307 [1:48:14<9:49:44,  4.85it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31529/203307 [1:48:14<9:49:44,  4.85it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31530/203307 [1:48:19<9:50:08,  4.85it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31530/203307 [1:48:19<9:50:08,  4.85it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31531/203307 [1:48:23<9:50:27,  4.85it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31531/203307 [1:48:23<9:50:27,  4.85it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31532/203307 [1:48:26<9:50:47,  4.85it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31532/203307 [1:48:26<9:50:47,  4.85it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31533/203307 [1:48:31<9:51:10,  4.84it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31533/203307 [1:48:31<9:51:10,  4.84it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31534/203307 [1:48:35<9:51:30,  4.84it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31534/203307 [1:48:35<9:51:30,  4.84it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31535/203307 [1:48:39<9:51:50,  4.84it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31535/203307 [1:48:39<9:51:50,  4.84it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31536/203307 [1:48:43<9:52:13,  4.83it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31536/203307 [1:48:43<9:52:13,  4.83it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31537/203307 [1:48:47<9:52:34,  4.83it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31537/203307 [1:48:47<9:52:34,  4.83it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31538/203307 [1:48:52<9:52:58,  4.83it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31538/203307 [1:48:52<9:52:58,  4.83it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31539/203307 [1:48:56<9:53:19,  4.83it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31539/203307 [1:48:56<9:53:19,  4.83it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31540/203307 [1:49:00<9:53:38,  4.82it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31540/203307 [1:49:00<9:53:38,  4.82it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31541/203307 [1:49:04<9:53:59,  4.82it/s, v_num=line, training/loss=0.0836]Epoch 0:  16%|█▌        | 31541/203307 [1:49:04<9:54:00,  4.82it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31542/203307 [1:49:09<9:54:23,  4.82it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31542/203307 [1:49:09<9:54:23,  4.82it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31543/203307 [1:49:12<9:54:43,  4.81it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31543/203307 [1:49:12<9:54:43,  4.81it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31544/203307 [1:49:16<9:55:02,  4.81it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31544/203307 [1:49:16<9:55:03,  4.81it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31545/203307 [1:49:21<9:55:25,  4.81it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31545/203307 [1:49:21<9:55:25,  4.81it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31546/203307 [1:49:25<9:55:46,  4.80it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31546/203307 [1:49:25<9:55:46,  4.80it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31547/203307 [1:49:29<9:56:10,  4.80it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31547/203307 [1:49:29<9:56:10,  4.80it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31548/203307 [1:49:33<9:56:29,  4.80it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31548/203307 [1:49:33<9:56:29,  4.80it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31549/203307 [1:49:37<9:56:50,  4.80it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31549/203307 [1:49:37<9:56:50,  4.80it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31550/203307 [1:49:41<9:57:10,  4.79it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31550/203307 [1:49:41<9:57:10,  4.79it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31551/203307 [1:49:46<9:57:33,  4.79it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31551/203307 [1:49:46<9:57:33,  4.79it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31552/203307 [1:49:50<9:57:53,  4.79it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31552/203307 [1:49:50<9:57:53,  4.79it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31553/203307 [1:49:54<9:58:15,  4.78it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31553/203307 [1:49:54<9:58:16,  4.78it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31554/203307 [1:49:58<9:58:36,  4.78it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31554/203307 [1:49:58<9:58:36,  4.78it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31555/203307 [1:50:02<9:58:56,  4.78it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31555/203307 [1:50:02<9:58:56,  4.78it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31556/203307 [1:50:07<9:59:20,  4.78it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31556/203307 [1:50:07<9:59:20,  4.78it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31557/203307 [1:50:11<9:59:41,  4.77it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31557/203307 [1:50:11<9:59:41,  4.77it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31558/203307 [1:50:15<10:00:02,  4.77it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31558/203307 [1:50:15<10:00:02,  4.77it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31559/203307 [1:50:19<10:00:23,  4.77it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31559/203307 [1:50:19<10:00:23,  4.77it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31560/203307 [1:50:23<10:00:46,  4.76it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31560/203307 [1:50:23<10:00:46,  4.76it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31561/203307 [1:50:27<10:01:06,  4.76it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31561/203307 [1:50:27<10:01:06,  4.76it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31562/203307 [1:50:32<10:01:30,  4.76it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31562/203307 [1:50:32<10:01:31,  4.76it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31563/203307 [1:50:36<10:01:50,  4.76it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31563/203307 [1:50:36<10:01:50,  4.76it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31564/203307 [1:50:40<10:02:14,  4.75it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31564/203307 [1:50:40<10:02:14,  4.75it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31565/203307 [1:50:44<10:02:34,  4.75it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31565/203307 [1:50:44<10:02:34,  4.75it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31566/203307 [1:50:49<10:02:55,  4.75it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31566/203307 [1:50:49<10:02:55,  4.75it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31567/203307 [1:50:52<10:03:14,  4.74it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31567/203307 [1:50:52<10:03:14,  4.74it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31568/203307 [1:50:56<10:03:34,  4.74it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31568/203307 [1:50:56<10:03:34,  4.74it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31569/203307 [1:51:01<10:03:57,  4.74it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31569/203307 [1:51:01<10:03:57,  4.74it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31570/203307 [1:51:05<10:04:17,  4.74it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31570/203307 [1:51:05<10:04:17,  4.74it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31571/203307 [1:51:09<10:04:40,  4.73it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31571/203307 [1:51:09<10:04:40,  4.73it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31572/203307 [1:51:13<10:05:00,  4.73it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31572/203307 [1:51:13<10:05:00,  4.73it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31573/203307 [1:51:18<10:05:24,  4.73it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31573/203307 [1:51:18<10:05:24,  4.73it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31574/203307 [1:51:22<10:05:44,  4.73it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31574/203307 [1:51:22<10:05:44,  4.73it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31575/203307 [1:51:25<10:06:04,  4.72it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31575/203307 [1:51:25<10:06:04,  4.72it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31576/203307 [1:51:29<10:06:23,  4.72it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31576/203307 [1:51:29<10:06:23,  4.72it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31577/203307 [1:51:33<10:06:44,  4.72it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31577/203307 [1:51:33<10:06:44,  4.72it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31578/203307 [1:51:38<10:07:06,  4.71it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31578/203307 [1:51:38<10:07:06,  4.71it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31579/203307 [1:51:42<10:07:29,  4.71it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31579/203307 [1:51:42<10:07:29,  4.71it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31580/203307 [1:51:46<10:07:49,  4.71it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31580/203307 [1:51:46<10:07:49,  4.71it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31581/203307 [1:51:50<10:08:10,  4.71it/s, v_num=line, training/loss=0.0914]Epoch 0:  16%|█▌        | 31581/203307 [1:51:50<10:08:10,  4.71it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31582/203307 [1:51:55<10:08:35,  4.70it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31582/203307 [1:51:55<10:08:35,  4.70it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31583/203307 [1:51:59<10:08:54,  4.70it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31583/203307 [1:51:59<10:08:54,  4.70it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31584/203307 [1:52:03<10:09:14,  4.70it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31584/203307 [1:52:03<10:09:14,  4.70it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31585/203307 [1:52:07<10:09:35,  4.70it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31585/203307 [1:52:07<10:09:35,  4.70it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31586/203307 [1:52:11<10:09:56,  4.69it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31586/203307 [1:52:11<10:09:56,  4.69it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31587/203307 [1:52:15<10:10:18,  4.69it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31587/203307 [1:52:15<10:10:19,  4.69it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31588/203307 [1:52:20<10:10:41,  4.69it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31588/203307 [1:52:20<10:10:41,  4.69it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31589/203307 [1:52:24<10:11:01,  4.68it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31589/203307 [1:52:24<10:11:01,  4.68it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31590/203307 [1:52:29<10:11:26,  4.68it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31590/203307 [1:52:29<10:11:26,  4.68it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31591/203307 [1:52:32<10:11:46,  4.68it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31591/203307 [1:52:32<10:11:46,  4.68it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31592/203307 [1:52:36<10:12:05,  4.68it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31592/203307 [1:52:36<10:12:05,  4.68it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31593/203307 [1:52:40<10:12:25,  4.67it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31593/203307 [1:52:40<10:12:25,  4.67it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31594/203307 [1:52:44<10:12:46,  4.67it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31594/203307 [1:52:44<10:12:46,  4.67it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31595/203307 [1:52:48<10:13:05,  4.67it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31595/203307 [1:52:48<10:13:05,  4.67it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31596/203307 [1:52:53<10:13:28,  4.66it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31596/203307 [1:52:53<10:13:28,  4.66it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31597/203307 [1:52:57<10:13:51,  4.66it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31597/203307 [1:52:57<10:13:51,  4.66it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31598/203307 [1:53:01<10:14:12,  4.66it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31598/203307 [1:53:01<10:14:12,  4.66it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31599/203307 [1:53:06<10:14:35,  4.66it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31599/203307 [1:53:06<10:14:35,  4.66it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31600/203307 [1:53:09<10:14:54,  4.65it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31600/203307 [1:53:09<10:14:54,  4.65it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31601/203307 [1:53:13<10:15:14,  4.65it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▌        | 31601/203307 [1:53:13<10:15:14,  4.65it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31602/203307 [1:53:17<10:15:34,  4.65it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31602/203307 [1:53:17<10:15:34,  4.65it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31603/203307 [1:53:21<10:15:54,  4.65it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31603/203307 [1:53:21<10:15:54,  4.65it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31604/203307 [1:53:25<10:16:13,  4.64it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31604/203307 [1:53:25<10:16:13,  4.64it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31605/203307 [1:53:29<10:16:36,  4.64it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31605/203307 [1:53:29<10:16:36,  4.64it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31606/203307 [1:53:34<10:16:57,  4.64it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31606/203307 [1:53:34<10:16:57,  4.64it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31607/203307 [1:53:37<10:17:16,  4.64it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31607/203307 [1:53:37<10:17:17,  4.64it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31608/203307 [1:53:42<10:17:41,  4.63it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31608/203307 [1:53:42<10:17:41,  4.63it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31609/203307 [1:53:46<10:18:00,  4.63it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31609/203307 [1:53:46<10:18:00,  4.63it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31610/203307 [1:53:50<10:18:21,  4.63it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31610/203307 [1:53:50<10:18:21,  4.63it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31611/203307 [1:53:54<10:18:41,  4.63it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31611/203307 [1:53:54<10:18:41,  4.63it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31612/203307 [1:53:58<10:19:00,  4.62it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31612/203307 [1:53:58<10:19:00,  4.62it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31613/203307 [1:54:02<10:19:21,  4.62it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31613/203307 [1:54:02<10:19:21,  4.62it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31614/203307 [1:54:06<10:19:44,  4.62it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31614/203307 [1:54:06<10:19:44,  4.62it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31615/203307 [1:54:10<10:20:03,  4.61it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31615/203307 [1:54:10<10:20:03,  4.61it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31616/203307 [1:54:15<10:20:26,  4.61it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31616/203307 [1:54:15<10:20:26,  4.61it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31617/203307 [1:54:19<10:20:47,  4.61it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31617/203307 [1:54:19<10:20:47,  4.61it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31618/203307 [1:54:23<10:21:08,  4.61it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31618/203307 [1:54:23<10:21:08,  4.61it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31619/203307 [1:54:27<10:21:27,  4.60it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31619/203307 [1:54:27<10:21:27,  4.60it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31620/203307 [1:54:30<10:21:47,  4.60it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31620/203307 [1:54:30<10:21:47,  4.60it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31621/203307 [1:54:35<10:22:07,  4.60it/s, v_num=line, training/loss=0.0944]Epoch 0:  16%|█▌        | 31621/203307 [1:54:35<10:22:07,  4.60it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31622/203307 [1:54:38<10:22:27,  4.60it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31622/203307 [1:54:38<10:22:27,  4.60it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31623/203307 [1:54:43<10:22:50,  4.59it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31623/203307 [1:54:43<10:22:50,  4.59it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31624/203307 [1:54:47<10:23:10,  4.59it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31624/203307 [1:54:47<10:23:10,  4.59it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31625/203307 [1:54:52<10:23:34,  4.59it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31625/203307 [1:54:52<10:23:35,  4.59it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31626/203307 [1:54:56<10:23:55,  4.59it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31626/203307 [1:54:56<10:23:56,  4.59it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31627/203307 [1:55:00<10:24:15,  4.58it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31627/203307 [1:55:00<10:24:15,  4.58it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31628/203307 [1:55:03<10:24:35,  4.58it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31628/203307 [1:55:04<10:24:35,  4.58it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31629/203307 [1:55:08<10:24:55,  4.58it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31629/203307 [1:55:08<10:24:55,  4.58it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31630/203307 [1:55:12<10:25:16,  4.58it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31630/203307 [1:55:12<10:25:16,  4.58it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31631/203307 [1:55:16<10:25:39,  4.57it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31631/203307 [1:55:16<10:25:39,  4.57it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31632/203307 [1:55:21<10:26:02,  4.57it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31632/203307 [1:55:21<10:26:02,  4.57it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31633/203307 [1:55:24<10:26:22,  4.57it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31633/203307 [1:55:24<10:26:22,  4.57it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31634/203307 [1:55:29<10:26:46,  4.56it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31634/203307 [1:55:29<10:26:46,  4.56it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31635/203307 [1:55:33<10:27:05,  4.56it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31635/203307 [1:55:33<10:27:05,  4.56it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31636/203307 [1:55:37<10:27:24,  4.56it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31636/203307 [1:55:37<10:27:25,  4.56it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31637/203307 [1:55:41<10:27:45,  4.56it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31637/203307 [1:55:41<10:27:45,  4.56it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31638/203307 [1:55:45<10:28:07,  4.56it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31638/203307 [1:55:45<10:28:07,  4.56it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31639/203307 [1:55:49<10:28:26,  4.55it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31639/203307 [1:55:49<10:28:26,  4.55it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31640/203307 [1:55:53<10:28:48,  4.55it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31640/203307 [1:55:53<10:28:48,  4.55it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31641/203307 [1:55:58<10:29:11,  4.55it/s, v_num=line, training/loss=0.0831]Epoch 0:  16%|█▌        | 31641/203307 [1:55:58<10:29:12,  4.55it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31642/203307 [1:56:03<10:29:35,  4.54it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31642/203307 [1:56:03<10:29:36,  4.54it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31643/203307 [1:56:06<10:29:55,  4.54it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31643/203307 [1:56:06<10:29:55,  4.54it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31644/203307 [1:56:10<10:30:14,  4.54it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31644/203307 [1:56:10<10:30:14,  4.54it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31645/203307 [1:56:14<10:30:34,  4.54it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31645/203307 [1:56:14<10:30:34,  4.54it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31646/203307 [1:56:18<10:30:55,  4.53it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31646/203307 [1:56:18<10:30:55,  4.53it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31647/203307 [1:56:22<10:31:15,  4.53it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31647/203307 [1:56:22<10:31:15,  4.53it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31648/203307 [1:56:26<10:31:33,  4.53it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31648/203307 [1:56:26<10:31:33,  4.53it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31649/203307 [1:56:30<10:31:56,  4.53it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31649/203307 [1:56:30<10:31:56,  4.53it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31650/203307 [1:56:35<10:32:19,  4.52it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31650/203307 [1:56:35<10:32:19,  4.52it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31651/203307 [1:56:39<10:32:43,  4.52it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31651/203307 [1:56:39<10:32:43,  4.52it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31652/203307 [1:56:43<10:33:02,  4.52it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31652/203307 [1:56:43<10:33:02,  4.52it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31653/203307 [1:56:47<10:33:23,  4.52it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31653/203307 [1:56:47<10:33:23,  4.52it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31654/203307 [1:56:51<10:33:44,  4.51it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31654/203307 [1:56:51<10:33:44,  4.51it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31655/203307 [1:56:55<10:34:03,  4.51it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31655/203307 [1:56:55<10:34:03,  4.51it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31656/203307 [1:56:59<10:34:22,  4.51it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31656/203307 [1:56:59<10:34:22,  4.51it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31657/203307 [1:57:04<10:34:45,  4.51it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31657/203307 [1:57:04<10:34:45,  4.51it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31658/203307 [1:57:07<10:35:04,  4.50it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31658/203307 [1:57:07<10:35:04,  4.50it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31659/203307 [1:57:12<10:35:27,  4.50it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31659/203307 [1:57:12<10:35:27,  4.50it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31660/203307 [1:57:16<10:35:50,  4.50it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31660/203307 [1:57:16<10:35:50,  4.50it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31661/203307 [1:57:20<10:36:10,  4.50it/s, v_num=line, training/loss=0.0932]Epoch 0:  16%|█▌        | 31661/203307 [1:57:20<10:36:10,  4.50it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31662/203307 [1:57:24<10:36:30,  4.49it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31662/203307 [1:57:24<10:36:30,  4.49it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31663/203307 [1:57:28<10:36:49,  4.49it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31663/203307 [1:57:28<10:36:49,  4.49it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31664/203307 [1:57:32<10:37:08,  4.49it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31664/203307 [1:57:32<10:37:08,  4.49it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31665/203307 [1:57:36<10:37:29,  4.49it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31665/203307 [1:57:36<10:37:29,  4.49it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31666/203307 [1:57:40<10:37:52,  4.48it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31666/203307 [1:57:40<10:37:52,  4.48it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31667/203307 [1:57:44<10:38:11,  4.48it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31667/203307 [1:57:44<10:38:11,  4.48it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31668/203307 [1:57:49<10:38:35,  4.48it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31668/203307 [1:57:49<10:38:35,  4.48it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31669/203307 [1:57:53<10:38:55,  4.48it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31669/203307 [1:57:53<10:38:56,  4.48it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31670/203307 [1:57:57<10:39:15,  4.47it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31670/203307 [1:57:57<10:39:15,  4.47it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31671/203307 [1:58:01<10:39:34,  4.47it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31671/203307 [1:58:01<10:39:34,  4.47it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31672/203307 [1:58:04<10:39:54,  4.47it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31672/203307 [1:58:04<10:39:54,  4.47it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31673/203307 [1:58:09<10:40:15,  4.47it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31673/203307 [1:58:09<10:40:15,  4.47it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31674/203307 [1:58:12<10:40:34,  4.47it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31674/203307 [1:58:12<10:40:34,  4.47it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31675/203307 [1:58:17<10:40:57,  4.46it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31675/203307 [1:58:17<10:40:57,  4.46it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31676/203307 [1:58:21<10:41:16,  4.46it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31676/203307 [1:58:21<10:41:16,  4.46it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31677/203307 [1:58:25<10:41:40,  4.46it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31677/203307 [1:58:25<10:41:40,  4.46it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31678/203307 [1:58:29<10:41:59,  4.46it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31678/203307 [1:58:29<10:41:59,  4.46it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31679/203307 [1:58:33<10:42:18,  4.45it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31679/203307 [1:58:33<10:42:18,  4.45it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31680/203307 [1:58:37<10:42:37,  4.45it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31680/203307 [1:58:37<10:42:37,  4.45it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31681/203307 [1:58:41<10:42:59,  4.45it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 31681/203307 [1:58:41<10:42:59,  4.45it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31682/203307 [1:58:45<10:43:18,  4.45it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31682/203307 [1:58:45<10:43:18,  4.45it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31683/203307 [1:58:49<10:43:41,  4.44it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31683/203307 [1:58:49<10:43:41,  4.44it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31684/203307 [1:58:53<10:44:00,  4.44it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31684/203307 [1:58:53<10:44:00,  4.44it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31685/203307 [1:58:57<10:44:20,  4.44it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31685/203307 [1:58:57<10:44:20,  4.44it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31686/203307 [1:59:02<10:44:43,  4.44it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31686/203307 [1:59:02<10:44:43,  4.44it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31687/203307 [1:59:05<10:45:02,  4.43it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31687/203307 [1:59:05<10:45:02,  4.43it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31688/203307 [1:59:09<10:45:21,  4.43it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31688/203307 [1:59:09<10:45:21,  4.43it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31689/203307 [1:59:13<10:45:42,  4.43it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31689/203307 [1:59:13<10:45:42,  4.43it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31690/203307 [1:59:17<10:46:02,  4.43it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31690/203307 [1:59:17<10:46:02,  4.43it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31691/203307 [1:59:21<10:46:21,  4.43it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31691/203307 [1:59:21<10:46:21,  4.43it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31692/203307 [1:59:25<10:46:44,  4.42it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31692/203307 [1:59:25<10:46:44,  4.42it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31693/203307 [1:59:30<10:47:04,  4.42it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31693/203307 [1:59:30<10:47:04,  4.42it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31694/203307 [1:59:34<10:47:28,  4.42it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31694/203307 [1:59:34<10:47:28,  4.42it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31695/203307 [1:59:38<10:47:50,  4.41it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31695/203307 [1:59:38<10:47:50,  4.41it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31696/203307 [1:59:42<10:48:09,  4.41it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31696/203307 [1:59:42<10:48:09,  4.41it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31697/203307 [1:59:46<10:48:30,  4.41it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31697/203307 [1:59:46<10:48:30,  4.41it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31698/203307 [1:59:50<10:48:49,  4.41it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31698/203307 [1:59:50<10:48:50,  4.41it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31699/203307 [1:59:54<10:49:09,  4.41it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31699/203307 [1:59:54<10:49:09,  4.41it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31700/203307 [1:59:58<10:49:28,  4.40it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31700/203307 [1:59:58<10:49:28,  4.40it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31701/203307 [2:00:03<10:49:52,  4.40it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 31701/203307 [2:00:03<10:49:52,  4.40it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31702/203307 [2:00:06<10:50:11,  4.40it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31702/203307 [2:00:06<10:50:11,  4.40it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31703/203307 [2:00:11<10:50:34,  4.40it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31703/203307 [2:00:11<10:50:34,  4.40it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31704/203307 [2:00:15<10:50:56,  4.39it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31704/203307 [2:00:15<10:50:56,  4.39it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31705/203307 [2:00:19<10:51:17,  4.39it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31705/203307 [2:00:19<10:51:17,  4.39it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31706/203307 [2:00:23<10:51:36,  4.39it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31706/203307 [2:00:23<10:51:36,  4.39it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31707/203307 [2:00:27<10:51:56,  4.39it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31707/203307 [2:00:27<10:51:56,  4.39it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31708/203307 [2:00:31<10:52:15,  4.38it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31708/203307 [2:00:31<10:52:15,  4.38it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31709/203307 [2:00:35<10:52:38,  4.38it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31709/203307 [2:00:35<10:52:38,  4.38it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31710/203307 [2:00:39<10:52:57,  4.38it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31710/203307 [2:00:39<10:52:57,  4.38it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31711/203307 [2:00:43<10:53:17,  4.38it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31711/203307 [2:00:43<10:53:17,  4.38it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31712/203307 [2:00:48<10:53:40,  4.38it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31712/203307 [2:00:48<10:53:40,  4.38it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31713/203307 [2:00:52<10:54:03,  4.37it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31713/203307 [2:00:52<10:54:03,  4.37it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31714/203307 [2:00:56<10:54:22,  4.37it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31714/203307 [2:00:56<10:54:22,  4.37it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31715/203307 [2:01:00<10:54:42,  4.37it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31715/203307 [2:01:00<10:54:42,  4.37it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31716/203307 [2:01:04<10:55:01,  4.37it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31716/203307 [2:01:04<10:55:01,  4.37it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31717/203307 [2:01:08<10:55:22,  4.36it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31717/203307 [2:01:08<10:55:22,  4.36it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31718/203307 [2:01:12<10:55:45,  4.36it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31718/203307 [2:01:12<10:55:45,  4.36it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31719/203307 [2:01:16<10:56:04,  4.36it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31719/203307 [2:01:16<10:56:04,  4.36it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31720/203307 [2:01:21<10:56:27,  4.36it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31720/203307 [2:01:21<10:56:27,  4.36it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31721/203307 [2:01:25<10:56:48,  4.35it/s, v_num=line, training/loss=0.0792]Epoch 0:  16%|█▌        | 31721/203307 [2:01:25<10:56:48,  4.35it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31722/203307 [2:01:29<10:57:10,  4.35it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31722/203307 [2:01:29<10:57:10,  4.35it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31723/203307 [2:01:33<10:57:30,  4.35it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31723/203307 [2:01:33<10:57:30,  4.35it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31724/203307 [2:01:37<10:57:49,  4.35it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31724/203307 [2:01:37<10:57:49,  4.35it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31725/203307 [2:01:41<10:58:09,  4.34it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31725/203307 [2:01:41<10:58:09,  4.34it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31726/203307 [2:01:45<10:58:29,  4.34it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31726/203307 [2:01:45<10:58:29,  4.34it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31727/203307 [2:01:49<10:58:51,  4.34it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31727/203307 [2:01:49<10:58:51,  4.34it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31728/203307 [2:01:53<10:59:10,  4.34it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31728/203307 [2:01:53<10:59:10,  4.34it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31729/203307 [2:01:58<10:59:35,  4.34it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31729/203307 [2:01:58<10:59:35,  4.34it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31730/203307 [2:02:02<10:59:54,  4.33it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31730/203307 [2:02:02<10:59:54,  4.33it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31731/203307 [2:02:06<11:00:16,  4.33it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31731/203307 [2:02:06<11:00:16,  4.33it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31732/203307 [2:02:10<11:00:36,  4.33it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31732/203307 [2:02:10<11:00:36,  4.33it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31733/203307 [2:02:14<11:00:56,  4.33it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31733/203307 [2:02:14<11:00:56,  4.33it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31734/203307 [2:02:18<11:01:16,  4.32it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31734/203307 [2:02:18<11:01:16,  4.32it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31735/203307 [2:02:22<11:01:38,  4.32it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31735/203307 [2:02:22<11:01:38,  4.32it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31736/203307 [2:02:26<11:01:58,  4.32it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31736/203307 [2:02:26<11:01:58,  4.32it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31737/203307 [2:02:30<11:02:18,  4.32it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31737/203307 [2:02:30<11:02:18,  4.32it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31738/203307 [2:02:35<11:02:42,  4.31it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31738/203307 [2:02:35<11:02:42,  4.31it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31739/203307 [2:02:39<11:03:01,  4.31it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31739/203307 [2:02:39<11:03:01,  4.31it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31740/203307 [2:02:43<11:03:23,  4.31it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31740/203307 [2:02:43<11:03:23,  4.31it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31741/203307 [2:02:47<11:03:44,  4.31it/s, v_num=line, training/loss=0.0805]Epoch 0:  16%|█▌        | 31741/203307 [2:02:47<11:03:44,  4.31it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31742/203307 [2:02:51<11:04:04,  4.31it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31742/203307 [2:02:51<11:04:04,  4.31it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31743/203307 [2:02:55<11:04:23,  4.30it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31743/203307 [2:02:55<11:04:23,  4.30it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31744/203307 [2:03:00<11:04:46,  4.30it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31744/203307 [2:03:00<11:04:46,  4.30it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31745/203307 [2:03:04<11:05:07,  4.30it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31745/203307 [2:03:04<11:05:07,  4.30it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31746/203307 [2:03:08<11:05:30,  4.30it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31746/203307 [2:03:08<11:05:30,  4.30it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31747/203307 [2:03:12<11:05:49,  4.29it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31747/203307 [2:03:12<11:05:49,  4.29it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31748/203307 [2:03:16<11:06:08,  4.29it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31748/203307 [2:03:16<11:06:08,  4.29it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31749/203307 [2:03:21<11:06:31,  4.29it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31749/203307 [2:03:21<11:06:32,  4.29it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31750/203307 [2:03:24<11:06:51,  4.29it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31750/203307 [2:03:24<11:06:51,  4.29it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31751/203307 [2:03:28<11:07:10,  4.29it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31751/203307 [2:03:28<11:07:10,  4.29it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31752/203307 [2:03:32<11:07:29,  4.28it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31752/203307 [2:03:32<11:07:29,  4.28it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31753/203307 [2:03:37<11:07:53,  4.28it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31753/203307 [2:03:37<11:07:53,  4.28it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31754/203307 [2:03:41<11:08:12,  4.28it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31754/203307 [2:03:41<11:08:12,  4.28it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31755/203307 [2:03:45<11:08:36,  4.28it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31755/203307 [2:03:45<11:08:36,  4.28it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31756/203307 [2:03:49<11:08:55,  4.27it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31756/203307 [2:03:49<11:08:55,  4.27it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31757/203307 [2:03:53<11:09:16,  4.27it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31757/203307 [2:03:53<11:09:16,  4.27it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31758/203307 [2:03:58<11:09:39,  4.27it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31758/203307 [2:03:58<11:09:39,  4.27it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31759/203307 [2:04:02<11:09:58,  4.27it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31759/203307 [2:04:02<11:09:58,  4.27it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31760/203307 [2:04:05<11:10:17,  4.27it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31760/203307 [2:04:05<11:10:17,  4.27it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31761/203307 [2:04:10<11:10:40,  4.26it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▌        | 31761/203307 [2:04:10<11:10:40,  4.26it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31762/203307 [2:04:14<11:10:59,  4.26it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31762/203307 [2:04:14<11:10:59,  4.26it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31763/203307 [2:04:18<11:11:22,  4.26it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31763/203307 [2:04:18<11:11:22,  4.26it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31764/203307 [2:04:23<11:11:44,  4.26it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31764/203307 [2:04:23<11:11:44,  4.26it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31765/203307 [2:04:27<11:12:05,  4.25it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31765/203307 [2:04:27<11:12:05,  4.25it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31766/203307 [2:04:31<11:12:24,  4.25it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31766/203307 [2:04:31<11:12:24,  4.25it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31767/203307 [2:04:35<11:12:46,  4.25it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31767/203307 [2:04:35<11:12:46,  4.25it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31768/203307 [2:04:39<11:13:06,  4.25it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31768/203307 [2:04:39<11:13:06,  4.25it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31769/203307 [2:04:43<11:13:26,  4.25it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31769/203307 [2:04:43<11:13:26,  4.25it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31770/203307 [2:04:47<11:13:48,  4.24it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31770/203307 [2:04:47<11:13:48,  4.24it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31771/203307 [2:04:51<11:14:07,  4.24it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31771/203307 [2:04:51<11:14:07,  4.24it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31772/203307 [2:04:56<11:14:31,  4.24it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31772/203307 [2:04:56<11:14:31,  4.24it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31773/203307 [2:05:00<11:14:51,  4.24it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31773/203307 [2:05:00<11:14:51,  4.24it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31774/203307 [2:05:03<11:15:10,  4.23it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31774/203307 [2:05:03<11:15:10,  4.23it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31775/203307 [2:05:07<11:15:29,  4.23it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31775/203307 [2:05:07<11:15:29,  4.23it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31776/203307 [2:05:12<11:15:52,  4.23it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31776/203307 [2:05:12<11:15:52,  4.23it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31777/203307 [2:05:16<11:16:12,  4.23it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31777/203307 [2:05:16<11:16:12,  4.23it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31778/203307 [2:05:20<11:16:32,  4.23it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31778/203307 [2:05:20<11:16:32,  4.23it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31779/203307 [2:05:24<11:16:54,  4.22it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31779/203307 [2:05:24<11:16:54,  4.22it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31780/203307 [2:05:29<11:17:16,  4.22it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31780/203307 [2:05:29<11:17:16,  4.22it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31781/203307 [2:05:33<11:17:41,  4.22it/s, v_num=line, training/loss=0.0851]Epoch 0:  16%|█▌        | 31781/203307 [2:05:33<11:17:41,  4.22it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31782/203307 [2:05:37<11:18:00,  4.22it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31782/203307 [2:05:37<11:18:00,  4.22it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31783/203307 [2:05:41<11:18:19,  4.21it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31783/203307 [2:05:41<11:18:19,  4.21it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31784/203307 [2:05:45<11:18:39,  4.21it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31784/203307 [2:05:45<11:18:39,  4.21it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31785/203307 [2:05:50<11:19:02,  4.21it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31785/203307 [2:05:50<11:19:02,  4.21it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31786/203307 [2:05:53<11:19:21,  4.21it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31786/203307 [2:05:53<11:19:21,  4.21it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31787/203307 [2:05:58<11:19:43,  4.21it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31787/203307 [2:05:58<11:19:43,  4.21it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31788/203307 [2:06:02<11:20:05,  4.20it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31788/203307 [2:06:02<11:20:05,  4.20it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31789/203307 [2:06:06<11:20:26,  4.20it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31789/203307 [2:06:06<11:20:26,  4.20it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31790/203307 [2:06:11<11:20:49,  4.20it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31790/203307 [2:06:11<11:20:49,  4.20it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31791/203307 [2:06:15<11:21:08,  4.20it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31791/203307 [2:06:15<11:21:08,  4.20it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31792/203307 [2:06:18<11:21:27,  4.19it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31792/203307 [2:06:18<11:21:27,  4.19it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31793/203307 [2:06:22<11:21:47,  4.19it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31793/203307 [2:06:22<11:21:47,  4.19it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31794/203307 [2:06:27<11:22:09,  4.19it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31794/203307 [2:06:27<11:22:09,  4.19it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31795/203307 [2:06:31<11:22:28,  4.19it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31795/203307 [2:06:31<11:22:28,  4.19it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31796/203307 [2:06:35<11:22:51,  4.19it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31796/203307 [2:06:35<11:22:51,  4.19it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31797/203307 [2:06:40<11:23:15,  4.18it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31797/203307 [2:06:40<11:23:15,  4.18it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31798/203307 [2:06:44<11:23:37,  4.18it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31798/203307 [2:06:44<11:23:37,  4.18it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31799/203307 [2:06:48<11:23:56,  4.18it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31799/203307 [2:06:48<11:23:56,  4.18it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31800/203307 [2:06:52<11:24:15,  4.18it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31800/203307 [2:06:52<11:24:15,  4.18it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31801/203307 [2:06:56<11:24:35,  4.18it/s, v_num=line, training/loss=0.0897]Epoch 0:  16%|█▌        | 31801/203307 [2:06:56<11:24:35,  4.18it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31802/203307 [2:07:00<11:24:54,  4.17it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31802/203307 [2:07:00<11:24:54,  4.17it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31803/203307 [2:07:04<11:25:17,  4.17it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31803/203307 [2:07:04<11:25:17,  4.17it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31804/203307 [2:07:08<11:25:35,  4.17it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31804/203307 [2:07:08<11:25:35,  4.17it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31805/203307 [2:07:13<11:25:59,  4.17it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31805/203307 [2:07:13<11:25:59,  4.17it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31806/203307 [2:07:16<11:26:18,  4.16it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31806/203307 [2:07:16<11:26:18,  4.16it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31807/203307 [2:07:21<11:26:41,  4.16it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31807/203307 [2:07:21<11:26:41,  4.16it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31808/203307 [2:07:25<11:27:00,  4.16it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31808/203307 [2:07:25<11:27:00,  4.16it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31809/203307 [2:07:29<11:27:20,  4.16it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31809/203307 [2:07:29<11:27:20,  4.16it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31810/203307 [2:07:32<11:27:39,  4.16it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31810/203307 [2:07:32<11:27:39,  4.16it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31811/203307 [2:07:36<11:27:58,  4.15it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31811/203307 [2:07:36<11:27:58,  4.15it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31812/203307 [2:07:41<11:28:20,  4.15it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31812/203307 [2:07:41<11:28:20,  4.15it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31813/203307 [2:07:45<11:28:44,  4.15it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31813/203307 [2:07:45<11:28:44,  4.15it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31814/203307 [2:07:49<11:29:04,  4.15it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31814/203307 [2:07:49<11:29:04,  4.15it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31815/203307 [2:07:53<11:29:24,  4.15it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31815/203307 [2:07:53<11:29:24,  4.15it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31816/203307 [2:07:58<11:29:48,  4.14it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31816/203307 [2:07:58<11:29:48,  4.14it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31817/203307 [2:08:02<11:30:08,  4.14it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31817/203307 [2:08:02<11:30:08,  4.14it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31818/203307 [2:08:06<11:30:28,  4.14it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31818/203307 [2:08:06<11:30:28,  4.14it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31819/203307 [2:08:10<11:30:47,  4.14it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31819/203307 [2:08:10<11:30:47,  4.14it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31820/203307 [2:08:14<11:31:06,  4.14it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31820/203307 [2:08:14<11:31:06,  4.14it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31821/203307 [2:08:18<11:31:30,  4.13it/s, v_num=line, training/loss=0.0798]Epoch 0:  16%|█▌        | 31821/203307 [2:08:18<11:31:30,  4.13it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31822/203307 [2:08:23<11:31:53,  4.13it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31822/203307 [2:08:23<11:31:53,  4.13it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31823/203307 [2:08:27<11:32:12,  4.13it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31823/203307 [2:08:27<11:32:12,  4.13it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31824/203307 [2:08:31<11:32:35,  4.13it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31824/203307 [2:08:31<11:32:35,  4.13it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31825/203307 [2:08:36<11:32:56,  4.12it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31825/203307 [2:08:36<11:32:56,  4.12it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31826/203307 [2:08:39<11:33:14,  4.12it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31826/203307 [2:08:39<11:33:14,  4.12it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31827/203307 [2:08:43<11:33:34,  4.12it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31827/203307 [2:08:43<11:33:34,  4.12it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31828/203307 [2:08:47<11:33:54,  4.12it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31828/203307 [2:08:47<11:33:54,  4.12it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31829/203307 [2:08:51<11:34:15,  4.12it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31829/203307 [2:08:51<11:34:15,  4.12it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31830/203307 [2:08:56<11:34:38,  4.11it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31830/203307 [2:08:56<11:34:38,  4.11it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31831/203307 [2:09:00<11:35:00,  4.11it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31831/203307 [2:09:00<11:35:00,  4.11it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31832/203307 [2:09:04<11:35:19,  4.11it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31832/203307 [2:09:04<11:35:19,  4.11it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31833/203307 [2:09:09<11:35:43,  4.11it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31833/203307 [2:09:09<11:35:43,  4.11it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31834/203307 [2:09:13<11:36:02,  4.11it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31834/203307 [2:09:13<11:36:02,  4.11it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31835/203307 [2:09:16<11:36:21,  4.10it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31835/203307 [2:09:16<11:36:21,  4.10it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31836/203307 [2:09:20<11:36:40,  4.10it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31836/203307 [2:09:20<11:36:40,  4.10it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31837/203307 [2:09:24<11:37:00,  4.10it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31837/203307 [2:09:24<11:37:00,  4.10it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31838/203307 [2:09:29<11:37:22,  4.10it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31838/203307 [2:09:29<11:37:22,  4.10it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31839/203307 [2:09:33<11:37:44,  4.10it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31839/203307 [2:09:33<11:37:44,  4.10it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31840/203307 [2:09:37<11:38:03,  4.09it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31840/203307 [2:09:37<11:38:03,  4.09it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31841/203307 [2:09:41<11:38:23,  4.09it/s, v_num=line, training/loss=0.0739]Epoch 0:  16%|█▌        | 31841/203307 [2:09:41<11:38:23,  4.09it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31842/203307 [2:09:45<11:38:46,  4.09it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31842/203307 [2:09:46<11:38:46,  4.09it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31843/203307 [2:09:49<11:39:05,  4.09it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31843/203307 [2:09:49<11:39:05,  4.09it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31844/203307 [2:09:53<11:39:24,  4.09it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31844/203307 [2:09:53<11:39:24,  4.09it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31845/203307 [2:09:57<11:39:44,  4.08it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31845/203307 [2:09:57<11:39:44,  4.08it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31846/203307 [2:10:01<11:40:03,  4.08it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31846/203307 [2:10:01<11:40:03,  4.08it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31847/203307 [2:10:05<11:40:26,  4.08it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31847/203307 [2:10:05<11:40:26,  4.08it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31848/203307 [2:10:10<11:40:48,  4.08it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31848/203307 [2:10:10<11:40:48,  4.08it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31849/203307 [2:10:14<11:41:08,  4.08it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31849/203307 [2:10:14<11:41:08,  4.08it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31850/203307 [2:10:18<11:41:31,  4.07it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31850/203307 [2:10:18<11:41:31,  4.07it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31851/203307 [2:10:22<11:41:50,  4.07it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31851/203307 [2:10:22<11:41:50,  4.07it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31852/203307 [2:10:26<11:42:09,  4.07it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31852/203307 [2:10:26<11:42:09,  4.07it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31853/203307 [2:10:30<11:42:30,  4.07it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31853/203307 [2:10:30<11:42:30,  4.07it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31854/203307 [2:10:34<11:42:49,  4.07it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31854/203307 [2:10:34<11:42:49,  4.07it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31855/203307 [2:10:39<11:43:12,  4.06it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31855/203307 [2:10:39<11:43:12,  4.06it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31856/203307 [2:10:42<11:43:31,  4.06it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31856/203307 [2:10:42<11:43:31,  4.06it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31857/203307 [2:10:47<11:43:53,  4.06it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31857/203307 [2:10:47<11:43:53,  4.06it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31858/203307 [2:10:51<11:44:12,  4.06it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31858/203307 [2:10:51<11:44:12,  4.06it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31859/203307 [2:10:55<11:44:35,  4.06it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31859/203307 [2:10:55<11:44:35,  4.06it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31860/203307 [2:10:59<11:44:54,  4.05it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31860/203307 [2:10:59<11:44:54,  4.05it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31861/203307 [2:11:03<11:45:14,  4.05it/s, v_num=line, training/loss=0.0687]Epoch 0:  16%|█▌        | 31861/203307 [2:11:03<11:45:14,  4.05it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31862/203307 [2:11:07<11:45:33,  4.05it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31862/203307 [2:11:07<11:45:33,  4.05it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31863/203307 [2:11:11<11:45:55,  4.05it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31863/203307 [2:11:11<11:45:55,  4.05it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31864/203307 [2:11:15<11:46:14,  4.05it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31864/203307 [2:11:15<11:46:14,  4.05it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31865/203307 [2:11:19<11:46:36,  4.04it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31865/203307 [2:11:19<11:46:36,  4.04it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31866/203307 [2:11:24<11:46:58,  4.04it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31866/203307 [2:11:24<11:46:58,  4.04it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31867/203307 [2:11:28<11:47:16,  4.04it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31867/203307 [2:11:28<11:47:16,  4.04it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31868/203307 [2:11:32<11:47:39,  4.04it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31868/203307 [2:11:32<11:47:39,  4.04it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31869/203307 [2:11:36<11:47:59,  4.04it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31869/203307 [2:11:36<11:47:59,  4.04it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31870/203307 [2:11:40<11:48:18,  4.03it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31870/203307 [2:11:40<11:48:18,  4.03it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31871/203307 [2:11:44<11:48:37,  4.03it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31871/203307 [2:11:44<11:48:38,  4.03it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31872/203307 [2:11:48<11:49:00,  4.03it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31872/203307 [2:11:48<11:49:00,  4.03it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31873/203307 [2:11:52<11:49:20,  4.03it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31873/203307 [2:11:52<11:49:20,  4.03it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31874/203307 [2:11:57<11:49:42,  4.03it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31874/203307 [2:11:57<11:49:42,  4.03it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31875/203307 [2:12:01<11:50:04,  4.02it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31875/203307 [2:12:01<11:50:04,  4.02it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31876/203307 [2:12:06<11:50:27,  4.02it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31876/203307 [2:12:06<11:50:27,  4.02it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31877/203307 [2:12:10<11:50:47,  4.02it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31877/203307 [2:12:10<11:50:47,  4.02it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31878/203307 [2:12:14<11:51:06,  4.02it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31878/203307 [2:12:14<11:51:06,  4.02it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31879/203307 [2:12:17<11:51:25,  4.02it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31879/203307 [2:12:17<11:51:25,  4.02it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31880/203307 [2:12:22<11:51:47,  4.01it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31880/203307 [2:12:22<11:51:47,  4.01it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31881/203307 [2:12:26<11:52:07,  4.01it/s, v_num=line, training/loss=0.0879]Epoch 0:  16%|█▌        | 31881/203307 [2:12:26<11:52:07,  4.01it/s, v_num=line, training/loss=0.080] Epoch 0:  16%|█▌        | 31882/203307 [2:12:30<11:52:26,  4.01it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31882/203307 [2:12:30<11:52:26,  4.01it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31883/203307 [2:12:34<11:52:48,  4.01it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31883/203307 [2:12:34<11:52:48,  4.01it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31884/203307 [2:12:38<11:53:10,  4.01it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31884/203307 [2:12:38<11:53:10,  4.01it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31885/203307 [2:12:43<11:53:34,  4.00it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31885/203307 [2:12:43<11:53:34,  4.00it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31886/203307 [2:12:47<11:53:53,  4.00it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31886/203307 [2:12:47<11:53:53,  4.00it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31887/203307 [2:12:51<11:54:12,  4.00it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31887/203307 [2:12:51<11:54:12,  4.00it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31888/203307 [2:12:55<11:54:34,  4.00it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31888/203307 [2:12:55<11:54:34,  4.00it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31889/203307 [2:12:59<11:54:54,  4.00it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31889/203307 [2:12:59<11:54:54,  4.00it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31890/203307 [2:13:03<11:55:13,  3.99it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31890/203307 [2:13:03<11:55:13,  3.99it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31891/203307 [2:13:07<11:55:35,  3.99it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31891/203307 [2:13:07<11:55:35,  3.99it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31892/203307 [2:13:11<11:55:54,  3.99it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31892/203307 [2:13:11<11:55:54,  3.99it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31893/203307 [2:13:16<11:56:16,  3.99it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31893/203307 [2:13:16<11:56:16,  3.99it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31894/203307 [2:13:20<11:56:39,  3.99it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31894/203307 [2:13:20<11:56:39,  3.99it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31895/203307 [2:13:24<11:56:57,  3.98it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31895/203307 [2:13:24<11:56:57,  3.98it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31896/203307 [2:13:28<11:57:16,  3.98it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31896/203307 [2:13:28<11:57:16,  3.98it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31897/203307 [2:13:32<11:57:40,  3.98it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31897/203307 [2:13:32<11:57:40,  3.98it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31898/203307 [2:13:36<11:57:59,  3.98it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31898/203307 [2:13:36<11:57:59,  3.98it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31899/203307 [2:13:40<11:58:18,  3.98it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31899/203307 [2:13:40<11:58:18,  3.98it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31900/203307 [2:13:45<11:58:41,  3.97it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31900/203307 [2:13:45<11:58:41,  3.97it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31901/203307 [2:13:49<11:59:01,  3.97it/s, v_num=line, training/loss=0.080]Epoch 0:  16%|█▌        | 31901/203307 [2:13:49<11:59:01,  3.97it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31902/203307 [2:13:53<11:59:25,  3.97it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31902/203307 [2:13:53<11:59:25,  3.97it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31903/203307 [2:13:57<11:59:44,  3.97it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31903/203307 [2:13:57<11:59:44,  3.97it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31904/203307 [2:14:01<12:00:03,  3.97it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31904/203307 [2:14:01<12:00:03,  3.97it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31905/203307 [2:14:06<12:00:27,  3.97it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31905/203307 [2:14:06<12:00:27,  3.97it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31906/203307 [2:14:10<12:00:46,  3.96it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31906/203307 [2:14:10<12:00:46,  3.96it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31907/203307 [2:14:14<12:01:05,  3.96it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31907/203307 [2:14:14<12:01:05,  3.96it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31908/203307 [2:14:17<12:01:24,  3.96it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31908/203307 [2:14:17<12:01:24,  3.96it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31909/203307 [2:14:22<12:01:46,  3.96it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31909/203307 [2:14:22<12:01:46,  3.96it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31910/203307 [2:14:26<12:02:05,  3.96it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31910/203307 [2:14:26<12:02:05,  3.96it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31911/203307 [2:14:30<12:02:28,  3.95it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31911/203307 [2:14:30<12:02:28,  3.95it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31912/203307 [2:14:34<12:02:47,  3.95it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31912/203307 [2:14:34<12:02:47,  3.95it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31913/203307 [2:14:39<12:03:10,  3.95it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31913/203307 [2:14:39<12:03:10,  3.95it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31914/203307 [2:14:43<12:03:30,  3.95it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31914/203307 [2:14:43<12:03:30,  3.95it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31915/203307 [2:14:46<12:03:49,  3.95it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31915/203307 [2:14:46<12:03:49,  3.95it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31916/203307 [2:14:50<12:04:07,  3.94it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31916/203307 [2:14:50<12:04:07,  3.94it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31917/203307 [2:14:55<12:04:30,  3.94it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31917/203307 [2:14:55<12:04:30,  3.94it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31918/203307 [2:14:59<12:04:49,  3.94it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31918/203307 [2:14:59<12:04:49,  3.94it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31919/203307 [2:15:02<12:05:07,  3.94it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31919/203307 [2:15:02<12:05:07,  3.94it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31920/203307 [2:15:07<12:05:30,  3.94it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31920/203307 [2:15:07<12:05:30,  3.94it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31921/203307 [2:15:11<12:05:51,  3.94it/s, v_num=line, training/loss=0.0773]Epoch 0:  16%|█▌        | 31921/203307 [2:15:11<12:05:51,  3.94it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31922/203307 [2:15:15<12:06:13,  3.93it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31922/203307 [2:15:15<12:06:13,  3.93it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31923/203307 [2:15:19<12:06:32,  3.93it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31923/203307 [2:15:19<12:06:32,  3.93it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31924/203307 [2:15:23<12:06:51,  3.93it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31924/203307 [2:15:23<12:06:51,  3.93it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31925/203307 [2:15:27<12:07:11,  3.93it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31925/203307 [2:15:27<12:07:12,  3.93it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31926/203307 [2:15:32<12:07:34,  3.93it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31926/203307 [2:15:32<12:07:34,  3.93it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31927/203307 [2:15:35<12:07:52,  3.92it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31927/203307 [2:15:36<12:07:53,  3.92it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31928/203307 [2:15:40<12:08:15,  3.92it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31928/203307 [2:15:40<12:08:15,  3.92it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31929/203307 [2:15:44<12:08:36,  3.92it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31929/203307 [2:15:44<12:08:36,  3.92it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31930/203307 [2:15:49<12:08:58,  3.92it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31930/203307 [2:15:49<12:08:58,  3.92it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31931/203307 [2:15:52<12:09:17,  3.92it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31931/203307 [2:15:52<12:09:17,  3.92it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31932/203307 [2:15:56<12:09:36,  3.91it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31932/203307 [2:15:56<12:09:36,  3.91it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31933/203307 [2:16:00<12:09:56,  3.91it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31933/203307 [2:16:00<12:09:56,  3.91it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31934/203307 [2:16:04<12:10:15,  3.91it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31934/203307 [2:16:04<12:10:15,  3.91it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31935/203307 [2:16:09<12:10:37,  3.91it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31935/203307 [2:16:09<12:10:37,  3.91it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31936/203307 [2:16:12<12:10:56,  3.91it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31936/203307 [2:16:12<12:10:56,  3.91it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31937/203307 [2:16:17<12:11:20,  3.91it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31937/203307 [2:16:17<12:11:20,  3.91it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31938/203307 [2:16:22<12:11:42,  3.90it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31938/203307 [2:16:22<12:11:42,  3.90it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31939/203307 [2:16:25<12:12:01,  3.90it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31939/203307 [2:16:25<12:12:01,  3.90it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31940/203307 [2:16:29<12:12:20,  3.90it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31940/203307 [2:16:29<12:12:20,  3.90it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31941/203307 [2:16:33<12:12:40,  3.90it/s, v_num=line, training/loss=0.0868]Epoch 0:  16%|█▌        | 31941/203307 [2:16:33<12:12:40,  3.90it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31942/203307 [2:16:37<12:12:59,  3.90it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31942/203307 [2:16:37<12:13:00,  3.90it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31943/203307 [2:16:42<12:13:22,  3.89it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31943/203307 [2:16:42<12:13:22,  3.89it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31944/203307 [2:16:46<12:13:40,  3.89it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31944/203307 [2:16:46<12:13:41,  3.89it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31945/203307 [2:16:49<12:14:00,  3.89it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31945/203307 [2:16:50<12:14:00,  3.89it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31946/203307 [2:16:54<12:14:23,  3.89it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31946/203307 [2:16:54<12:14:23,  3.89it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31947/203307 [2:16:59<12:14:45,  3.89it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31947/203307 [2:16:59<12:14:45,  3.89it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31948/203307 [2:17:02<12:15:04,  3.89it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31948/203307 [2:17:02<12:15:04,  3.89it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31949/203307 [2:17:06<12:15:24,  3.88it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31949/203307 [2:17:06<12:15:24,  3.88it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31950/203307 [2:17:10<12:15:43,  3.88it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31950/203307 [2:17:10<12:15:43,  3.88it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31951/203307 [2:17:14<12:16:02,  3.88it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31951/203307 [2:17:14<12:16:02,  3.88it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31952/203307 [2:17:18<12:16:24,  3.88it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31952/203307 [2:17:18<12:16:24,  3.88it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31953/203307 [2:17:22<12:16:44,  3.88it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31953/203307 [2:17:22<12:16:44,  3.88it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31954/203307 [2:17:27<12:17:07,  3.87it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31954/203307 [2:17:27<12:17:07,  3.87it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31955/203307 [2:17:32<12:17:29,  3.87it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31955/203307 [2:17:32<12:17:29,  3.87it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31956/203307 [2:17:36<12:17:51,  3.87it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31956/203307 [2:17:36<12:17:51,  3.87it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31957/203307 [2:17:40<12:18:11,  3.87it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31957/203307 [2:17:40<12:18:11,  3.87it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31958/203307 [2:17:44<12:18:30,  3.87it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31958/203307 [2:17:44<12:18:30,  3.87it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31959/203307 [2:17:47<12:18:48,  3.87it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31959/203307 [2:17:47<12:18:48,  3.87it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31960/203307 [2:17:51<12:19:06,  3.86it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31960/203307 [2:17:51<12:19:06,  3.86it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31961/203307 [2:17:56<12:19:28,  3.86it/s, v_num=line, training/loss=0.0764]Epoch 0:  16%|█▌        | 31961/203307 [2:17:56<12:19:28,  3.86it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31962/203307 [2:17:59<12:19:47,  3.86it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31962/203307 [2:17:59<12:19:47,  3.86it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31963/203307 [2:18:04<12:20:09,  3.86it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31963/203307 [2:18:04<12:20:09,  3.86it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31964/203307 [2:18:07<12:20:27,  3.86it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31964/203307 [2:18:07<12:20:27,  3.86it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31965/203307 [2:18:12<12:20:48,  3.85it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31965/203307 [2:18:12<12:20:48,  3.85it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31966/203307 [2:18:15<12:21:07,  3.85it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31966/203307 [2:18:15<12:21:07,  3.85it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31967/203307 [2:18:19<12:21:25,  3.85it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31967/203307 [2:18:19<12:21:25,  3.85it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31968/203307 [2:18:23<12:21:43,  3.85it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31968/203307 [2:18:23<12:21:43,  3.85it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31969/203307 [2:18:27<12:22:05,  3.85it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31969/203307 [2:18:27<12:22:05,  3.85it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31970/203307 [2:18:31<12:22:24,  3.85it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31970/203307 [2:18:31<12:22:24,  3.85it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31971/203307 [2:18:35<12:22:42,  3.84it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31971/203307 [2:18:35<12:22:42,  3.84it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31972/203307 [2:18:39<12:23:05,  3.84it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31972/203307 [2:18:39<12:23:05,  3.84it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31973/203307 [2:18:43<12:23:23,  3.84it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31973/203307 [2:18:43<12:23:23,  3.84it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31974/203307 [2:18:47<12:23:44,  3.84it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31974/203307 [2:18:47<12:23:44,  3.84it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31975/203307 [2:18:51<12:24:03,  3.84it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31975/203307 [2:18:51<12:24:03,  3.84it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31976/203307 [2:18:55<12:24:21,  3.84it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31976/203307 [2:18:55<12:24:21,  3.84it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31977/203307 [2:18:59<12:24:39,  3.83it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31977/203307 [2:18:59<12:24:40,  3.83it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31978/203307 [2:19:03<12:25:01,  3.83it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31978/203307 [2:19:03<12:25:02,  3.83it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31979/203307 [2:19:07<12:25:19,  3.83it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31979/203307 [2:19:07<12:25:20,  3.83it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31980/203307 [2:19:11<12:25:42,  3.83it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31980/203307 [2:19:11<12:25:42,  3.83it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31981/203307 [2:19:15<12:26:00,  3.83it/s, v_num=line, training/loss=0.0828]Epoch 0:  16%|█▌        | 31981/203307 [2:19:15<12:26:00,  3.83it/s, v_num=line, training/loss=0.087] Epoch 0:  16%|█▌        | 31982/203307 [2:19:19<12:26:18,  3.83it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31982/203307 [2:19:19<12:26:18,  3.83it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31983/203307 [2:19:23<12:26:40,  3.82it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31983/203307 [2:19:23<12:26:40,  3.82it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31984/203307 [2:19:27<12:26:58,  3.82it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31984/203307 [2:19:27<12:26:58,  3.82it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31985/203307 [2:19:30<12:27:16,  3.82it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31985/203307 [2:19:30<12:27:16,  3.82it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31986/203307 [2:19:34<12:27:34,  3.82it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31986/203307 [2:19:34<12:27:34,  3.82it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31987/203307 [2:19:38<12:27:56,  3.82it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31987/203307 [2:19:38<12:27:56,  3.82it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31988/203307 [2:19:43<12:28:19,  3.82it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31988/203307 [2:19:43<12:28:19,  3.82it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31989/203307 [2:19:48<12:28:42,  3.81it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31989/203307 [2:19:48<12:28:42,  3.81it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31990/203307 [2:19:51<12:29:01,  3.81it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31990/203307 [2:19:51<12:29:01,  3.81it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31991/203307 [2:19:55<12:29:20,  3.81it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31991/203307 [2:19:55<12:29:20,  3.81it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31992/203307 [2:20:00<12:29:42,  3.81it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31992/203307 [2:20:00<12:29:42,  3.81it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31993/203307 [2:20:04<12:30:01,  3.81it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31993/203307 [2:20:04<12:30:01,  3.81it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31994/203307 [2:20:07<12:30:20,  3.81it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31994/203307 [2:20:07<12:30:20,  3.81it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31995/203307 [2:20:12<12:30:42,  3.80it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31995/203307 [2:20:12<12:30:42,  3.80it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31996/203307 [2:20:16<12:31:00,  3.80it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31996/203307 [2:20:16<12:31:00,  3.80it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31997/203307 [2:20:20<12:31:23,  3.80it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31997/203307 [2:20:20<12:31:23,  3.80it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31998/203307 [2:20:25<12:31:46,  3.80it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31998/203307 [2:20:25<12:31:46,  3.80it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31999/203307 [2:20:29<12:32:05,  3.80it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 31999/203307 [2:20:29<12:32:05,  3.80it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 32000/203307 [2:20:32<12:32:23,  3.79it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 32000/203307 [2:20:32<12:32:23,  3.79it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 32001/203307 [2:20:37<12:32:46,  3.79it/s, v_num=line, training/loss=0.087]Epoch 0:  16%|█▌        | 32001/203307 [2:20:37<12:32:46,  3.79it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32002/203307 [2:20:41<12:33:05,  3.79it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32002/203307 [2:20:41<12:33:05,  3.79it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32003/203307 [2:20:45<12:33:24,  3.79it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32003/203307 [2:20:45<12:33:24,  3.79it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32004/203307 [2:20:49<12:33:46,  3.79it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32004/203307 [2:20:49<12:33:46,  3.79it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32005/203307 [2:20:53<12:34:08,  3.79it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32005/203307 [2:20:53<12:34:08,  3.79it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32006/203307 [2:20:58<12:34:31,  3.78it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32006/203307 [2:20:58<12:34:31,  3.78it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32007/203307 [2:21:02<12:34:50,  3.78it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32007/203307 [2:21:02<12:34:50,  3.78it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32008/203307 [2:21:06<12:35:08,  3.78it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32008/203307 [2:21:06<12:35:08,  3.78it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32009/203307 [2:21:10<12:35:27,  3.78it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32009/203307 [2:21:10<12:35:27,  3.78it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32010/203307 [2:21:14<12:35:49,  3.78it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32010/203307 [2:21:14<12:35:49,  3.78it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32011/203307 [2:21:18<12:36:08,  3.78it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32011/203307 [2:21:18<12:36:08,  3.78it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32012/203307 [2:21:22<12:36:27,  3.77it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32012/203307 [2:21:22<12:36:27,  3.77it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32013/203307 [2:21:26<12:36:49,  3.77it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32013/203307 [2:21:26<12:36:49,  3.77it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32014/203307 [2:21:30<12:37:08,  3.77it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32014/203307 [2:21:30<12:37:08,  3.77it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32015/203307 [2:21:34<12:37:31,  3.77it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32015/203307 [2:21:34<12:37:31,  3.77it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32016/203307 [2:21:38<12:37:50,  3.77it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32016/203307 [2:21:38<12:37:50,  3.77it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32017/203307 [2:21:42<12:38:09,  3.77it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32017/203307 [2:21:42<12:38:09,  3.77it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32018/203307 [2:21:46<12:38:27,  3.76it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32018/203307 [2:21:46<12:38:27,  3.76it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32019/203307 [2:21:50<12:38:49,  3.76it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32019/203307 [2:21:50<12:38:49,  3.76it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32020/203307 [2:21:54<12:39:08,  3.76it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32020/203307 [2:21:54<12:39:08,  3.76it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32021/203307 [2:21:59<12:39:31,  3.76it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32021/203307 [2:21:59<12:39:31,  3.76it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32022/203307 [2:22:03<12:39:53,  3.76it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32022/203307 [2:22:03<12:39:53,  3.76it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32023/203307 [2:22:07<12:40:11,  3.76it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32023/203307 [2:22:07<12:40:11,  3.76it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32024/203307 [2:22:12<12:40:34,  3.75it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32024/203307 [2:22:12<12:40:34,  3.75it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32025/203307 [2:22:15<12:40:53,  3.75it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32025/203307 [2:22:15<12:40:53,  3.75it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32026/203307 [2:22:19<12:41:11,  3.75it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32026/203307 [2:22:19<12:41:11,  3.75it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32027/203307 [2:22:23<12:41:30,  3.75it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32027/203307 [2:22:23<12:41:30,  3.75it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32028/203307 [2:22:27<12:41:51,  3.75it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32028/203307 [2:22:27<12:41:51,  3.75it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32029/203307 [2:22:31<12:42:09,  3.75it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32029/203307 [2:22:31<12:42:09,  3.75it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32030/203307 [2:22:35<12:42:32,  3.74it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32030/203307 [2:22:35<12:42:32,  3.74it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32031/203307 [2:22:39<12:42:50,  3.74it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32031/203307 [2:22:39<12:42:50,  3.74it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32032/203307 [2:22:44<12:43:12,  3.74it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32032/203307 [2:22:44<12:43:12,  3.74it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32033/203307 [2:22:47<12:43:30,  3.74it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32033/203307 [2:22:47<12:43:30,  3.74it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32034/203307 [2:22:51<12:43:48,  3.74it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32034/203307 [2:22:51<12:43:48,  3.74it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32035/203307 [2:22:55<12:44:07,  3.74it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32035/203307 [2:22:55<12:44:07,  3.74it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32036/203307 [2:22:59<12:44:25,  3.73it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32036/203307 [2:22:59<12:44:25,  3.73it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32037/203307 [2:23:03<12:44:46,  3.73it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32037/203307 [2:23:03<12:44:46,  3.73it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32038/203307 [2:23:07<12:45:08,  3.73it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32038/203307 [2:23:07<12:45:08,  3.73it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32039/203307 [2:23:12<12:45:29,  3.73it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32039/203307 [2:23:12<12:45:29,  3.73it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32040/203307 [2:23:15<12:45:48,  3.73it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32040/203307 [2:23:15<12:45:48,  3.73it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32041/203307 [2:23:20<12:46:10,  3.73it/s, v_num=line, training/loss=0.0809]Epoch 0:  16%|█▌        | 32041/203307 [2:23:20<12:46:10,  3.73it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32042/203307 [2:23:24<12:46:28,  3.72it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32042/203307 [2:23:24<12:46:28,  3.72it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32043/203307 [2:23:27<12:46:46,  3.72it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32043/203307 [2:23:27<12:46:46,  3.72it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32044/203307 [2:23:31<12:47:05,  3.72it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32044/203307 [2:23:31<12:47:05,  3.72it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32045/203307 [2:23:35<12:47:23,  3.72it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32045/203307 [2:23:35<12:47:23,  3.72it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32046/203307 [2:23:39<12:47:44,  3.72it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32046/203307 [2:23:39<12:47:44,  3.72it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32047/203307 [2:23:43<12:48:06,  3.72it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32047/203307 [2:23:43<12:48:06,  3.72it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32048/203307 [2:23:47<12:48:25,  3.71it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32048/203307 [2:23:47<12:48:25,  3.71it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32049/203307 [2:23:51<12:48:43,  3.71it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32049/203307 [2:23:51<12:48:43,  3.71it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32050/203307 [2:23:56<12:49:06,  3.71it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32050/203307 [2:23:56<12:49:06,  3.71it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32051/203307 [2:23:59<12:49:24,  3.71it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32051/203307 [2:23:59<12:49:24,  3.71it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32052/203307 [2:24:03<12:49:43,  3.71it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32052/203307 [2:24:03<12:49:43,  3.71it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32053/203307 [2:24:07<12:50:01,  3.71it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32053/203307 [2:24:07<12:50:01,  3.71it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32054/203307 [2:24:10<12:50:19,  3.71it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32054/203307 [2:24:10<12:50:19,  3.71it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32055/203307 [2:24:15<12:50:40,  3.70it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32055/203307 [2:24:15<12:50:40,  3.70it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32056/203307 [2:24:19<12:51:02,  3.70it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32056/203307 [2:24:19<12:51:02,  3.70it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32057/203307 [2:24:23<12:51:20,  3.70it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32057/203307 [2:24:23<12:51:20,  3.70it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32058/203307 [2:24:27<12:51:42,  3.70it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32058/203307 [2:24:27<12:51:42,  3.70it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32059/203307 [2:24:31<12:52:00,  3.70it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32059/203307 [2:24:31<12:52:00,  3.70it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32060/203307 [2:24:35<12:52:18,  3.70it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32060/203307 [2:24:35<12:52:18,  3.70it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32061/203307 [2:24:38<12:52:36,  3.69it/s, v_num=line, training/loss=0.0903]Epoch 0:  16%|█▌        | 32061/203307 [2:24:38<12:52:36,  3.69it/s, v_num=line, training/loss=0.082] Epoch 0:  16%|█▌        | 32062/203307 [2:24:42<12:52:55,  3.69it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32062/203307 [2:24:42<12:52:55,  3.69it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32063/203307 [2:24:47<12:53:17,  3.69it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32063/203307 [2:24:47<12:53:17,  3.69it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32064/203307 [2:24:51<12:53:38,  3.69it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32064/203307 [2:24:51<12:53:38,  3.69it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32065/203307 [2:24:55<12:54:00,  3.69it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32065/203307 [2:24:55<12:54:00,  3.69it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32066/203307 [2:24:59<12:54:18,  3.69it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32066/203307 [2:24:59<12:54:18,  3.69it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32067/203307 [2:25:04<12:54:40,  3.68it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32067/203307 [2:25:04<12:54:40,  3.68it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32068/203307 [2:25:07<12:54:58,  3.68it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32068/203307 [2:25:07<12:54:58,  3.68it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32069/203307 [2:25:11<12:55:16,  3.68it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32069/203307 [2:25:11<12:55:16,  3.68it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32070/203307 [2:25:15<12:55:35,  3.68it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32070/203307 [2:25:15<12:55:35,  3.68it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32071/203307 [2:25:19<12:55:53,  3.68it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32071/203307 [2:25:19<12:55:54,  3.68it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32072/203307 [2:25:23<12:56:15,  3.68it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32072/203307 [2:25:23<12:56:15,  3.68it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32073/203307 [2:25:27<12:56:36,  3.67it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32073/203307 [2:25:27<12:56:37,  3.67it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32074/203307 [2:25:31<12:56:55,  3.67it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32074/203307 [2:25:31<12:56:55,  3.67it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32075/203307 [2:25:35<12:57:13,  3.67it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32075/203307 [2:25:35<12:57:13,  3.67it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32076/203307 [2:25:39<12:57:35,  3.67it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32076/203307 [2:25:39<12:57:36,  3.67it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32077/203307 [2:25:43<12:57:53,  3.67it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32077/203307 [2:25:43<12:57:53,  3.67it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32078/203307 [2:25:47<12:58:11,  3.67it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32078/203307 [2:25:47<12:58:11,  3.67it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32079/203307 [2:25:50<12:58:30,  3.67it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32079/203307 [2:25:50<12:58:30,  3.67it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32080/203307 [2:25:55<12:58:51,  3.66it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32080/203307 [2:25:55<12:58:51,  3.66it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32081/203307 [2:25:59<12:59:10,  3.66it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32081/203307 [2:25:59<12:59:10,  3.66it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32082/203307 [2:26:03<12:59:31,  3.66it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32082/203307 [2:26:03<12:59:31,  3.66it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32083/203307 [2:26:07<12:59:49,  3.66it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32083/203307 [2:26:07<12:59:49,  3.66it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32084/203307 [2:26:11<13:00:11,  3.66it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32084/203307 [2:26:11<13:00:11,  3.66it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32085/203307 [2:26:15<13:00:29,  3.66it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32085/203307 [2:26:15<13:00:29,  3.66it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32086/203307 [2:26:18<13:00:47,  3.65it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32086/203307 [2:26:18<13:00:47,  3.65it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32087/203307 [2:26:22<13:01:05,  3.65it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32087/203307 [2:26:22<13:01:05,  3.65it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32088/203307 [2:26:27<13:01:27,  3.65it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32088/203307 [2:26:27<13:01:27,  3.65it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32089/203307 [2:26:30<13:01:45,  3.65it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32089/203307 [2:26:30<13:01:45,  3.65it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32090/203307 [2:26:34<13:02:03,  3.65it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32090/203307 [2:26:34<13:02:03,  3.65it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32091/203307 [2:26:38<13:02:25,  3.65it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32091/203307 [2:26:38<13:02:25,  3.65it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32092/203307 [2:26:42<13:02:43,  3.65it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32092/203307 [2:26:42<13:02:43,  3.65it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32093/203307 [2:26:47<13:03:06,  3.64it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32093/203307 [2:26:47<13:03:06,  3.64it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32094/203307 [2:26:50<13:03:24,  3.64it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32094/203307 [2:26:50<13:03:24,  3.64it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32095/203307 [2:26:54<13:03:42,  3.64it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32095/203307 [2:26:54<13:03:42,  3.64it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32096/203307 [2:26:58<13:04:00,  3.64it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32096/203307 [2:26:58<13:04:00,  3.64it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32097/203307 [2:27:02<13:04:22,  3.64it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32097/203307 [2:27:02<13:04:22,  3.64it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32098/203307 [2:27:06<13:04:40,  3.64it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32098/203307 [2:27:06<13:04:40,  3.64it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32099/203307 [2:27:10<13:05:01,  3.63it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32099/203307 [2:27:10<13:05:01,  3.63it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32100/203307 [2:27:14<13:05:21,  3.63it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32100/203307 [2:27:14<13:05:21,  3.63it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32101/203307 [2:27:18<13:05:39,  3.63it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32101/203307 [2:27:18<13:05:40,  3.63it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32102/203307 [2:27:23<13:06:01,  3.63it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32102/203307 [2:27:23<13:06:02,  3.63it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32103/203307 [2:27:26<13:06:19,  3.63it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32103/203307 [2:27:26<13:06:19,  3.63it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32104/203307 [2:27:30<13:06:37,  3.63it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32104/203307 [2:27:30<13:06:37,  3.63it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32105/203307 [2:27:34<13:06:59,  3.63it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32105/203307 [2:27:34<13:06:59,  3.63it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32106/203307 [2:27:38<13:07:17,  3.62it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32106/203307 [2:27:38<13:07:17,  3.62it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32107/203307 [2:27:42<13:07:35,  3.62it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32107/203307 [2:27:42<13:07:35,  3.62it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32108/203307 [2:27:46<13:07:57,  3.62it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32108/203307 [2:27:46<13:07:57,  3.62it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32109/203307 [2:27:51<13:08:19,  3.62it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32109/203307 [2:27:51<13:08:19,  3.62it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32110/203307 [2:27:55<13:08:41,  3.62it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32110/203307 [2:27:55<13:08:41,  3.62it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32111/203307 [2:27:59<13:09:00,  3.62it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32111/203307 [2:27:59<13:09:00,  3.62it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32112/203307 [2:28:03<13:09:18,  3.61it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32112/203307 [2:28:03<13:09:19,  3.61it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32113/203307 [2:28:07<13:09:40,  3.61it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32113/203307 [2:28:07<13:09:40,  3.61it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32114/203307 [2:28:11<13:09:59,  3.61it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32114/203307 [2:28:11<13:09:59,  3.61it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32115/203307 [2:28:15<13:10:18,  3.61it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32115/203307 [2:28:15<13:10:18,  3.61it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32116/203307 [2:28:19<13:10:36,  3.61it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32116/203307 [2:28:19<13:10:36,  3.61it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32117/203307 [2:28:23<13:10:58,  3.61it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32117/203307 [2:28:23<13:10:58,  3.61it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32118/203307 [2:28:28<13:11:19,  3.61it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32118/203307 [2:28:28<13:11:19,  3.61it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32119/203307 [2:28:32<13:11:41,  3.60it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32119/203307 [2:28:32<13:11:42,  3.60it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32120/203307 [2:28:36<13:12:00,  3.60it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32120/203307 [2:28:36<13:12:00,  3.60it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32121/203307 [2:28:40<13:12:20,  3.60it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▌        | 32121/203307 [2:28:40<13:12:20,  3.60it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32122/203307 [2:28:44<13:12:42,  3.60it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32122/203307 [2:28:44<13:12:42,  3.60it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32123/203307 [2:28:48<13:13:00,  3.60it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32123/203307 [2:28:48<13:13:00,  3.60it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32124/203307 [2:28:52<13:13:19,  3.60it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32124/203307 [2:28:52<13:13:19,  3.60it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32125/203307 [2:28:56<13:13:40,  3.59it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32125/203307 [2:28:56<13:13:41,  3.59it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32126/203307 [2:29:00<13:13:59,  3.59it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32126/203307 [2:29:00<13:13:59,  3.59it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32127/203307 [2:29:04<13:14:20,  3.59it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32127/203307 [2:29:04<13:14:20,  3.59it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32128/203307 [2:29:09<13:14:42,  3.59it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32128/203307 [2:29:09<13:14:42,  3.59it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32129/203307 [2:29:13<13:15:00,  3.59it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32129/203307 [2:29:13<13:15:00,  3.59it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32130/203307 [2:29:17<13:15:22,  3.59it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32130/203307 [2:29:17<13:15:22,  3.59it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32131/203307 [2:29:21<13:15:40,  3.59it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32131/203307 [2:29:21<13:15:40,  3.59it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32132/203307 [2:29:25<13:15:59,  3.58it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32132/203307 [2:29:25<13:15:59,  3.58it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32133/203307 [2:29:28<13:16:17,  3.58it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32133/203307 [2:29:28<13:16:17,  3.58it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32134/203307 [2:29:33<13:16:39,  3.58it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32134/203307 [2:29:33<13:16:39,  3.58it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32135/203307 [2:29:37<13:16:57,  3.58it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32135/203307 [2:29:37<13:16:57,  3.58it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32136/203307 [2:29:41<13:17:20,  3.58it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32136/203307 [2:29:41<13:17:20,  3.58it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32137/203307 [2:29:45<13:17:38,  3.58it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32137/203307 [2:29:45<13:17:38,  3.58it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32138/203307 [2:29:49<13:18:00,  3.57it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32138/203307 [2:29:49<13:18:00,  3.57it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32139/203307 [2:29:53<13:18:19,  3.57it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32139/203307 [2:29:53<13:18:19,  3.57it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32140/203307 [2:29:57<13:18:38,  3.57it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32140/203307 [2:29:57<13:18:38,  3.57it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32141/203307 [2:30:01<13:18:56,  3.57it/s, v_num=line, training/loss=0.0743]Epoch 0:  16%|█▌        | 32141/203307 [2:30:01<13:18:56,  3.57it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32142/203307 [2:30:05<13:19:15,  3.57it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32142/203307 [2:30:05<13:19:15,  3.57it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32143/203307 [2:30:09<13:19:37,  3.57it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32143/203307 [2:30:09<13:19:37,  3.57it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32144/203307 [2:30:13<13:19:55,  3.57it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32144/203307 [2:30:13<13:19:55,  3.57it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32145/203307 [2:30:17<13:20:17,  3.56it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32145/203307 [2:30:17<13:20:17,  3.56it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32146/203307 [2:30:21<13:20:36,  3.56it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32146/203307 [2:30:21<13:20:36,  3.56it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32147/203307 [2:30:26<13:20:58,  3.56it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32147/203307 [2:30:26<13:20:58,  3.56it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32148/203307 [2:30:30<13:21:17,  3.56it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32148/203307 [2:30:30<13:21:17,  3.56it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32149/203307 [2:30:33<13:21:35,  3.56it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32149/203307 [2:30:33<13:21:36,  3.56it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32150/203307 [2:30:37<13:21:55,  3.56it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32150/203307 [2:30:37<13:21:55,  3.56it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32151/203307 [2:30:42<13:22:17,  3.56it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32151/203307 [2:30:42<13:22:17,  3.56it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32152/203307 [2:30:46<13:22:36,  3.55it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32152/203307 [2:30:46<13:22:36,  3.55it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32153/203307 [2:30:50<13:22:54,  3.55it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32153/203307 [2:30:50<13:22:54,  3.55it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32154/203307 [2:30:54<13:23:17,  3.55it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32154/203307 [2:30:54<13:23:17,  3.55it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32155/203307 [2:30:59<13:23:39,  3.55it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32155/203307 [2:30:59<13:23:39,  3.55it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32156/203307 [2:31:02<13:23:58,  3.55it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32156/203307 [2:31:03<13:23:58,  3.55it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32157/203307 [2:31:06<13:24:16,  3.55it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32157/203307 [2:31:06<13:24:16,  3.55it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32158/203307 [2:31:10<13:24:35,  3.55it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32158/203307 [2:31:10<13:24:35,  3.55it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32159/203307 [2:31:14<13:24:54,  3.54it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32159/203307 [2:31:14<13:24:54,  3.54it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32160/203307 [2:31:19<13:25:16,  3.54it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32160/203307 [2:31:19<13:25:16,  3.54it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32161/203307 [2:31:22<13:25:35,  3.54it/s, v_num=line, training/loss=0.0865]Epoch 0:  16%|█▌        | 32161/203307 [2:31:22<13:25:35,  3.54it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32162/203307 [2:31:27<13:25:57,  3.54it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32162/203307 [2:31:27<13:25:57,  3.54it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32163/203307 [2:31:31<13:26:19,  3.54it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32163/203307 [2:31:31<13:26:19,  3.54it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32164/203307 [2:31:35<13:26:38,  3.54it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32164/203307 [2:31:35<13:26:38,  3.54it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32165/203307 [2:31:39<13:26:57,  3.53it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32165/203307 [2:31:39<13:26:57,  3.53it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32166/203307 [2:31:43<13:27:16,  3.53it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32166/203307 [2:31:43<13:27:16,  3.53it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32167/203307 [2:31:47<13:27:35,  3.53it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32167/203307 [2:31:47<13:27:35,  3.53it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32168/203307 [2:31:51<13:27:53,  3.53it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32168/203307 [2:31:51<13:27:53,  3.53it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32169/203307 [2:31:55<13:28:15,  3.53it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32169/203307 [2:31:55<13:28:15,  3.53it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32170/203307 [2:31:59<13:28:34,  3.53it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32170/203307 [2:31:59<13:28:34,  3.53it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32171/203307 [2:32:04<13:28:56,  3.53it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32171/203307 [2:32:04<13:28:56,  3.53it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32172/203307 [2:32:08<13:29:18,  3.52it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32172/203307 [2:32:08<13:29:18,  3.52it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32173/203307 [2:32:12<13:29:36,  3.52it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32173/203307 [2:32:12<13:29:36,  3.52it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32174/203307 [2:32:16<13:29:54,  3.52it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32174/203307 [2:32:16<13:29:54,  3.52it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32175/203307 [2:32:19<13:30:13,  3.52it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32175/203307 [2:32:19<13:30:13,  3.52it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32176/203307 [2:32:23<13:30:32,  3.52it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32176/203307 [2:32:23<13:30:32,  3.52it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32177/203307 [2:32:28<13:30:53,  3.52it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32177/203307 [2:32:28<13:30:53,  3.52it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32178/203307 [2:32:32<13:31:12,  3.52it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32178/203307 [2:32:32<13:31:12,  3.52it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32179/203307 [2:32:35<13:31:30,  3.51it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32179/203307 [2:32:35<13:31:30,  3.51it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32180/203307 [2:32:40<13:31:53,  3.51it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32180/203307 [2:32:40<13:31:53,  3.51it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32181/203307 [2:32:44<13:32:14,  3.51it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32181/203307 [2:32:44<13:32:14,  3.51it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32182/203307 [2:32:48<13:32:32,  3.51it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32182/203307 [2:32:48<13:32:32,  3.51it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32183/203307 [2:32:52<13:32:50,  3.51it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32183/203307 [2:32:52<13:32:51,  3.51it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32184/203307 [2:32:56<13:33:09,  3.51it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32184/203307 [2:32:56<13:33:09,  3.51it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32185/203307 [2:32:59<13:33:27,  3.51it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32185/203307 [2:32:59<13:33:27,  3.51it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32186/203307 [2:33:04<13:33:49,  3.50it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32186/203307 [2:33:04<13:33:49,  3.50it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32187/203307 [2:33:08<13:34:07,  3.50it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32187/203307 [2:33:08<13:34:07,  3.50it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32188/203307 [2:33:12<13:34:29,  3.50it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32188/203307 [2:33:12<13:34:29,  3.50it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32189/203307 [2:33:16<13:34:47,  3.50it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32189/203307 [2:33:16<13:34:47,  3.50it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32190/203307 [2:33:20<13:35:08,  3.50it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32190/203307 [2:33:20<13:35:08,  3.50it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32191/203307 [2:33:24<13:35:26,  3.50it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32191/203307 [2:33:24<13:35:26,  3.50it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32192/203307 [2:33:28<13:35:44,  3.50it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32192/203307 [2:33:28<13:35:44,  3.50it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32193/203307 [2:33:31<13:36:03,  3.49it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32193/203307 [2:33:31<13:36:03,  3.49it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32194/203307 [2:33:35<13:36:21,  3.49it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32194/203307 [2:33:35<13:36:21,  3.49it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32195/203307 [2:33:39<13:36:42,  3.49it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32195/203307 [2:33:39<13:36:42,  3.49it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32196/203307 [2:33:43<13:37:01,  3.49it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32196/203307 [2:33:43<13:37:01,  3.49it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32197/203307 [2:33:48<13:37:22,  3.49it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32197/203307 [2:33:48<13:37:22,  3.49it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32198/203307 [2:33:51<13:37:40,  3.49it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32198/203307 [2:33:51<13:37:40,  3.49it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32199/203307 [2:33:56<13:38:01,  3.49it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32199/203307 [2:33:56<13:38:01,  3.49it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32200/203307 [2:33:59<13:38:19,  3.48it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32200/203307 [2:33:59<13:38:19,  3.48it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32201/203307 [2:34:03<13:38:37,  3.48it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32201/203307 [2:34:03<13:38:37,  3.48it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32202/203307 [2:34:07<13:38:55,  3.48it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32202/203307 [2:34:07<13:38:56,  3.48it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32203/203307 [2:34:11<13:39:17,  3.48it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32203/203307 [2:34:11<13:39:17,  3.48it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32204/203307 [2:34:15<13:39:35,  3.48it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32204/203307 [2:34:15<13:39:35,  3.48it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32205/203307 [2:34:19<13:39:56,  3.48it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32205/203307 [2:34:19<13:39:56,  3.48it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32206/203307 [2:34:24<13:40:18,  3.48it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32206/203307 [2:34:24<13:40:18,  3.48it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32207/203307 [2:34:28<13:40:36,  3.48it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32207/203307 [2:34:28<13:40:36,  3.48it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32208/203307 [2:34:32<13:40:57,  3.47it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32208/203307 [2:34:32<13:40:57,  3.47it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32209/203307 [2:34:36<13:41:16,  3.47it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32209/203307 [2:34:36<13:41:16,  3.47it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32210/203307 [2:34:39<13:41:34,  3.47it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32210/203307 [2:34:39<13:41:34,  3.47it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32211/203307 [2:34:43<13:41:53,  3.47it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32211/203307 [2:34:43<13:41:53,  3.47it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32212/203307 [2:34:48<13:42:14,  3.47it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32212/203307 [2:34:48<13:42:14,  3.47it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32213/203307 [2:34:52<13:42:36,  3.47it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32213/203307 [2:34:52<13:42:36,  3.47it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32214/203307 [2:34:57<13:42:59,  3.46it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32214/203307 [2:34:57<13:42:59,  3.46it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32215/203307 [2:35:01<13:43:17,  3.46it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32215/203307 [2:35:01<13:43:17,  3.46it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32216/203307 [2:35:04<13:43:35,  3.46it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32216/203307 [2:35:04<13:43:36,  3.46it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32217/203307 [2:35:09<13:43:57,  3.46it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32217/203307 [2:35:09<13:43:57,  3.46it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32218/203307 [2:35:13<13:44:15,  3.46it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32218/203307 [2:35:13<13:44:15,  3.46it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32219/203307 [2:35:16<13:44:33,  3.46it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32219/203307 [2:35:16<13:44:33,  3.46it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32220/203307 [2:35:20<13:44:51,  3.46it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32220/203307 [2:35:20<13:44:51,  3.46it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32221/203307 [2:35:25<13:45:13,  3.46it/s, v_num=line, training/loss=0.0834]Epoch 0:  16%|█▌        | 32221/203307 [2:35:25<13:45:13,  3.46it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32222/203307 [2:35:29<13:45:35,  3.45it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32222/203307 [2:35:29<13:45:35,  3.45it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32223/203307 [2:35:33<13:45:57,  3.45it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32223/203307 [2:35:33<13:45:57,  3.45it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32224/203307 [2:35:37<13:46:15,  3.45it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32224/203307 [2:35:37<13:46:15,  3.45it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32225/203307 [2:35:41<13:46:33,  3.45it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32225/203307 [2:35:41<13:46:33,  3.45it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32226/203307 [2:35:45<13:46:54,  3.45it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32226/203307 [2:35:45<13:46:54,  3.45it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32227/203307 [2:35:49<13:47:12,  3.45it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32227/203307 [2:35:49<13:47:12,  3.45it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32228/203307 [2:35:53<13:47:30,  3.45it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32228/203307 [2:35:53<13:47:30,  3.45it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32229/203307 [2:35:57<13:47:52,  3.44it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32229/203307 [2:35:57<13:47:52,  3.44it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32230/203307 [2:36:02<13:48:13,  3.44it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32230/203307 [2:36:02<13:48:13,  3.44it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32231/203307 [2:36:05<13:48:32,  3.44it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32231/203307 [2:36:05<13:48:32,  3.44it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32232/203307 [2:36:10<13:48:54,  3.44it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32232/203307 [2:36:10<13:48:54,  3.44it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32233/203307 [2:36:14<13:49:12,  3.44it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32233/203307 [2:36:14<13:49:12,  3.44it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32234/203307 [2:36:17<13:49:30,  3.44it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32234/203307 [2:36:17<13:49:30,  3.44it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32235/203307 [2:36:22<13:49:51,  3.44it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32235/203307 [2:36:22<13:49:51,  3.44it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32236/203307 [2:36:25<13:50:09,  3.43it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32236/203307 [2:36:25<13:50:09,  3.43it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32237/203307 [2:36:29<13:50:27,  3.43it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32237/203307 [2:36:29<13:50:27,  3.43it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32238/203307 [2:36:34<13:50:49,  3.43it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32238/203307 [2:36:34<13:50:49,  3.43it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32239/203307 [2:36:37<13:51:07,  3.43it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32239/203307 [2:36:37<13:51:07,  3.43it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32240/203307 [2:36:42<13:51:29,  3.43it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32240/203307 [2:36:42<13:51:29,  3.43it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32241/203307 [2:36:46<13:51:48,  3.43it/s, v_num=line, training/loss=0.0799]Epoch 0:  16%|█▌        | 32241/203307 [2:36:46<13:51:48,  3.43it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32242/203307 [2:36:50<13:52:06,  3.43it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32242/203307 [2:36:50<13:52:06,  3.43it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32243/203307 [2:36:53<13:52:24,  3.43it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32243/203307 [2:36:53<13:52:24,  3.43it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32244/203307 [2:36:58<13:52:45,  3.42it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32244/203307 [2:36:58<13:52:45,  3.42it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32245/203307 [2:37:01<13:53:03,  3.42it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32245/203307 [2:37:01<13:53:03,  3.42it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32246/203307 [2:37:05<13:53:21,  3.42it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32246/203307 [2:37:05<13:53:21,  3.42it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32247/203307 [2:37:10<13:53:43,  3.42it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32247/203307 [2:37:10<13:53:43,  3.42it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32248/203307 [2:37:13<13:54:02,  3.42it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32248/203307 [2:37:13<13:54:02,  3.42it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32249/203307 [2:37:18<13:54:24,  3.42it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32249/203307 [2:37:18<13:54:24,  3.42it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32250/203307 [2:37:22<13:54:42,  3.42it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32250/203307 [2:37:22<13:54:42,  3.42it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32251/203307 [2:37:26<13:55:00,  3.41it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32251/203307 [2:37:26<13:55:00,  3.41it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32252/203307 [2:37:29<13:55:18,  3.41it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32252/203307 [2:37:29<13:55:18,  3.41it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32253/203307 [2:37:34<13:55:40,  3.41it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32253/203307 [2:37:34<13:55:40,  3.41it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32254/203307 [2:37:37<13:55:58,  3.41it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32254/203307 [2:37:37<13:55:58,  3.41it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32255/203307 [2:37:42<13:56:20,  3.41it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32255/203307 [2:37:42<13:56:20,  3.41it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32256/203307 [2:37:46<13:56:38,  3.41it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32256/203307 [2:37:46<13:56:38,  3.41it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32257/203307 [2:37:49<13:56:55,  3.41it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32257/203307 [2:37:49<13:56:55,  3.41it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32258/203307 [2:37:54<13:57:17,  3.40it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32258/203307 [2:37:54<13:57:18,  3.40it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32259/203307 [2:37:58<13:57:36,  3.40it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32259/203307 [2:37:58<13:57:36,  3.40it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32260/203307 [2:38:01<13:57:53,  3.40it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32260/203307 [2:38:01<13:57:53,  3.40it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32261/203307 [2:38:05<13:58:12,  3.40it/s, v_num=line, training/loss=0.0813]Epoch 0:  16%|█▌        | 32261/203307 [2:38:05<13:58:12,  3.40it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32262/203307 [2:38:09<13:58:32,  3.40it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32262/203307 [2:38:09<13:58:33,  3.40it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32263/203307 [2:38:14<13:58:54,  3.40it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32263/203307 [2:38:14<13:58:54,  3.40it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32264/203307 [2:38:18<13:59:15,  3.40it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32264/203307 [2:38:18<13:59:15,  3.40it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32265/203307 [2:38:22<13:59:33,  3.40it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32265/203307 [2:38:22<13:59:33,  3.40it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32266/203307 [2:38:26<13:59:54,  3.39it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32266/203307 [2:38:26<13:59:54,  3.39it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32267/203307 [2:38:30<14:00:12,  3.39it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32267/203307 [2:38:30<14:00:13,  3.39it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32268/203307 [2:38:34<14:00:31,  3.39it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32268/203307 [2:38:34<14:00:31,  3.39it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32269/203307 [2:38:38<14:00:49,  3.39it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32269/203307 [2:38:38<14:00:49,  3.39it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32270/203307 [2:38:41<14:01:07,  3.39it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32270/203307 [2:38:41<14:01:07,  3.39it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32271/203307 [2:38:46<14:01:29,  3.39it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32271/203307 [2:38:46<14:01:29,  3.39it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32272/203307 [2:38:50<14:01:50,  3.39it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32272/203307 [2:38:50<14:01:50,  3.39it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32273/203307 [2:38:54<14:02:11,  3.38it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32273/203307 [2:38:54<14:02:11,  3.38it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32274/203307 [2:38:58<14:02:29,  3.38it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32274/203307 [2:38:58<14:02:29,  3.38it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32275/203307 [2:39:03<14:02:51,  3.38it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32275/203307 [2:39:03<14:02:51,  3.38it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32276/203307 [2:39:06<14:03:09,  3.38it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32276/203307 [2:39:06<14:03:09,  3.38it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32277/203307 [2:39:10<14:03:27,  3.38it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32277/203307 [2:39:10<14:03:27,  3.38it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32278/203307 [2:39:14<14:03:45,  3.38it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32278/203307 [2:39:14<14:03:45,  3.38it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32279/203307 [2:39:18<14:04:04,  3.38it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32279/203307 [2:39:18<14:04:04,  3.38it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32280/203307 [2:39:22<14:04:26,  3.38it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32280/203307 [2:39:22<14:04:26,  3.38it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32281/203307 [2:39:27<14:04:47,  3.37it/s, v_num=line, training/loss=0.0821]Epoch 0:  16%|█▌        | 32281/203307 [2:39:27<14:04:47,  3.37it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32282/203307 [2:39:30<14:05:05,  3.37it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32282/203307 [2:39:31<14:05:05,  3.37it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32283/203307 [2:39:34<14:05:23,  3.37it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32283/203307 [2:39:34<14:05:23,  3.37it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32284/203307 [2:39:39<14:05:46,  3.37it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32284/203307 [2:39:39<14:05:46,  3.37it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32285/203307 [2:39:43<14:06:05,  3.37it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32285/203307 [2:39:43<14:06:05,  3.37it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32286/203307 [2:39:47<14:06:24,  3.37it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32286/203307 [2:39:47<14:06:24,  3.37it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32287/203307 [2:39:51<14:06:42,  3.37it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32287/203307 [2:39:51<14:06:42,  3.37it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32288/203307 [2:39:55<14:07:04,  3.36it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32288/203307 [2:39:55<14:07:04,  3.36it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32289/203307 [2:39:59<14:07:26,  3.36it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32289/203307 [2:40:00<14:07:26,  3.36it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32290/203307 [2:40:04<14:07:48,  3.36it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32290/203307 [2:40:04<14:07:48,  3.36it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32291/203307 [2:40:08<14:08:06,  3.36it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32291/203307 [2:40:08<14:08:07,  3.36it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32292/203307 [2:40:12<14:08:29,  3.36it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32292/203307 [2:40:12<14:08:29,  3.36it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32293/203307 [2:40:16<14:08:48,  3.36it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32293/203307 [2:40:16<14:08:48,  3.36it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32294/203307 [2:40:20<14:09:06,  3.36it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32294/203307 [2:40:20<14:09:06,  3.36it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32295/203307 [2:40:24<14:09:25,  3.36it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32295/203307 [2:40:24<14:09:25,  3.36it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32296/203307 [2:40:28<14:09:44,  3.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32296/203307 [2:40:28<14:09:44,  3.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32297/203307 [2:40:33<14:10:06,  3.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32297/203307 [2:40:33<14:10:06,  3.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32298/203307 [2:40:37<14:10:27,  3.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32298/203307 [2:40:37<14:10:27,  3.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32299/203307 [2:40:41<14:10:49,  3.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32299/203307 [2:40:41<14:10:49,  3.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32300/203307 [2:40:45<14:11:07,  3.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32300/203307 [2:40:45<14:11:07,  3.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32301/203307 [2:40:50<14:11:30,  3.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  16%|█▌        | 32301/203307 [2:40:50<14:11:30,  3.35it/s, v_num=line, training/loss=0.079] Epoch 0:  16%|█▌        | 32302/203307 [2:40:54<14:11:48,  3.35it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32302/203307 [2:40:54<14:11:48,  3.35it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32303/203307 [2:40:58<14:12:07,  3.34it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32303/203307 [2:40:58<14:12:07,  3.34it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32304/203307 [2:41:01<14:12:25,  3.34it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32304/203307 [2:41:01<14:12:25,  3.34it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32305/203307 [2:41:06<14:12:47,  3.34it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32305/203307 [2:41:06<14:12:47,  3.34it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32306/203307 [2:41:10<14:13:05,  3.34it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32306/203307 [2:41:10<14:13:05,  3.34it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32307/203307 [2:41:14<14:13:27,  3.34it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32307/203307 [2:41:14<14:13:27,  3.34it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32308/203307 [2:41:18<14:13:45,  3.34it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32308/203307 [2:41:18<14:13:45,  3.34it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32309/203307 [2:41:22<14:14:04,  3.34it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32309/203307 [2:41:22<14:14:04,  3.34it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32310/203307 [2:41:26<14:14:26,  3.34it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32310/203307 [2:41:26<14:14:26,  3.34it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32311/203307 [2:41:30<14:14:44,  3.33it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32311/203307 [2:41:30<14:14:44,  3.33it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32312/203307 [2:41:34<14:15:02,  3.33it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32312/203307 [2:41:34<14:15:02,  3.33it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32313/203307 [2:41:38<14:15:25,  3.33it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32313/203307 [2:41:39<14:15:25,  3.33it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32314/203307 [2:41:42<14:15:43,  3.33it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32314/203307 [2:41:42<14:15:43,  3.33it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32315/203307 [2:41:46<14:16:02,  3.33it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32315/203307 [2:41:46<14:16:02,  3.33it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32316/203307 [2:41:51<14:16:24,  3.33it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32316/203307 [2:41:51<14:16:24,  3.33it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32317/203307 [2:41:55<14:16:42,  3.33it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32317/203307 [2:41:55<14:16:42,  3.33it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32318/203307 [2:41:59<14:17:04,  3.33it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32318/203307 [2:41:59<14:17:04,  3.33it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32319/203307 [2:42:03<14:17:23,  3.32it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32319/203307 [2:42:03<14:17:23,  3.32it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32320/203307 [2:42:07<14:17:41,  3.32it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32320/203307 [2:42:07<14:17:41,  3.32it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32321/203307 [2:42:10<14:17:59,  3.32it/s, v_num=line, training/loss=0.079]Epoch 0:  16%|█▌        | 32321/203307 [2:42:10<14:17:59,  3.32it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32322/203307 [2:42:15<14:18:21,  3.32it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32322/203307 [2:42:15<14:18:21,  3.32it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32323/203307 [2:42:19<14:18:39,  3.32it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32323/203307 [2:42:19<14:18:39,  3.32it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32324/203307 [2:42:23<14:18:57,  3.32it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32324/203307 [2:42:23<14:18:57,  3.32it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32325/203307 [2:42:27<14:19:18,  3.32it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32325/203307 [2:42:27<14:19:19,  3.32it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32326/203307 [2:42:31<14:19:37,  3.32it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32326/203307 [2:42:31<14:19:37,  3.32it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32327/203307 [2:42:35<14:19:59,  3.31it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32327/203307 [2:42:35<14:19:59,  3.31it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32328/203307 [2:42:39<14:20:17,  3.31it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32328/203307 [2:42:39<14:20:17,  3.31it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32329/203307 [2:42:43<14:20:36,  3.31it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32329/203307 [2:42:43<14:20:36,  3.31it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32330/203307 [2:42:47<14:20:57,  3.31it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32330/203307 [2:42:47<14:20:57,  3.31it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32331/203307 [2:42:51<14:21:15,  3.31it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32331/203307 [2:42:51<14:21:15,  3.31it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32332/203307 [2:42:55<14:21:33,  3.31it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32332/203307 [2:42:55<14:21:33,  3.31it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32333/203307 [2:42:59<14:21:55,  3.31it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32333/203307 [2:42:59<14:21:55,  3.31it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32334/203307 [2:43:04<14:22:16,  3.30it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32334/203307 [2:43:04<14:22:16,  3.30it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32335/203307 [2:43:08<14:22:34,  3.30it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32335/203307 [2:43:08<14:22:34,  3.30it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32336/203307 [2:43:12<14:22:56,  3.30it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32336/203307 [2:43:12<14:22:56,  3.30it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32337/203307 [2:43:16<14:23:13,  3.30it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32337/203307 [2:43:16<14:23:13,  3.30it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32338/203307 [2:43:20<14:23:35,  3.30it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32338/203307 [2:43:20<14:23:35,  3.30it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32339/203307 [2:43:24<14:23:53,  3.30it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32339/203307 [2:43:24<14:23:53,  3.30it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32340/203307 [2:43:28<14:24:11,  3.30it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32340/203307 [2:43:28<14:24:11,  3.30it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32341/203307 [2:43:32<14:24:30,  3.30it/s, v_num=line, training/loss=0.0876]Epoch 0:  16%|█▌        | 32341/203307 [2:43:32<14:24:30,  3.30it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32342/203307 [2:43:36<14:24:51,  3.29it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32342/203307 [2:43:36<14:24:52,  3.29it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32343/203307 [2:43:40<14:25:13,  3.29it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32343/203307 [2:43:40<14:25:13,  3.29it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32344/203307 [2:43:45<14:25:35,  3.29it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32344/203307 [2:43:45<14:25:35,  3.29it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32345/203307 [2:43:49<14:25:54,  3.29it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32345/203307 [2:43:49<14:25:54,  3.29it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32346/203307 [2:43:53<14:26:13,  3.29it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32346/203307 [2:43:53<14:26:13,  3.29it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32347/203307 [2:43:57<14:26:35,  3.29it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32347/203307 [2:43:57<14:26:35,  3.29it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32348/203307 [2:44:01<14:26:53,  3.29it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32348/203307 [2:44:01<14:26:53,  3.29it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32349/203307 [2:44:05<14:27:12,  3.29it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32349/203307 [2:44:05<14:27:12,  3.29it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32350/203307 [2:44:09<14:27:30,  3.28it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32350/203307 [2:44:09<14:27:30,  3.28it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32351/203307 [2:44:13<14:27:52,  3.28it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32351/203307 [2:44:13<14:27:52,  3.28it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32352/203307 [2:44:18<14:28:13,  3.28it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32352/203307 [2:44:18<14:28:13,  3.28it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32353/203307 [2:44:22<14:28:35,  3.28it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32353/203307 [2:44:22<14:28:35,  3.28it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32354/203307 [2:44:26<14:28:54,  3.28it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32354/203307 [2:44:26<14:28:54,  3.28it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32355/203307 [2:44:31<14:29:16,  3.28it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32355/203307 [2:44:31<14:29:16,  3.28it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32356/203307 [2:44:35<14:29:35,  3.28it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32356/203307 [2:44:35<14:29:35,  3.28it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32357/203307 [2:44:39<14:29:53,  3.28it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32357/203307 [2:44:39<14:29:54,  3.28it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32358/203307 [2:44:42<14:30:12,  3.27it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32358/203307 [2:44:42<14:30:12,  3.27it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32359/203307 [2:44:47<14:30:33,  3.27it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32359/203307 [2:44:47<14:30:33,  3.27it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32360/203307 [2:44:51<14:30:52,  3.27it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32360/203307 [2:44:51<14:30:52,  3.27it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32361/203307 [2:44:55<14:31:14,  3.27it/s, v_num=line, training/loss=0.0841]Epoch 0:  16%|█▌        | 32361/203307 [2:44:55<14:31:14,  3.27it/s, v_num=line, training/loss=0.082] Epoch 0:  16%|█▌        | 32362/203307 [2:45:00<14:31:36,  3.27it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32362/203307 [2:45:00<14:31:36,  3.27it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32363/203307 [2:45:04<14:31:57,  3.27it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32363/203307 [2:45:04<14:31:58,  3.27it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32364/203307 [2:45:08<14:32:16,  3.27it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32364/203307 [2:45:08<14:32:16,  3.27it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32365/203307 [2:45:12<14:32:35,  3.27it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32365/203307 [2:45:12<14:32:35,  3.27it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32366/203307 [2:45:16<14:32:53,  3.26it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32366/203307 [2:45:16<14:32:53,  3.26it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32367/203307 [2:45:20<14:33:12,  3.26it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32367/203307 [2:45:20<14:33:12,  3.26it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32368/203307 [2:45:24<14:33:33,  3.26it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32368/203307 [2:45:24<14:33:33,  3.26it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32369/203307 [2:45:28<14:33:51,  3.26it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32369/203307 [2:45:28<14:33:51,  3.26it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32370/203307 [2:45:33<14:34:14,  3.26it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32370/203307 [2:45:33<14:34:14,  3.26it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32371/203307 [2:45:37<14:34:32,  3.26it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32371/203307 [2:45:37<14:34:32,  3.26it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32372/203307 [2:45:41<14:34:54,  3.26it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32372/203307 [2:45:41<14:34:54,  3.26it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32373/203307 [2:45:45<14:35:13,  3.26it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32373/203307 [2:45:45<14:35:13,  3.26it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32374/203307 [2:45:49<14:35:31,  3.25it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32374/203307 [2:45:49<14:35:31,  3.25it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32375/203307 [2:45:53<14:35:49,  3.25it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32375/203307 [2:45:53<14:35:49,  3.25it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32376/203307 [2:45:56<14:36:07,  3.25it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32376/203307 [2:45:56<14:36:07,  3.25it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32377/203307 [2:46:01<14:36:29,  3.25it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32377/203307 [2:46:01<14:36:29,  3.25it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32378/203307 [2:46:05<14:36:47,  3.25it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32378/203307 [2:46:05<14:36:47,  3.25it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32379/203307 [2:46:09<14:37:10,  3.25it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32379/203307 [2:46:09<14:37:10,  3.25it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32380/203307 [2:46:14<14:37:31,  3.25it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32380/203307 [2:46:14<14:37:31,  3.25it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32381/203307 [2:46:17<14:37:49,  3.25it/s, v_num=line, training/loss=0.082]Epoch 0:  16%|█▌        | 32381/203307 [2:46:17<14:37:49,  3.25it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32382/203307 [2:46:21<14:38:07,  3.24it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32382/203307 [2:46:21<14:38:07,  3.24it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32383/203307 [2:46:25<14:38:26,  3.24it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32383/203307 [2:46:25<14:38:26,  3.24it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32384/203307 [2:46:29<14:38:44,  3.24it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32384/203307 [2:46:29<14:38:44,  3.24it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32385/203307 [2:46:33<14:39:06,  3.24it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32385/203307 [2:46:33<14:39:06,  3.24it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32386/203307 [2:46:37<14:39:24,  3.24it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32386/203307 [2:46:37<14:39:24,  3.24it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32387/203307 [2:46:41<14:39:42,  3.24it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32387/203307 [2:46:41<14:39:42,  3.24it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32388/203307 [2:46:46<14:40:04,  3.24it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32388/203307 [2:46:46<14:40:04,  3.24it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32389/203307 [2:46:49<14:40:22,  3.24it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32389/203307 [2:46:49<14:40:22,  3.24it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32390/203307 [2:46:53<14:40:41,  3.23it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32390/203307 [2:46:53<14:40:41,  3.23it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32391/203307 [2:46:57<14:40:59,  3.23it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32391/203307 [2:46:57<14:40:59,  3.23it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32392/203307 [2:47:01<14:41:18,  3.23it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32392/203307 [2:47:01<14:41:18,  3.23it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32393/203307 [2:47:05<14:41:36,  3.23it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32393/203307 [2:47:05<14:41:36,  3.23it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32394/203307 [2:47:09<14:41:57,  3.23it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32394/203307 [2:47:09<14:41:57,  3.23it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32395/203307 [2:47:13<14:42:15,  3.23it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32395/203307 [2:47:13<14:42:15,  3.23it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32396/203307 [2:47:18<14:42:37,  3.23it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32396/203307 [2:47:18<14:42:37,  3.23it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32397/203307 [2:47:22<14:42:58,  3.23it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32397/203307 [2:47:22<14:42:58,  3.23it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32398/203307 [2:47:26<14:43:16,  3.22it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32398/203307 [2:47:26<14:43:16,  3.22it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32399/203307 [2:47:29<14:43:34,  3.22it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32399/203307 [2:47:29<14:43:34,  3.22it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32400/203307 [2:47:33<14:43:52,  3.22it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32400/203307 [2:47:33<14:43:52,  3.22it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32401/203307 [2:47:37<14:44:10,  3.22it/s, v_num=line, training/loss=0.089]Epoch 0:  16%|█▌        | 32401/203307 [2:47:37<14:44:10,  3.22it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32402/203307 [2:47:41<14:44:28,  3.22it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32402/203307 [2:47:41<14:44:28,  3.22it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32403/203307 [2:47:45<14:44:51,  3.22it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32403/203307 [2:47:45<14:44:51,  3.22it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32404/203307 [2:47:49<14:45:09,  3.22it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32404/203307 [2:47:49<14:45:09,  3.22it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32405/203307 [2:47:54<14:45:31,  3.22it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32405/203307 [2:47:54<14:45:31,  3.22it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32406/203307 [2:47:58<14:45:52,  3.22it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32406/203307 [2:47:58<14:45:52,  3.22it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32407/203307 [2:48:02<14:46:10,  3.21it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32407/203307 [2:48:02<14:46:10,  3.21it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32408/203307 [2:48:06<14:46:28,  3.21it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32408/203307 [2:48:06<14:46:28,  3.21it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32409/203307 [2:48:10<14:46:47,  3.21it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32409/203307 [2:48:10<14:46:47,  3.21it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32410/203307 [2:48:13<14:47:05,  3.21it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32410/203307 [2:48:14<14:47:05,  3.21it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32411/203307 [2:48:18<14:47:26,  3.21it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32411/203307 [2:48:18<14:47:26,  3.21it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32412/203307 [2:48:22<14:47:44,  3.21it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32412/203307 [2:48:22<14:47:45,  3.21it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32413/203307 [2:48:26<14:48:05,  3.21it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32413/203307 [2:48:26<14:48:06,  3.21it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32414/203307 [2:48:31<14:48:27,  3.21it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32414/203307 [2:48:31<14:48:28,  3.21it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32415/203307 [2:48:35<14:48:48,  3.20it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32415/203307 [2:48:35<14:48:48,  3.20it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32416/203307 [2:48:39<14:49:07,  3.20it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32416/203307 [2:48:39<14:49:07,  3.20it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32417/203307 [2:48:43<14:49:25,  3.20it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32417/203307 [2:48:43<14:49:25,  3.20it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32418/203307 [2:48:46<14:49:43,  3.20it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32418/203307 [2:48:46<14:49:43,  3.20it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32419/203307 [2:48:50<14:50:01,  3.20it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32419/203307 [2:48:50<14:50:01,  3.20it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32420/203307 [2:48:55<14:50:23,  3.20it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32420/203307 [2:48:55<14:50:23,  3.20it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32421/203307 [2:48:59<14:50:41,  3.20it/s, v_num=line, training/loss=0.0872]Epoch 0:  16%|█▌        | 32421/203307 [2:48:59<14:50:41,  3.20it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32422/203307 [2:49:03<14:51:03,  3.20it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32422/203307 [2:49:03<14:51:03,  3.20it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32423/203307 [2:49:07<14:51:22,  3.20it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32423/203307 [2:49:07<14:51:22,  3.20it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32424/203307 [2:49:11<14:51:42,  3.19it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32424/203307 [2:49:11<14:51:42,  3.19it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32425/203307 [2:49:15<14:52:00,  3.19it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32425/203307 [2:49:15<14:52:00,  3.19it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32426/203307 [2:49:19<14:52:19,  3.19it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32426/203307 [2:49:19<14:52:19,  3.19it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32427/203307 [2:49:23<14:52:37,  3.19it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32427/203307 [2:49:23<14:52:37,  3.19it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32428/203307 [2:49:27<14:52:55,  3.19it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32428/203307 [2:49:27<14:52:55,  3.19it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32429/203307 [2:49:31<14:53:16,  3.19it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32429/203307 [2:49:31<14:53:16,  3.19it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32430/203307 [2:49:36<14:53:38,  3.19it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32430/203307 [2:49:36<14:53:38,  3.19it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32431/203307 [2:49:40<14:54:00,  3.19it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32431/203307 [2:49:40<14:54:00,  3.19it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32432/203307 [2:49:44<14:54:19,  3.18it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32432/203307 [2:49:44<14:54:19,  3.18it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32433/203307 [2:49:48<14:54:40,  3.18it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32433/203307 [2:49:48<14:54:40,  3.18it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32434/203307 [2:49:52<14:54:58,  3.18it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32434/203307 [2:49:52<14:54:58,  3.18it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32435/203307 [2:49:56<14:55:16,  3.18it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32435/203307 [2:49:56<14:55:16,  3.18it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32436/203307 [2:50:00<14:55:34,  3.18it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32436/203307 [2:50:00<14:55:34,  3.18it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32437/203307 [2:50:04<14:55:54,  3.18it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32437/203307 [2:50:04<14:55:54,  3.18it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32438/203307 [2:50:08<14:56:15,  3.18it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32438/203307 [2:50:08<14:56:15,  3.18it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32439/203307 [2:50:12<14:56:33,  3.18it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32439/203307 [2:50:12<14:56:33,  3.18it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32440/203307 [2:50:16<14:56:54,  3.18it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32440/203307 [2:50:17<14:56:54,  3.18it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32441/203307 [2:50:20<14:57:12,  3.17it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32441/203307 [2:50:20<14:57:12,  3.17it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32442/203307 [2:50:24<14:57:32,  3.17it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32442/203307 [2:50:24<14:57:32,  3.17it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32443/203307 [2:50:28<14:57:50,  3.17it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32443/203307 [2:50:28<14:57:50,  3.17it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32444/203307 [2:50:32<14:58:08,  3.17it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32444/203307 [2:50:32<14:58:08,  3.17it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32445/203307 [2:50:36<14:58:26,  3.17it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32445/203307 [2:50:36<14:58:26,  3.17it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32446/203307 [2:50:40<14:58:48,  3.17it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32446/203307 [2:50:40<14:58:48,  3.17it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32447/203307 [2:50:45<14:59:09,  3.17it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32447/203307 [2:50:45<14:59:10,  3.17it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32448/203307 [2:50:49<14:59:31,  3.17it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32448/203307 [2:50:49<14:59:31,  3.17it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32449/203307 [2:50:53<14:59:49,  3.16it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32449/203307 [2:50:53<14:59:49,  3.16it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32450/203307 [2:50:57<15:00:07,  3.16it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32450/203307 [2:50:57<15:00:07,  3.16it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32451/203307 [2:51:01<15:00:28,  3.16it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32451/203307 [2:51:01<15:00:28,  3.16it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32452/203307 [2:51:05<15:00:46,  3.16it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32452/203307 [2:51:05<15:00:46,  3.16it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32453/203307 [2:51:09<15:01:04,  3.16it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32453/203307 [2:51:09<15:01:04,  3.16it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32454/203307 [2:51:13<15:01:22,  3.16it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32454/203307 [2:51:13<15:01:22,  3.16it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32455/203307 [2:51:17<15:01:44,  3.16it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32455/203307 [2:51:17<15:01:44,  3.16it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32456/203307 [2:51:21<15:02:02,  3.16it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32456/203307 [2:51:21<15:02:02,  3.16it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32457/203307 [2:51:25<15:02:23,  3.16it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32457/203307 [2:51:25<15:02:24,  3.16it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32458/203307 [2:51:29<15:02:41,  3.15it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32458/203307 [2:51:29<15:02:42,  3.15it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32459/203307 [2:51:33<15:03:00,  3.15it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32459/203307 [2:51:33<15:03:00,  3.15it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32460/203307 [2:51:37<15:03:20,  3.15it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32460/203307 [2:51:37<15:03:21,  3.15it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32461/203307 [2:51:41<15:03:38,  3.15it/s, v_num=line, training/loss=0.0736]Epoch 0:  16%|█▌        | 32461/203307 [2:51:41<15:03:38,  3.15it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32462/203307 [2:51:45<15:03:57,  3.15it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32462/203307 [2:51:45<15:03:57,  3.15it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32463/203307 [2:51:50<15:04:18,  3.15it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32463/203307 [2:51:50<15:04:18,  3.15it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32464/203307 [2:51:53<15:04:36,  3.15it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32464/203307 [2:51:53<15:04:36,  3.15it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32465/203307 [2:51:57<15:04:55,  3.15it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32465/203307 [2:51:57<15:04:55,  3.15it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32466/203307 [2:52:02<15:05:16,  3.15it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32466/203307 [2:52:02<15:05:16,  3.15it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32467/203307 [2:52:05<15:05:34,  3.14it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32467/203307 [2:52:05<15:05:34,  3.14it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32468/203307 [2:52:09<15:05:52,  3.14it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32468/203307 [2:52:09<15:05:52,  3.14it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32469/203307 [2:52:14<15:06:13,  3.14it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32469/203307 [2:52:14<15:06:13,  3.14it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32470/203307 [2:52:17<15:06:31,  3.14it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32470/203307 [2:52:17<15:06:31,  3.14it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32471/203307 [2:52:21<15:06:49,  3.14it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32471/203307 [2:52:21<15:06:49,  3.14it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32472/203307 [2:52:26<15:07:11,  3.14it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32472/203307 [2:52:26<15:07:11,  3.14it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32473/203307 [2:52:29<15:07:28,  3.14it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32473/203307 [2:52:29<15:07:29,  3.14it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32474/203307 [2:52:34<15:07:50,  3.14it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32474/203307 [2:52:34<15:07:50,  3.14it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32475/203307 [2:52:38<15:08:08,  3.14it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32475/203307 [2:52:38<15:08:08,  3.14it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32476/203307 [2:52:42<15:08:26,  3.13it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32476/203307 [2:52:42<15:08:26,  3.13it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32477/203307 [2:52:45<15:08:45,  3.13it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32477/203307 [2:52:45<15:08:45,  3.13it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32478/203307 [2:52:50<15:09:06,  3.13it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32478/203307 [2:52:50<15:09:06,  3.13it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32479/203307 [2:52:54<15:09:24,  3.13it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32479/203307 [2:52:54<15:09:24,  3.13it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32480/203307 [2:52:58<15:09:45,  3.13it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32480/203307 [2:52:58<15:09:45,  3.13it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32481/203307 [2:53:02<15:10:06,  3.13it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32481/203307 [2:53:02<15:10:06,  3.13it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32482/203307 [2:53:06<15:10:24,  3.13it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32482/203307 [2:53:06<15:10:24,  3.13it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32483/203307 [2:53:11<15:10:46,  3.13it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32483/203307 [2:53:11<15:10:46,  3.13it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32484/203307 [2:53:15<15:11:04,  3.12it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32484/203307 [2:53:15<15:11:04,  3.12it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32485/203307 [2:53:18<15:11:21,  3.12it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32485/203307 [2:53:18<15:11:21,  3.12it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32486/203307 [2:53:22<15:11:40,  3.12it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32486/203307 [2:53:22<15:11:40,  3.12it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32487/203307 [2:53:26<15:12:00,  3.12it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32487/203307 [2:53:26<15:12:00,  3.12it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32488/203307 [2:53:31<15:12:21,  3.12it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32488/203307 [2:53:31<15:12:21,  3.12it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32489/203307 [2:53:35<15:12:42,  3.12it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32489/203307 [2:53:35<15:12:42,  3.12it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32490/203307 [2:53:39<15:13:00,  3.12it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32490/203307 [2:53:39<15:13:00,  3.12it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32491/203307 [2:53:43<15:13:18,  3.12it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32491/203307 [2:53:43<15:13:18,  3.12it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32492/203307 [2:53:47<15:13:40,  3.12it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32492/203307 [2:53:47<15:13:40,  3.12it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32493/203307 [2:53:51<15:13:57,  3.11it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32493/203307 [2:53:51<15:13:57,  3.11it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32494/203307 [2:53:55<15:14:15,  3.11it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32494/203307 [2:53:55<15:14:15,  3.11it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32495/203307 [2:53:58<15:14:32,  3.11it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32495/203307 [2:53:58<15:14:32,  3.11it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32496/203307 [2:54:03<15:14:53,  3.11it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32496/203307 [2:54:03<15:14:53,  3.11it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32497/203307 [2:54:07<15:15:14,  3.11it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32497/203307 [2:54:07<15:15:14,  3.11it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32498/203307 [2:54:11<15:15:35,  3.11it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32498/203307 [2:54:11<15:15:35,  3.11it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32499/203307 [2:54:15<15:15:52,  3.11it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32499/203307 [2:54:15<15:15:52,  3.11it/s, v_num=line, training/loss=0.0892]
Validation: |          | 0/? [00:00<?, ?it/s][A
Validation:   0%|          | 0/1 [00:00<?, ?it/s][A


Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s][A[A

Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:26,  1.15it/s][A[A

Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:25,  1.15it/s][A[A

Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:24,  1.15it/s][A[A

Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:23,  1.15it/s][A[A

Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:23,  1.14it/s][A[A

Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:22,  1.14it/s][A[A

Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:21,  1.14it/s][A[A

Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:21,  1.13it/s][A[A

Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:20,  1.13it/s][A[A

Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:23,  1.18it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:22,  1.18it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:22,  1.18it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:21,  1.18it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:20,  1.18it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:19,  1.18it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:05<01:19,  1.18it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:06<01:18,  1.17it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:17,  1.17it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:17,  1.16it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:16,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:25,  1.16it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:24,  1.16it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:23,  1.16it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:22,  1.16it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:21,  1.16it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:20,  1.16it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:20,  1.15it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:06<01:19,  1.15it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:19,  1.15it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:18,  1.15it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:17,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:25,  1.16it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:24,  1.16it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:23,  1.17it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:22,  1.17it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:21,  1.16it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:21,  1.15it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:20,  1.15it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:06<01:20,  1.15it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:19,  1.14it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:19,  1.14it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:18,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:25,  1.16it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:24,  1.15it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:23,  1.16it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:23,  1.15it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:22,  1.15it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:22,  1.14it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:21,  1.14it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:06<01:20,  1.14it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:20,  1.13it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:19,  1.13it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:18,  1.1Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:19,  1.13it/s][A[A

Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:27,  1.13it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:26,  1.14it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:24,  1.14it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:23,  1.14it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:23,  1.14it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:22,  1.14it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:22,  1.13it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:21,  1.13it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:20,  1.13it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:20,  1.12it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:19,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:30,  1.09it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:28,  1.10it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:27,  1.11it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:26,  1.11it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:25,  1.12it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:24,  1.12it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:23,  1.11it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:23,  1.11it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:22,  1.10it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:09<01:21,  1.10it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:20,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:29,  1.10it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:28,  1.11it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:27,  1.11it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:26,  1.10it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:26,  1.10it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:25,  1.11it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:24,  1.10it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:23,  1.10it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:23,  1.09it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:09<01:22,  1.09it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:10<01:21,  1.0Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:19,  1.13it/s][A[A

Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:18,  1.13it/s][A[A

Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:17,  1.13it/s][A[A

Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:16,  1.12it/s][A[A

Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:15,  1.12it/s][A[A

Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:14,  1.12it/s][A[A

Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:13,  1.12it/s][A[A

Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:13,  1.12it/s][A[A

Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:12,  1.12it/s][A[A

Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:11,  1.12it/s][A[A

Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:10,  1.11it/s][A[A

6it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:15,  1.16it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:14,  1.16it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:11<01:14,  1.16it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:12<01:13,  1.16it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:13<01:12,  1.16it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:11,  1.16it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:10,  1.16it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:10,  1.16it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:09,  1.16it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:08,  1.15it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:18<01:07,  1.15it/s]Sampling (mamba memory):  62%|██████▏   | 123/4it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:16,  1.14it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:16,  1.14it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:15,  1.14it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:14,  1.15it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:13<01:13,  1.14it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:12,  1.14it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:11,  1.14it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:11,  1.14it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:10,  1.14it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:09,  1.13it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:09,  1.13it/s]Sampling (mamba memory):  62%|██████▏   | 123/3it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:17,  1.14it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:16,  1.14it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:15,  1.13it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:15,  1.13it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:14,  1.13it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:13,  1.13it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:12,  1.13it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:11,  1.13it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:11,  1.12it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:10,  1.12it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:10,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 123/3it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:17,  1.13it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:16,  1.13it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:16,  1.13it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:15,  1.13it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:14,  1.13it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:13,  1.13it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:12,  1.12it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:12,  1.12it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:11,  1.12it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:11,  1.11it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:10,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 123/Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:10,  1.11it/s][A[A

2it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:18,  1.12it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:17,  1.12it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:16,  1.12it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:16,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:15,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:14,  1.12it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:13,  1.12it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:12,  1.12it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:11,  1.11it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:11,  1.11it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:10,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 123/0it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:19,  1.11it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:18,  1.11it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:17,  1.12it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:16,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:15,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:14,  1.11it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:13,  1.11it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:12,  1.11it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:12,  1.11it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:11,  1.11it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:10,  1.10it/s]Sampling (mamba memory):  62%|██████▏   | 123/9it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:20,  1.09it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:19,  1.09it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:18,  1.10it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:17,  1.10it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:16,  1.10it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:15,  1.09it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:15,  1.09it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:14,  1.09it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:13,  1.09it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:19<01:12,  1.08it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:20<01:12,  1.08it/s]Sampling (mamba memory):  62%|██████▏   | 123/Sampling (mamba memory):  62%|██████▏   | 123/200 [00:20<01:09,  1.11it/s][A[A

Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:08,  1.11it/s][A[A

Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:07,  1.11it/s][A[A

Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:06,  1.10it/s][A[A

Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:06,  1.10it/s][A[A

Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:05,  1.10it/s][A[A

Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:04,  1.10it/s][A[A

Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:03,  1.09it/s][A[A

Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:03,  1.09it/s][A[A

Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:02,  1.09it/s][A[A

200 [00:19<01:06,  1.15it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:20<01:05,  1.15it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:21<01:05,  1.15it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:22<01:04,  1.15it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:03,  1.15it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:02,  1.15it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:02,  1.14it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:25<01:01,  1.14it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:26<01:00,  1.14it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:27<00:59,  1.14it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:28<00:59,  1.13it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:29<00:58,  1.13it/s]Sampling (mamba Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:01,  1.09it/s][A[A

200 [00:20<01:07,  1.13it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:20<01:06,  1.14it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:21<01:05,  1.14it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:22<01:04,  1.14it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:04,  1.14it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:03,  1.14it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:02,  1.14it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:01,  1.13it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:01,  1.13it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:00,  1.13it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:28<00:59,  1.13it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:29<00:58,  1.13it/s]Sampling (mamba 200 [00:20<01:10,  1.10it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:09,  1.10it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:08,  1.10it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:06,  1.11it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:05,  1.11it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:05,  1.11it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:04,  1.11it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:03,  1.11it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:02,  1.10it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:01,  1.10it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:01,  1.10it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:00,  1.10it/s]Sampling (mamba 200 [00:20<01:09,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:08,  1.11it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:07,  1.11it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:06,  1.11it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:06,  1.10it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:05,  1.10it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:04,  1.10it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:03,  1.10it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:03,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:02,  1.09it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:01,  1.09it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:00,  1.09it/s]Sampling (mamba Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:00,  1.09it/s][A[A

200 [00:20<01:09,  1.10it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:08,  1.10it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:08,  1.10it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:07,  1.10it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:06,  1.10it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:05,  1.10it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:04,  1.09it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:04,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:03,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:02,  1.09it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:01,  1.09it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:00,  1.10it/s]Sampling (mamba 200 [00:20<01:09,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:08,  1.11it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:07,  1.11it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:06,  1.11it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:05,  1.11it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:05,  1.11it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:04,  1.10it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:04,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:03,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:02,  1.08it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:02,  1.08it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:01,  1.08it/s]Sampling (mamba 200 [00:21<01:11,  1.08it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:10,  1.08it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:09,  1.08it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:08,  1.08it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:07,  1.08it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:07,  1.07it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:06,  1.07it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:05,  1.07it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:04,  1.07it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:03,  1.07it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:03,  1.06it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<01:02,  1.06it/s]Sampling (mamba Sampling (mamba memory):  68%|██████▊   | 135/200 [00:31<00:59,  1.09it/s][A[A

Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:58,  1.09it/s][A[A

Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:58,  1.08it/s][A[A

Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:57,  1.08it/s][A[A

Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:56,  1.08it/s][A[A

Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:55,  1.08it/s][A[A

Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:54,  1.08it/s][A[A

Sampling (mamba memory):  71%|███████   | 142/200 [00:37<00:53,  1.08it/s][A[A

Sampling (mamba memory):  72%|███████▏  | 143/200 [00:38<00:52,  1.08it/s][A[A

memory):  68%|██████▊   | 135/200 [00:30<00:57,  1.13it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:31<00:56,  1.13it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:32<00:55,  1.13it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:32<00:55,  1.12it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:33<00:54,  1.12it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:34<00:53,  1.12it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:35<00:52,  1.12it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:36<00:52,  1.11it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:37<00:51,  1.11it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:38<00:50,  1.11it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:39<00:49,  1.11it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:30<00:57,  1.13it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:31<00:56,  1.13it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:32<00:55,  1.13it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:33<00:55,  1.12it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:34<00:54,  1.12it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:35<00:53,  1.12it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:36<00:52,  1.12it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:36<00:52,  1.11it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:37<00:51,  1.11it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:38<00:50,  1.11it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:39<00:49,  1.11it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:51,  1.08it/s][A[A

memory):  68%|██████▊   | 135/200 [00:31<00:59,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:58,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:57,  1.09it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:33<00:57,  1.09it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:34<00:56,  1.09it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:35<00:55,  1.09it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:36<00:54,  1.08it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:37<00:53,  1.08it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:38<00:52,  1.08it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:51,  1.08it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:51,  1.08it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:51,  1.07it/s][A[A

memory):  68%|██████▊   | 135/200 [00:31<00:59,  1.10it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:58,  1.10it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:57,  1.10it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:56,  1.10it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:55,  1.10it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:54,  1.10it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:36<00:54,  1.09it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:37<00:53,  1.08it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:38<00:52,  1.08it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:52,  1.07it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:51,  1.07it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:31<00:59,  1.09it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:58,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:58,  1.08it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:57,  1.08it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:56,  1.08it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:55,  1.08it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:36<00:55,  1.07it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:37<00:54,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:38<00:53,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:52,  1.06it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:51,  1.06it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:31<01:00,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:59,  1.07it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:58,  1.07it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:58,  1.06it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:57,  1.06it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:56,  1.06it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:55,  1.06it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:55,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:54,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:53,  1.05it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:52,  1.05it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  73%|███████▎  | 146/200 [00:41<00:50,  1.07it/s][A[A

memory):  68%|██████▊   | 135/200 [00:32<01:01,  1.06it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:33<01:00,  1.06it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:34<00:59,  1.06it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:35<00:58,  1.06it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:36<00:57,  1.05it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:37<00:57,  1.05it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:38<00:56,  1.05it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:55,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:54,  1.05it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:53,  1.04it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:52,  1.04it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:49,  1.07it/s][A[A

Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:48,  1.07it/s][A[A

Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:47,  1.07it/s][A[A

Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:46,  1.07it/s][A[A

Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:45,  1.07it/s][A[A

Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:45,  1.06it/s][A[A

Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:43,  1.07it/s][A[A

Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:43,  1.07it/s][A[A

 | 146/200 [00:40<00:48,  1.10it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:41<00:48,  1.10it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:42<00:47,  1.10it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:42<00:46,  1.10it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:43<00:45,  1.10it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:44<00:44,  1.10it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:45<00:43,  1.10it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:46<00:42,  1.09it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:47<00:42,  1.09it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:48<00:41,  1.09it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:49<00:40,  1.09it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:50<00:39 | 146/200 [00:40<00:48,  1.10it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:41<00:48,  1.10it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:42<00:47,  1.10it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:43<00:46,  1.10it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:44<00:45,  1.10it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:45<00:44,  1.10it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:46<00:43,  1.09it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:46<00:43,  1.09it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:47<00:42,  1.08it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:48<00:41,  1.08it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:49<00:40,  1.08it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:50<00:39Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:42,  1.07it/s][A[A

 | 146/200 [00:41<00:50,  1.08it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:49,  1.07it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:48,  1.07it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:47,  1.07it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:46,  1.07it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:45,  1.07it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:44,  1.07it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:47<00:44,  1.07it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:48<00:43,  1.07it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:49<00:42,  1.07it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:50<00:41,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:51<00:40Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:41,  1.06it/s][A[A

 | 146/200 [00:41<00:50,  1.07it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:49,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:48,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:47,  1.06it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:46,  1.06it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:46,  1.06it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:45,  1.06it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:44,  1.06it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:43,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:42,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:41,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:40 | 146/200 [00:41<00:50,  1.06it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:49,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:48,  1.06it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:47,  1.06it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:46,  1.07it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:46,  1.06it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:45,  1.06it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:44,  1.06it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:43,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:42,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:41,  1.06it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:40 | 146/200 [00:42<00:51,  1.05it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:50,  1.04it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:49,  1.04it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:48,  1.04it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:48,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:47,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:48<00:46,  1.03it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:45,  1.03it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:44,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:43,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:42,  1.02it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:42Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:40,  1.06it/s][A[A

 | 146/200 [00:42<00:51,  1.04it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:51,  1.04it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:49,  1.04it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:49,  1.04it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:48,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:47,  1.04it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:48<00:46,  1.04it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:49<00:45,  1.04it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:50<00:44,  1.04it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:51<00:43,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:52<00:42,  1.03it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:53<00:41Sampling (mamba memory):  79%|███████▉  | 158/200 [00:52<00:39,  1.05it/s][A[A

Sampling (mamba memory):  80%|███████▉  | 159/200 [00:53<00:39,  1.05it/s][A[A

Sampling (mamba memory):  80%|████████  | 160/200 [00:54<00:38,  1.05it/s][A[A

Sampling (mamba memory):  80%|████████  | 161/200 [00:55<00:37,  1.04it/s][A[A

Sampling (mamba memory):  81%|████████  | 162/200 [00:56<00:36,  1.04it/s][A[A

Sampling (mamba memory):  82%|████████▏ | 163/200 [00:57<00:35,  1.03it/s][A[A

Sampling (mamba memory):  82%|████████▏ | 164/200 [00:58<00:34,  1.03it/s][A[A

,  1.09it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:51<00:38,  1.09it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:52<00:37,  1.08it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:53<00:37,  1.08it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:54<00:36,  1.08it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:54<00:35,  1.07it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:55<00:34,  1.07it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:56<00:33,  1.07it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [00:57<00:32,  1.07it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [00:58<00:31,  1.06it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [00:59<00:31,  1.06it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:00<00:30,  1.06it/sSampling (mamba memory):  82%|████████▎ | 165/200 [00:59<00:34,  1.03it/s][A[A

,  1.08it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:51<00:38,  1.08it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:52<00:38,  1.08it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:53<00:37,  1.08it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:54<00:36,  1.07it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:55<00:35,  1.07it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:56<00:34,  1.07it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:57<00:33,  1.06it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [00:58<00:32,  1.06it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [00:59<00:32,  1.06it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:00<00:31,  1.06it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:01<00:30,  1.06it/sSampling (mamba memory):  83%|████████▎ | 166/200 [01:00<00:33,  1.03it/s][A[A

,  1.06it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:52<00:39,  1.06it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:53<00:38,  1.06it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:54<00:37,  1.06it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:55<00:36,  1.06it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:56<00:35,  1.06it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:57<00:35,  1.06it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:58<00:34,  1.05it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [00:59<00:33,  1.05it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:00<00:32,  1.05it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:01<00:31,  1.05it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:02<00:30,  1.04it/s,  1.06it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:52<00:39,  1.06it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:53<00:38,  1.06it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:54<00:37,  1.06it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:55<00:37,  1.05it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:56<00:36,  1.05it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:57<00:35,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:58<00:34,  1.04it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [00:59<00:33,  1.04it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:00<00:32,  1.04it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:01<00:31,  1.04it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:02<00:30,  1.04it/s,  1.06it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:53<00:39,  1.05it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:53<00:38,  1.05it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:54<00:38,  1.05it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:55<00:37,  1.05it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:56<00:36,  1.05it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:57<00:35,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:58<00:34,  1.04it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [00:59<00:33,  1.04it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:00<00:32,  1.04it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:01<00:31,  1.04it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:02<00:30,  1.04it/sSampling (mamba memory):  84%|████████▎ | 167/200 [01:01<00:32,  1.02it/s][A[A

Sampling (mamba memory):  84%|████████▍ | 168/200 [01:02<00:31,  1.02it/s][A[A

,  1.02it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:53<00:41,  1.02it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:54<00:40,  1.02it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:55<00:39,  1.02it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:56<00:38,  1.02it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:57<00:37,  1.01it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:36,  1.01it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:35,  1.01it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:34,  1.01it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:33,  1.01it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:02<00:32,  1.01it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:03<00:31,  1.01it/s,  1.03it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:54<00:40,  1.02it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:55<00:40,  1.02it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:56<00:39,  1.02it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:57<00:38,  1.01it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:58<00:37,  1.01it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:59<00:36,  1.01it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:00<00:35,  1.00it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:01<00:34,  1.00it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:02<00:33,  1.00it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:03<00:32,  1.00it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:04<00:31,  1.00it/sSampling (mamba memory):  84%|████████▍ | 169/200 [01:03<00:30,  1.02it/s][A[A

Sampling (mamba memory):  85%|████████▌ | 170/200 [01:04<00:29,  1.02it/s][A[A

Sampling (mamba memory):  86%|████████▌ | 171/200 [01:05<00:28,  1.02it/s][A[A

Sampling (mamba memory):  86%|████████▌ | 172/200 [01:06<00:27,  1.03it/s][A[A

Sampling (mamba memory):  86%|████████▋ | 173/200 [01:07<00:26,  1.03it/s][A[A

Sampling (mamba memory):  87%|████████▋ | 174/200 [01:08<00:25,  1.03it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 175/200 [01:09<00:24,  1.03it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:01<00:29,  1.06it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:02<00:28,  1.06it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:03<00:27,  1.06it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:04<00:26,  1.05it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:05<00:25,  1.05it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:06<00:24,  1.05it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:07<00:23,  1.05it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:08<00:22,  1.05it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:09<00:21,  1.05it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:10<00:20,  1.05it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:11<00:19,  1.05it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:10<00:23,  1.03it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:02<00:29,  1.05it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:02<00:28,  1.05it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:03<00:27,  1.05it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:04<00:26,  1.05it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:05<00:25,  1.05it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:06<00:24,  1.04it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:07<00:24,  1.04it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:08<00:23,  1.04it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:09<00:22,  1.04it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:10<00:21,  1.04it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:11<00:20,  1.03it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:11<00:22,  1.02it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:03<00:29,  1.04it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:04<00:29,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:05<00:28,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:06<00:27,  1.03it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:07<00:26,  1.03it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:08<00:25,  1.04it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:09<00:24,  1.04it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:09<00:23,  1.03it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:10<00:22,  1.03it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:11<00:21,  1.03it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:12<00:20,  1.03it/s]]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:03<00:29,  1.04it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:04<00:28,  1.04it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:05<00:27,  1.04it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:06<00:27,  1.04it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:07<00:26,  1.04it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:08<00:25,  1.03it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:09<00:24,  1.03it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:10<00:23,  1.03it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:11<00:22,  1.03it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:12<00:21,  1.03it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:13<00:20,  1.03it/s]]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:03<00:29,  1.03it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:04<00:29,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:05<00:28,  1.03it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:06<00:27,  1.03it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:07<00:26,  1.03it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:08<00:25,  1.03it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:09<00:24,  1.03it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:10<00:23,  1.03it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:11<00:22,  1.02it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:12<00:21,  1.02it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:13<00:20,  1.02it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:12<00:21,  1.02it/s][A[A

Sampling (mamba memory):  90%|████████▉ | 179/200 [01:13<00:20,  1.02it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:04<00:30,  1.00it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:05<00:29,  1.00it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:06<00:28,  1.00it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:07<00:28,  1.00s/it]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:08<00:27,  1.01s/it]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:09<00:26,  1.00s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:10<00:25,  1.00s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:11<00:23,  1.00it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:12<00:22,  1.00it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:13<00:21,  1.00it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:14<00:20,  1.00it/s]Sampling (mamba memory):  90%|█████████ | 180/200 [01:14<00:19,  1.02it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:05<00:30,  1.00it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:06<00:30,  1.00s/it]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:07<00:29,  1.00s/it]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:08<00:28,  1.01s/it]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:09<00:27,  1.01s/it]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:10<00:26,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:11<00:25,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:12<00:24,  1.02s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:13<00:23,  1.02s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:14<00:22,  1.02s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:15<00:21,  1.02s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:15<00:18,  1.02it/s][A[A

Sampling (mamba memory):  91%|█████████ | 182/200 [01:16<00:17,  1.01it/s][A[A

Sampling (mamba memory):  92%|█████████▏| 183/200 [01:17<00:16,  1.01it/s][A[A

Sampling (mamba memory):  92%|█████████▏| 184/200 [01:18<00:15,  1.01it/s][A[A

Sampling (mamba memory):  92%|█████████▎| 185/200 [01:19<00:14,  1.01it/s][A[A

Sampling (mamba memory):  93%|█████████▎| 186/200 [01:20<00:13,  1.01it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:12<00:19,  1.05it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:13<00:18,  1.05it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:13<00:17,  1.05it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:14<00:16,  1.05it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:15<00:15,  1.04it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:16<00:14,  1.04it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:17<00:13,  1.04it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:18<00:12,  1.04it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:19<00:11,  1.04it/s]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:20<00:10,  1.03it/s]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:21<00Sampling (mamba memory):  94%|█████████▎| 187/200 [01:21<00:12,  1.01it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:12<00:19,  1.03it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:13<00:18,  1.03it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:14<00:17,  1.03it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:15<00:16,  1.03it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:16<00:15,  1.02it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:17<00:14,  1.02it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:18<00:13,  1.02it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:19<00:12,  1.02it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:20<00:11,  1.02it/s]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:21<00:10,  1.02it/s]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:22<00Sampling (mamba memory):  94%|█████████▍| 188/200 [01:22<00:11,  1.01it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:13<00:19,  1.02it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:14<00:18,  1.02it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:15<00:17,  1.02it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:16<00:16,  1.02it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:17<00:15,  1.01it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:18<00:14,  1.01it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:19<00:13,  1.01it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:20<00:12,  1.01it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:21<00:11,  1.01it/s]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:22<00:10,  1.01it/s]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:23<00Sampling (mamba memory):  90%|█████████ | 180/200 [01:14<00:19,  1.02it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:15<00:18,  1.02it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:16<00:17,  1.02it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:17<00:16,  1.02it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:18<00:15,  1.02it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:19<00:14,  1.02it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:20<00:13,  1.02it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:21<00:12,  1.01it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:22<00:11,  1.01it/s]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:23<00:10,  1.01it/s]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:24<00Sampling (mamba memory):  90%|█████████ | 180/200 [01:14<00:19,  1.02it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:15<00:18,  1.02it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:16<00:17,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:17<00:16,  1.01it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:18<00:15,  1.01it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:19<00:14,  1.01it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:20<00:13,  1.01it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:21<00:12,  1.01it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:22<00:11,  1.01it/s]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:23<00:10,  1.00it/s]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:24<00Sampling (mamba memory):  94%|█████████▍| 189/200 [01:23<00:10,  1.00it/s][A[A

Sampling (mamba memory):  95%|█████████▌| 190/200 [01:24<00:09,  1.00it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:15<00:19,  1.00it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:16<00:18,  1.00it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:17<00:17,  1.00it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:18<00:16,  1.00it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:19<00:16,  1.00s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:20<00:15,  1.00s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:21<00:14,  1.01s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:22<00:13,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:23<00:12,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:24<00:11,  1.01s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:25<00Sampling (mamba memory):  96%|█████████▌| 191/200 [01:25<00:08,  1.00it/s][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:16<00:20,  1.02s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:17<00:19,  1.03s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:18<00:18,  1.03s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:19<00:17,  1.03s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:20<00:16,  1.03s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:21<00:15,  1.04s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:22<00:14,  1.04s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:23<00:13,  1.04s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:24<00:12,  1.04s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:25<00:11,  1.04s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:27<00Sampling (mamba memory):  96%|█████████▌| 192/200 [01:26<00:08,  1.00s/it][A[A

Sampling (mamba memory):  96%|█████████▋| 193/200 [01:27<00:07,  1.01s/it][A[A

Sampling (mamba memory):  97%|█████████▋| 194/200 [01:28<00:06,  1.01s/it][A[A

Sampling (mamba memory):  98%|█████████▊| 195/200 [01:29<00:05,  1.01s/it][A[A

Sampling (mamba memory):  98%|█████████▊| 196/200 [01:30<00:04,  1.01s/it][A[A

Sampling (mamba memory):  98%|█████████▊| 197/200 [01:31<00:03,  1.01s/it][A[A

Sampling (mamba memory):  99%|█████████▉| 198/200 [01:32<00:02,  1.00s/it][A[A

Sampling (mamba memory): 100%|█████████▉| 199/200 [01:33<00:01,  1.00s/it][A[A

:09,  1.03it/s]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:22<00:08,  1.03it/s]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:23<00:07,  1.03it/s]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:24<00:06,  1.02it/s]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:25<00:05,  1.02it/s]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:26<00:04,  1.01it/s]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:27<00:03,  1.01it/s]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:28<00:02,  1.01it/s]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:29<00:01,  1.00it/s]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:30<00:00,  1.00it/s]Sampling (mamba memory): 100%|██████████| 200/200 [01:31<00:00,  1.00s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:36<00:00,  1.04it/s]
:09,  1.01it/s]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:23<00:08,  1.01it/s]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:24<00:07,  1.01it/s]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:25<00:06,  1.01it/s]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:26<00:05,  1.01it/s]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:27<00:04,  1.01it/s]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:28<00:03,  1.00it/s]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:29<00:02,  1.00it/s]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:30<00:01,  1.00it/s]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:31<00:00,  1.00it/s]Sampling (mamba memory): 100%|██████████| 200/200 [01:32<00:00,  1.00it/s]Sampling (mamba memory): 100%|██████████| 200/200 [01:37<00:00,  1.03it/s]
:09,  1.00it/s]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:24<00:09,  1.00s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:25<00:08,  1.01s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:26<00:07,  1.01s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:27<00:06,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:28<00:05,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:29<00:04,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:30<00:03,  1.02s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:31<00:02,  1.02s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:33<00:01,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:34<00:00,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:39<00:00,  1.01it/s]
:09,  1.00it/s]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:25<00:08,  1.00it/s]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:26<00:08,  1.00s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:27<00:07,  1.01s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:28<00:06,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:29<00:05,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:30<00:04,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:31<00:03,  1.01s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:32<00:02,  1.01s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:33<00:01,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:34<00:00,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:39<00:00,  1.01it/s]
:09,  1.00it/s]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:25<00:09,  1.00s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:26<00:08,  1.00s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:27<00:07,  1.01s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:28<00:06,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:29<00:05,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:30<00:04,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:31<00:03,  1.01s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:32<00:02,  1.01s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:33<00:01,  1.01s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:34<00:00,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:39<00:00,  1.00it/s]
Sampling (mamba memory): 100%|██████████| 200/200 [01:34<00:00,  1.00s/it][A[ASampling (mamba memory): 100%|██████████| 200/200 [01:39<00:00,  1.00it/s]
Validation DataLoader 0:   0%|          | 0/1 [00:00<?, ?it/s][A
:10,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:26<00:09,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:27<00:08,  1.02s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:28<00:07,  1.02s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:30<00:06,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:31<00:05,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:32<00:04,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:33<00:03,  1.02s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:34<00:02,  1.02s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:35<00:01,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:36<00:00,  1.02s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:41<00:00,  1.01s/it]
:10,  1.05s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:28<00:09,  1.04s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:29<00:08,  1.05s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:30<00:07,  1.05s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:31<00:06,  1.05s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:32<00:05,  1.05s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:33<00:04,  1.04s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:34<00:03,  1.04s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:35<00:02,  1.04s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:36<00:01,  1.04s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:37<00:00,  1.04s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:42<00:00,  1.02s/it]
Validation DataLoader 0: 100%|██████████| 1/1 [01:39<00:00,  0.01it/s][A
                                                                      [AEpoch 0:  16%|█▌        | 32499/203307 [2:56:10<15:25:55,  3.07it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32500/203307 [2:56:15<15:26:20,  3.07it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32500/203307 [2:56:15<15:26:20,  3.07it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32501/203307 [2:56:19<15:26:37,  3.07it/s, v_num=line, training/loss=0.0892]Epoch 0:  16%|█▌        | 32501/203307 [2:56:19<15:26:37,  3.07it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32502/203307 [2:56:22<15:26:55,  3.07it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32502/203307 [2:56:22<15:26:55,  3.07it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32503/203307 [2:56:26<15:27:13,  3.07it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32503/203307 [2:56:26<15:27:13,  3.07it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32504/203307 [2:56:31<15:27:34,  3.07it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32504/203307 [2:56:31<15:27:34,  3.07it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32505/203307 [2:56:34<15:27:52,  3.07it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32505/203307 [2:56:34<15:27:52,  3.07it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32506/203307 [2:56:39<15:28:13,  3.07it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32506/203307 [2:56:39<15:28:13,  3.07it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32507/203307 [2:56:42<15:28:29,  3.07it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32507/203307 [2:56:42<15:28:29,  3.07it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32508/203307 [2:56:46<15:28:48,  3.06it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32508/203307 [2:56:46<15:28:48,  3.06it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32509/203307 [2:56:50<15:29:07,  3.06it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32509/203307 [2:56:50<15:29:07,  3.06it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32510/203307 [2:56:55<15:29:29,  3.06it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32510/203307 [2:56:55<15:29:29,  3.06it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32511/203307 [2:56:59<15:29:47,  3.06it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32511/203307 [2:56:59<15:29:47,  3.06it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32512/203307 [2:57:03<15:30:05,  3.06it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32512/203307 [2:57:03<15:30:05,  3.06it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32513/203307 [2:57:07<15:30:26,  3.06it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32513/203307 [2:57:07<15:30:26,  3.06it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32514/203307 [2:57:11<15:30:44,  3.06it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32514/203307 [2:57:11<15:30:44,  3.06it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32515/203307 [2:57:15<15:31:06,  3.06it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32515/203307 [2:57:15<15:31:06,  3.06it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32516/203307 [2:57:19<15:31:24,  3.06it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32516/203307 [2:57:19<15:31:24,  3.06it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32517/203307 [2:57:23<15:31:41,  3.06it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32517/203307 [2:57:23<15:31:41,  3.06it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32518/203307 [2:57:27<15:32:03,  3.05it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32518/203307 [2:57:27<15:32:03,  3.05it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32519/203307 [2:57:31<15:32:21,  3.05it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32519/203307 [2:57:31<15:32:21,  3.05it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32520/203307 [2:57:35<15:32:39,  3.05it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32520/203307 [2:57:35<15:32:39,  3.05it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32521/203307 [2:57:39<15:33:01,  3.05it/s, v_num=line, training/loss=0.0888]Epoch 0:  16%|█▌        | 32521/203307 [2:57:39<15:33:01,  3.05it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32522/203307 [2:57:44<15:33:22,  3.05it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32522/203307 [2:57:44<15:33:22,  3.05it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32523/203307 [2:57:48<15:33:43,  3.05it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32523/203307 [2:57:48<15:33:43,  3.05it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32524/203307 [2:57:52<15:34:01,  3.05it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32524/203307 [2:57:52<15:34:01,  3.05it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32525/203307 [2:57:56<15:34:19,  3.05it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32525/203307 [2:57:56<15:34:19,  3.05it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32526/203307 [2:58:00<15:34:41,  3.05it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32526/203307 [2:58:00<15:34:41,  3.05it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32527/203307 [2:58:04<15:34:59,  3.04it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32527/203307 [2:58:04<15:34:59,  3.04it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32528/203307 [2:58:08<15:35:17,  3.04it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32528/203307 [2:58:08<15:35:17,  3.04it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32529/203307 [2:58:12<15:35:38,  3.04it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32529/203307 [2:58:12<15:35:38,  3.04it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32530/203307 [2:58:16<15:35:56,  3.04it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32530/203307 [2:58:16<15:35:56,  3.04it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32531/203307 [2:58:20<15:36:14,  3.04it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32531/203307 [2:58:20<15:36:14,  3.04it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32532/203307 [2:58:25<15:36:35,  3.04it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32532/203307 [2:58:25<15:36:35,  3.04it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32533/203307 [2:58:28<15:36:53,  3.04it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32533/203307 [2:58:28<15:36:53,  3.04it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32534/203307 [2:58:32<15:37:11,  3.04it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32534/203307 [2:58:32<15:37:11,  3.04it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32535/203307 [2:58:37<15:37:33,  3.04it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32535/203307 [2:58:37<15:37:33,  3.04it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32536/203307 [2:58:41<15:37:52,  3.03it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32536/203307 [2:58:41<15:37:52,  3.03it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32537/203307 [2:58:45<15:38:10,  3.03it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32537/203307 [2:58:45<15:38:10,  3.03it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32538/203307 [2:58:49<15:38:31,  3.03it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32538/203307 [2:58:49<15:38:32,  3.03it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32539/203307 [2:58:53<15:38:50,  3.03it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32539/203307 [2:58:53<15:38:50,  3.03it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32540/203307 [2:58:57<15:39:11,  3.03it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32540/203307 [2:58:57<15:39:11,  3.03it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32541/203307 [2:59:01<15:39:29,  3.03it/s, v_num=line, training/loss=0.0902]Epoch 0:  16%|█▌        | 32541/203307 [2:59:01<15:39:29,  3.03it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32542/203307 [2:59:05<15:39:47,  3.03it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32542/203307 [2:59:05<15:39:47,  3.03it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32543/203307 [2:59:10<15:40:09,  3.03it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32543/203307 [2:59:10<15:40:09,  3.03it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32544/203307 [2:59:14<15:40:27,  3.03it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32544/203307 [2:59:14<15:40:27,  3.03it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32545/203307 [2:59:17<15:40:45,  3.03it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32545/203307 [2:59:17<15:40:45,  3.03it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32546/203307 [2:59:22<15:41:06,  3.02it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32546/203307 [2:59:22<15:41:07,  3.02it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32547/203307 [2:59:26<15:41:25,  3.02it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32547/203307 [2:59:26<15:41:25,  3.02it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32548/203307 [2:59:30<15:41:46,  3.02it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32548/203307 [2:59:30<15:41:46,  3.02it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32549/203307 [2:59:34<15:42:06,  3.02it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32549/203307 [2:59:34<15:42:06,  3.02it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32550/203307 [2:59:38<15:42:24,  3.02it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32550/203307 [2:59:38<15:42:24,  3.02it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32551/203307 [2:59:42<15:42:42,  3.02it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32551/203307 [2:59:42<15:42:43,  3.02it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32552/203307 [2:59:47<15:43:05,  3.02it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32552/203307 [2:59:47<15:43:05,  3.02it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32553/203307 [2:59:50<15:43:22,  3.02it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32553/203307 [2:59:50<15:43:22,  3.02it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32554/203307 [2:59:55<15:43:43,  3.02it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32554/203307 [2:59:55<15:43:44,  3.02it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32555/203307 [2:59:59<15:44:01,  3.01it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32555/203307 [2:59:59<15:44:01,  3.01it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32556/203307 [3:00:02<15:44:19,  3.01it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32556/203307 [3:00:02<15:44:19,  3.01it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32557/203307 [3:00:07<15:44:40,  3.01it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32557/203307 [3:00:07<15:44:40,  3.01it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32558/203307 [3:00:11<15:44:58,  3.01it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32558/203307 [3:00:11<15:44:58,  3.01it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32559/203307 [3:00:15<15:45:19,  3.01it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32559/203307 [3:00:15<15:45:19,  3.01it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32560/203307 [3:00:19<15:45:37,  3.01it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32560/203307 [3:00:19<15:45:37,  3.01it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32561/203307 [3:00:23<15:45:58,  3.01it/s, v_num=line, training/loss=0.0779]Epoch 0:  16%|█▌        | 32561/203307 [3:00:23<15:45:58,  3.01it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32562/203307 [3:00:27<15:46:16,  3.01it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32562/203307 [3:00:27<15:46:16,  3.01it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32563/203307 [3:00:31<15:46:37,  3.01it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32563/203307 [3:00:31<15:46:37,  3.01it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32564/203307 [3:00:35<15:46:55,  3.01it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32564/203307 [3:00:35<15:46:55,  3.01it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32565/203307 [3:00:40<15:47:16,  3.00it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32565/203307 [3:00:40<15:47:16,  3.00it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32566/203307 [3:00:43<15:47:34,  3.00it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32566/203307 [3:00:44<15:47:34,  3.00it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32567/203307 [3:00:47<15:47:51,  3.00it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32567/203307 [3:00:47<15:47:51,  3.00it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32568/203307 [3:00:52<15:48:12,  3.00it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32568/203307 [3:00:52<15:48:12,  3.00it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32569/203307 [3:00:56<15:48:34,  3.00it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32569/203307 [3:00:56<15:48:34,  3.00it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32570/203307 [3:01:00<15:48:52,  3.00it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32570/203307 [3:01:00<15:48:52,  3.00it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32571/203307 [3:01:04<15:49:13,  3.00it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32571/203307 [3:01:04<15:49:13,  3.00it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32572/203307 [3:01:08<15:49:31,  3.00it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32572/203307 [3:01:08<15:49:31,  3.00it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32573/203307 [3:01:13<15:49:51,  3.00it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32573/203307 [3:01:13<15:49:51,  3.00it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32574/203307 [3:01:16<15:50:09,  2.99it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32574/203307 [3:01:16<15:50:09,  2.99it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32575/203307 [3:01:20<15:50:27,  2.99it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32575/203307 [3:01:20<15:50:27,  2.99it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32576/203307 [3:01:24<15:50:45,  2.99it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32576/203307 [3:01:24<15:50:45,  2.99it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32577/203307 [3:01:28<15:51:06,  2.99it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32577/203307 [3:01:28<15:51:06,  2.99it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32578/203307 [3:01:33<15:51:28,  2.99it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32578/203307 [3:01:33<15:51:28,  2.99it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32579/203307 [3:01:37<15:51:49,  2.99it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32579/203307 [3:01:37<15:51:49,  2.99it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32580/203307 [3:01:41<15:52:07,  2.99it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32580/203307 [3:01:41<15:52:07,  2.99it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32581/203307 [3:01:45<15:52:25,  2.99it/s, v_num=line, training/loss=0.0807]Epoch 0:  16%|█▌        | 32581/203307 [3:01:45<15:52:25,  2.99it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32582/203307 [3:01:50<15:52:47,  2.99it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32582/203307 [3:01:50<15:52:47,  2.99it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32583/203307 [3:01:53<15:53:05,  2.99it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32583/203307 [3:01:53<15:53:05,  2.99it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32584/203307 [3:01:57<15:53:23,  2.98it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32584/203307 [3:01:57<15:53:23,  2.98it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32585/203307 [3:02:01<15:53:40,  2.98it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32585/203307 [3:02:01<15:53:40,  2.98it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32586/203307 [3:02:05<15:54:01,  2.98it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32586/203307 [3:02:05<15:54:01,  2.98it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32587/203307 [3:02:10<15:54:23,  2.98it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32587/203307 [3:02:10<15:54:23,  2.98it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32588/203307 [3:02:14<15:54:44,  2.98it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32588/203307 [3:02:14<15:54:44,  2.98it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32589/203307 [3:02:18<15:55:02,  2.98it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32589/203307 [3:02:18<15:55:02,  2.98it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32590/203307 [3:02:23<15:55:23,  2.98it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32590/203307 [3:02:23<15:55:23,  2.98it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32591/203307 [3:02:26<15:55:40,  2.98it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32591/203307 [3:02:26<15:55:41,  2.98it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32592/203307 [3:02:30<15:55:58,  2.98it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32592/203307 [3:02:30<15:55:58,  2.98it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32593/203307 [3:02:34<15:56:16,  2.98it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32593/203307 [3:02:34<15:56:16,  2.98it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32594/203307 [3:02:38<15:56:34,  2.97it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32594/203307 [3:02:38<15:56:34,  2.97it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32595/203307 [3:02:42<15:56:56,  2.97it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32595/203307 [3:02:42<15:56:57,  2.97it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32596/203307 [3:02:47<15:57:18,  2.97it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32596/203307 [3:02:47<15:57:18,  2.97it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32597/203307 [3:02:51<15:57:36,  2.97it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32597/203307 [3:02:51<15:57:36,  2.97it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32598/203307 [3:02:55<15:57:56,  2.97it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32598/203307 [3:02:55<15:57:56,  2.97it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32599/203307 [3:02:59<15:58:15,  2.97it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32599/203307 [3:02:59<15:58:15,  2.97it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32600/203307 [3:03:03<15:58:33,  2.97it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32600/203307 [3:03:03<15:58:33,  2.97it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32601/203307 [3:03:07<15:58:51,  2.97it/s, v_num=line, training/loss=0.0858]Epoch 0:  16%|█▌        | 32601/203307 [3:03:07<15:58:51,  2.97it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32602/203307 [3:03:11<15:59:09,  2.97it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32602/203307 [3:03:11<15:59:09,  2.97it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32603/203307 [3:03:14<15:59:27,  2.97it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32603/203307 [3:03:14<15:59:27,  2.97it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32604/203307 [3:03:19<15:59:49,  2.96it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32604/203307 [3:03:19<15:59:49,  2.96it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32605/203307 [3:03:23<16:00:07,  2.96it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32605/203307 [3:03:23<16:00:07,  2.96it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32606/203307 [3:03:27<16:00:25,  2.96it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32606/203307 [3:03:27<16:00:25,  2.96it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32607/203307 [3:03:31<16:00:46,  2.96it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32607/203307 [3:03:31<16:00:46,  2.96it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32608/203307 [3:03:35<16:01:04,  2.96it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32608/203307 [3:03:35<16:01:04,  2.96it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32609/203307 [3:03:39<16:01:22,  2.96it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32609/203307 [3:03:39<16:01:22,  2.96it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32610/203307 [3:03:43<16:01:40,  2.96it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32610/203307 [3:03:43<16:01:40,  2.96it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32611/203307 [3:03:47<16:01:58,  2.96it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32611/203307 [3:03:47<16:01:58,  2.96it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32612/203307 [3:03:50<16:02:16,  2.96it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32612/203307 [3:03:50<16:02:16,  2.96it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32613/203307 [3:03:55<16:02:38,  2.96it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32613/203307 [3:03:55<16:02:39,  2.96it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32614/203307 [3:03:59<16:02:57,  2.95it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32614/203307 [3:03:59<16:02:57,  2.95it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32615/203307 [3:04:03<16:03:18,  2.95it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32615/203307 [3:04:03<16:03:18,  2.95it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32616/203307 [3:04:07<16:03:36,  2.95it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32616/203307 [3:04:07<16:03:36,  2.95it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32617/203307 [3:04:11<16:03:53,  2.95it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32617/203307 [3:04:11<16:03:53,  2.95it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32618/203307 [3:04:15<16:04:11,  2.95it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32618/203307 [3:04:15<16:04:11,  2.95it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32619/203307 [3:04:19<16:04:29,  2.95it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32619/203307 [3:04:19<16:04:29,  2.95it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32620/203307 [3:04:22<16:04:47,  2.95it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32620/203307 [3:04:22<16:04:47,  2.95it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32621/203307 [3:04:27<16:05:09,  2.95it/s, v_num=line, training/loss=0.0806]Epoch 0:  16%|█▌        | 32621/203307 [3:04:27<16:05:09,  2.95it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32622/203307 [3:04:31<16:05:30,  2.95it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32622/203307 [3:04:31<16:05:30,  2.95it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32623/203307 [3:04:36<16:05:50,  2.95it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32623/203307 [3:04:36<16:05:50,  2.95it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32624/203307 [3:04:40<16:06:08,  2.94it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32624/203307 [3:04:40<16:06:09,  2.94it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32625/203307 [3:04:43<16:06:26,  2.94it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32625/203307 [3:04:43<16:06:26,  2.94it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32626/203307 [3:04:47<16:06:44,  2.94it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32626/203307 [3:04:47<16:06:44,  2.94it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32627/203307 [3:04:51<16:07:02,  2.94it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32627/203307 [3:04:51<16:07:02,  2.94it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32628/203307 [3:04:55<16:07:19,  2.94it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32628/203307 [3:04:55<16:07:19,  2.94it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32629/203307 [3:04:59<16:07:40,  2.94it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32629/203307 [3:04:59<16:07:40,  2.94it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32630/203307 [3:05:04<16:08:01,  2.94it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32630/203307 [3:05:04<16:08:01,  2.94it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32631/203307 [3:05:08<16:08:22,  2.94it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32631/203307 [3:05:08<16:08:22,  2.94it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32632/203307 [3:05:12<16:08:42,  2.94it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32632/203307 [3:05:12<16:08:42,  2.94it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32633/203307 [3:05:16<16:09:00,  2.94it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32633/203307 [3:05:16<16:09:00,  2.94it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32634/203307 [3:05:20<16:09:17,  2.93it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32634/203307 [3:05:20<16:09:17,  2.93it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32635/203307 [3:05:24<16:09:35,  2.93it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32635/203307 [3:05:24<16:09:35,  2.93it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32636/203307 [3:05:27<16:09:53,  2.93it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32636/203307 [3:05:27<16:09:53,  2.93it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32637/203307 [3:05:31<16:10:10,  2.93it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32637/203307 [3:05:31<16:10:10,  2.93it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32638/203307 [3:05:36<16:10:31,  2.93it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32638/203307 [3:05:36<16:10:32,  2.93it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32639/203307 [3:05:40<16:10:53,  2.93it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32639/203307 [3:05:40<16:10:53,  2.93it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32640/203307 [3:05:45<16:11:14,  2.93it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32640/203307 [3:05:45<16:11:14,  2.93it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32641/203307 [3:05:48<16:11:32,  2.93it/s, v_num=line, training/loss=0.0843]Epoch 0:  16%|█▌        | 32641/203307 [3:05:48<16:11:32,  2.93it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32642/203307 [3:05:52<16:11:49,  2.93it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32642/203307 [3:05:52<16:11:49,  2.93it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32643/203307 [3:05:56<16:12:07,  2.93it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32643/203307 [3:05:56<16:12:07,  2.93it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32644/203307 [3:06:00<16:12:25,  2.93it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32644/203307 [3:06:00<16:12:25,  2.93it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32645/203307 [3:06:03<16:12:42,  2.92it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32645/203307 [3:06:03<16:12:42,  2.92it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32646/203307 [3:06:08<16:13:03,  2.92it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32646/203307 [3:06:08<16:13:03,  2.92it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32647/203307 [3:06:12<16:13:24,  2.92it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32647/203307 [3:06:12<16:13:24,  2.92it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32648/203307 [3:06:17<16:13:45,  2.92it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32648/203307 [3:06:17<16:13:45,  2.92it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32649/203307 [3:06:21<16:14:05,  2.92it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32649/203307 [3:06:21<16:14:05,  2.92it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32650/203307 [3:06:25<16:14:23,  2.92it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32650/203307 [3:06:25<16:14:23,  2.92it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32651/203307 [3:06:28<16:14:40,  2.92it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32651/203307 [3:06:28<16:14:41,  2.92it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32652/203307 [3:06:32<16:14:58,  2.92it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32652/203307 [3:06:32<16:14:58,  2.92it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32653/203307 [3:06:36<16:15:16,  2.92it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32653/203307 [3:06:36<16:15:16,  2.92it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32654/203307 [3:06:40<16:15:37,  2.92it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32654/203307 [3:06:40<16:15:37,  2.92it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32655/203307 [3:06:44<16:15:55,  2.91it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32655/203307 [3:06:44<16:15:55,  2.91it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32656/203307 [3:06:49<16:16:16,  2.91it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32656/203307 [3:06:49<16:16:16,  2.91it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32657/203307 [3:06:53<16:16:38,  2.91it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32657/203307 [3:06:53<16:16:38,  2.91it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32658/203307 [3:06:58<16:16:59,  2.91it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32658/203307 [3:06:58<16:16:59,  2.91it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32659/203307 [3:07:02<16:17:16,  2.91it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32659/203307 [3:07:02<16:17:16,  2.91it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32660/203307 [3:07:05<16:17:34,  2.91it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32660/203307 [3:07:05<16:17:34,  2.91it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32661/203307 [3:07:09<16:17:52,  2.91it/s, v_num=line, training/loss=0.0789]Epoch 0:  16%|█▌        | 32661/203307 [3:07:09<16:17:52,  2.91it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32662/203307 [3:07:13<16:18:10,  2.91it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32662/203307 [3:07:13<16:18:10,  2.91it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32663/203307 [3:07:17<16:18:31,  2.91it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32663/203307 [3:07:17<16:18:31,  2.91it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32664/203307 [3:07:21<16:18:49,  2.91it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32664/203307 [3:07:21<16:18:49,  2.91it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32665/203307 [3:07:26<16:19:11,  2.90it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32665/203307 [3:07:26<16:19:11,  2.90it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32666/203307 [3:07:30<16:19:29,  2.90it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32666/203307 [3:07:30<16:19:29,  2.90it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32667/203307 [3:07:34<16:19:49,  2.90it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32667/203307 [3:07:34<16:19:49,  2.90it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32668/203307 [3:07:38<16:20:07,  2.90it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32668/203307 [3:07:38<16:20:07,  2.90it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32669/203307 [3:07:42<16:20:25,  2.90it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32669/203307 [3:07:42<16:20:25,  2.90it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32670/203307 [3:07:46<16:20:43,  2.90it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32670/203307 [3:07:46<16:20:43,  2.90it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32671/203307 [3:07:50<16:21:04,  2.90it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32671/203307 [3:07:50<16:21:04,  2.90it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32672/203307 [3:07:54<16:21:22,  2.90it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32672/203307 [3:07:54<16:21:22,  2.90it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32673/203307 [3:07:58<16:21:43,  2.90it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32673/203307 [3:07:58<16:21:43,  2.90it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32674/203307 [3:08:02<16:22:01,  2.90it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32674/203307 [3:08:02<16:22:01,  2.90it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32675/203307 [3:08:06<16:22:19,  2.90it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32675/203307 [3:08:06<16:22:19,  2.90it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32676/203307 [3:08:10<16:22:39,  2.89it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32676/203307 [3:08:10<16:22:39,  2.89it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32677/203307 [3:08:14<16:22:57,  2.89it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32677/203307 [3:08:14<16:22:57,  2.89it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32678/203307 [3:08:18<16:23:15,  2.89it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32678/203307 [3:08:18<16:23:15,  2.89it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32679/203307 [3:08:22<16:23:35,  2.89it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32679/203307 [3:08:22<16:23:35,  2.89it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32680/203307 [3:08:26<16:23:53,  2.89it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32680/203307 [3:08:26<16:23:53,  2.89it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32681/203307 [3:08:30<16:24:11,  2.89it/s, v_num=line, training/loss=0.0907]Epoch 0:  16%|█▌        | 32681/203307 [3:08:30<16:24:11,  2.89it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32682/203307 [3:08:34<16:24:32,  2.89it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32682/203307 [3:08:34<16:24:32,  2.89it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32683/203307 [3:08:38<16:24:50,  2.89it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32683/203307 [3:08:38<16:24:50,  2.89it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32684/203307 [3:08:42<16:25:08,  2.89it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32684/203307 [3:08:42<16:25:08,  2.89it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32685/203307 [3:08:47<16:25:29,  2.89it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32685/203307 [3:08:47<16:25:29,  2.89it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32686/203307 [3:08:50<16:25:46,  2.88it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32686/203307 [3:08:50<16:25:46,  2.88it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32687/203307 [3:08:54<16:26:04,  2.88it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32687/203307 [3:08:54<16:26:04,  2.88it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32688/203307 [3:08:59<16:26:25,  2.88it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32688/203307 [3:08:59<16:26:25,  2.88it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32689/203307 [3:09:02<16:26:42,  2.88it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32689/203307 [3:09:02<16:26:42,  2.88it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32690/203307 [3:09:07<16:27:03,  2.88it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32690/203307 [3:09:07<16:27:03,  2.88it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32691/203307 [3:09:11<16:27:25,  2.88it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32691/203307 [3:09:11<16:27:25,  2.88it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32692/203307 [3:09:15<16:27:42,  2.88it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32692/203307 [3:09:15<16:27:42,  2.88it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32693/203307 [3:09:19<16:27:59,  2.88it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32693/203307 [3:09:19<16:28:00,  2.88it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32694/203307 [3:09:23<16:28:21,  2.88it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32694/203307 [3:09:23<16:28:21,  2.88it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32695/203307 [3:09:27<16:28:38,  2.88it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32695/203307 [3:09:27<16:28:38,  2.88it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32696/203307 [3:09:31<16:28:59,  2.88it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32696/203307 [3:09:31<16:28:59,  2.88it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32697/203307 [3:09:35<16:29:16,  2.87it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32697/203307 [3:09:35<16:29:16,  2.87it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32698/203307 [3:09:39<16:29:36,  2.87it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32698/203307 [3:09:39<16:29:36,  2.87it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32699/203307 [3:09:44<16:29:58,  2.87it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32699/203307 [3:09:44<16:29:58,  2.87it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32700/203307 [3:09:48<16:30:16,  2.87it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32700/203307 [3:09:48<16:30:16,  2.87it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32701/203307 [3:09:52<16:30:33,  2.87it/s, v_num=line, training/loss=0.0791]Epoch 0:  16%|█▌        | 32701/203307 [3:09:52<16:30:33,  2.87it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32702/203307 [3:09:55<16:30:51,  2.87it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32702/203307 [3:09:55<16:30:51,  2.87it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32703/203307 [3:10:00<16:31:12,  2.87it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32703/203307 [3:10:00<16:31:12,  2.87it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32704/203307 [3:10:04<16:31:32,  2.87it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32704/203307 [3:10:04<16:31:32,  2.87it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32705/203307 [3:10:08<16:31:50,  2.87it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32705/203307 [3:10:08<16:31:50,  2.87it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32706/203307 [3:10:12<16:32:07,  2.87it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32706/203307 [3:10:12<16:32:07,  2.87it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32707/203307 [3:10:16<16:32:28,  2.86it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32707/203307 [3:10:16<16:32:28,  2.86it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32708/203307 [3:10:21<16:32:50,  2.86it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32708/203307 [3:10:21<16:32:50,  2.86it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32709/203307 [3:10:24<16:33:07,  2.86it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32709/203307 [3:10:24<16:33:07,  2.86it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32710/203307 [3:10:28<16:33:24,  2.86it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32710/203307 [3:10:28<16:33:24,  2.86it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32711/203307 [3:10:32<16:33:41,  2.86it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32711/203307 [3:10:32<16:33:42,  2.86it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32712/203307 [3:10:36<16:34:03,  2.86it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32712/203307 [3:10:36<16:34:03,  2.86it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32713/203307 [3:10:41<16:34:24,  2.86it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32713/203307 [3:10:41<16:34:24,  2.86it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32714/203307 [3:10:45<16:34:42,  2.86it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32714/203307 [3:10:45<16:34:42,  2.86it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32715/203307 [3:10:49<16:35:02,  2.86it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32715/203307 [3:10:49<16:35:02,  2.86it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32716/203307 [3:10:53<16:35:20,  2.86it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32716/203307 [3:10:53<16:35:20,  2.86it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32717/203307 [3:10:57<16:35:42,  2.86it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32717/203307 [3:10:57<16:35:42,  2.86it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32718/203307 [3:11:01<16:35:59,  2.85it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32718/203307 [3:11:01<16:35:59,  2.85it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32719/203307 [3:11:05<16:36:17,  2.85it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32719/203307 [3:11:05<16:36:17,  2.85it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32720/203307 [3:11:09<16:36:34,  2.85it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32720/203307 [3:11:09<16:36:34,  2.85it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32721/203307 [3:11:13<16:36:55,  2.85it/s, v_num=line, training/loss=0.0844]Epoch 0:  16%|█▌        | 32721/203307 [3:11:13<16:36:55,  2.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32722/203307 [3:11:17<16:37:12,  2.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32722/203307 [3:11:17<16:37:12,  2.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32723/203307 [3:11:21<16:37:33,  2.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32723/203307 [3:11:21<16:37:33,  2.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32724/203307 [3:11:25<16:37:51,  2.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32724/203307 [3:11:25<16:37:51,  2.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32725/203307 [3:11:30<16:38:12,  2.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32725/203307 [3:11:30<16:38:12,  2.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32726/203307 [3:11:33<16:38:30,  2.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32726/203307 [3:11:33<16:38:30,  2.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32727/203307 [3:11:37<16:38:47,  2.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32727/203307 [3:11:37<16:38:47,  2.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32728/203307 [3:11:41<16:39:05,  2.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32728/203307 [3:11:41<16:39:05,  2.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32729/203307 [3:11:45<16:39:26,  2.84it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32729/203307 [3:11:45<16:39:26,  2.84it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32730/203307 [3:11:50<16:39:47,  2.84it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32730/203307 [3:11:50<16:39:47,  2.84it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32731/203307 [3:11:54<16:40:05,  2.84it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32731/203307 [3:11:54<16:40:05,  2.84it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32732/203307 [3:11:58<16:40:25,  2.84it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32732/203307 [3:11:58<16:40:25,  2.84it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32733/203307 [3:12:02<16:40:43,  2.84it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32733/203307 [3:12:02<16:40:43,  2.84it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32734/203307 [3:12:06<16:41:04,  2.84it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32734/203307 [3:12:06<16:41:04,  2.84it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32735/203307 [3:12:10<16:41:21,  2.84it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32735/203307 [3:12:10<16:41:21,  2.84it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32736/203307 [3:12:14<16:41:39,  2.84it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32736/203307 [3:12:14<16:41:39,  2.84it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32737/203307 [3:12:17<16:41:56,  2.84it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32737/203307 [3:12:17<16:41:56,  2.84it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32738/203307 [3:12:22<16:42:17,  2.84it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32738/203307 [3:12:22<16:42:17,  2.84it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32739/203307 [3:12:26<16:42:38,  2.84it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32739/203307 [3:12:26<16:42:38,  2.84it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32740/203307 [3:12:31<16:42:59,  2.83it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32740/203307 [3:12:31<16:42:59,  2.83it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32741/203307 [3:12:34<16:43:16,  2.83it/s, v_num=line, training/loss=0.0852]Epoch 0:  16%|█▌        | 32741/203307 [3:12:34<16:43:16,  2.83it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32742/203307 [3:12:38<16:43:33,  2.83it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32742/203307 [3:12:38<16:43:33,  2.83it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32743/203307 [3:12:43<16:43:56,  2.83it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32743/203307 [3:12:43<16:43:56,  2.83it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32744/203307 [3:12:47<16:44:14,  2.83it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32744/203307 [3:12:47<16:44:14,  2.83it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32745/203307 [3:12:51<16:44:32,  2.83it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32745/203307 [3:12:51<16:44:32,  2.83it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32746/203307 [3:12:55<16:44:52,  2.83it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32746/203307 [3:12:55<16:44:52,  2.83it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32747/203307 [3:12:59<16:45:10,  2.83it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32747/203307 [3:12:59<16:45:10,  2.83it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32748/203307 [3:13:03<16:45:31,  2.83it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32748/203307 [3:13:03<16:45:31,  2.83it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32749/203307 [3:13:07<16:45:49,  2.83it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32749/203307 [3:13:07<16:45:49,  2.83it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32750/203307 [3:13:11<16:46:07,  2.83it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32750/203307 [3:13:11<16:46:07,  2.83it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32751/203307 [3:13:16<16:46:29,  2.82it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32751/203307 [3:13:16<16:46:29,  2.82it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32752/203307 [3:13:20<16:46:46,  2.82it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32752/203307 [3:13:20<16:46:46,  2.82it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32753/203307 [3:13:23<16:47:04,  2.82it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32753/203307 [3:13:23<16:47:04,  2.82it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32754/203307 [3:13:28<16:47:25,  2.82it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32754/203307 [3:13:28<16:47:25,  2.82it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32755/203307 [3:13:32<16:47:43,  2.82it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32755/203307 [3:13:32<16:47:43,  2.82it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32756/203307 [3:13:36<16:48:01,  2.82it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32756/203307 [3:13:36<16:48:01,  2.82it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32757/203307 [3:13:40<16:48:22,  2.82it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32757/203307 [3:13:40<16:48:22,  2.82it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32758/203307 [3:13:44<16:48:40,  2.82it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32758/203307 [3:13:44<16:48:40,  2.82it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32759/203307 [3:13:48<16:48:58,  2.82it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32759/203307 [3:13:48<16:48:58,  2.82it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32760/203307 [3:13:52<16:49:20,  2.82it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32760/203307 [3:13:52<16:49:20,  2.82it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32761/203307 [3:13:56<16:49:38,  2.82it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32761/203307 [3:13:56<16:49:38,  2.82it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32762/203307 [3:14:00<16:49:56,  2.81it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32762/203307 [3:14:00<16:49:56,  2.81it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32763/203307 [3:14:05<16:50:17,  2.81it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32763/203307 [3:14:05<16:50:17,  2.81it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32764/203307 [3:14:08<16:50:35,  2.81it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32764/203307 [3:14:08<16:50:35,  2.81it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32765/203307 [3:14:13<16:50:55,  2.81it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32765/203307 [3:14:13<16:50:55,  2.81it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32766/203307 [3:14:17<16:51:16,  2.81it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32766/203307 [3:14:17<16:51:16,  2.81it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32767/203307 [3:14:21<16:51:34,  2.81it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32767/203307 [3:14:21<16:51:34,  2.81it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32768/203307 [3:14:25<16:51:51,  2.81it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32768/203307 [3:14:25<16:51:51,  2.81it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32769/203307 [3:14:29<16:52:13,  2.81it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32769/203307 [3:14:29<16:52:13,  2.81it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32770/203307 [3:14:33<16:52:31,  2.81it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32770/203307 [3:14:33<16:52:31,  2.81it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32771/203307 [3:14:38<16:52:51,  2.81it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32771/203307 [3:14:38<16:52:51,  2.81it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32772/203307 [3:14:42<16:53:09,  2.81it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32772/203307 [3:14:42<16:53:09,  2.81it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32773/203307 [3:14:46<16:53:30,  2.80it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32773/203307 [3:14:46<16:53:30,  2.80it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32774/203307 [3:14:50<16:53:48,  2.80it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32774/203307 [3:14:50<16:53:48,  2.80it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32775/203307 [3:14:54<16:54:08,  2.80it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32775/203307 [3:14:54<16:54:08,  2.80it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32776/203307 [3:14:58<16:54:26,  2.80it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32776/203307 [3:14:58<16:54:26,  2.80it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32777/203307 [3:15:02<16:54:47,  2.80it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32777/203307 [3:15:02<16:54:47,  2.80it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32778/203307 [3:15:06<16:55:04,  2.80it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32778/203307 [3:15:06<16:55:04,  2.80it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32779/203307 [3:15:11<16:55:25,  2.80it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32779/203307 [3:15:11<16:55:25,  2.80it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32780/203307 [3:15:14<16:55:42,  2.80it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32780/203307 [3:15:14<16:55:42,  2.80it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32781/203307 [3:15:18<16:56:00,  2.80it/s, v_num=line, training/loss=0.0833]Epoch 0:  16%|█▌        | 32781/203307 [3:15:18<16:56:00,  2.80it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32782/203307 [3:15:23<16:56:21,  2.80it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32782/203307 [3:15:23<16:56:21,  2.80it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32783/203307 [3:15:26<16:56:39,  2.80it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32783/203307 [3:15:27<16:56:39,  2.80it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32784/203307 [3:15:31<16:57:00,  2.79it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32784/203307 [3:15:31<16:57:00,  2.79it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32785/203307 [3:15:35<16:57:18,  2.79it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32785/203307 [3:15:35<16:57:18,  2.79it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32786/203307 [3:15:39<16:57:39,  2.79it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32786/203307 [3:15:39<16:57:39,  2.79it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32787/203307 [3:15:43<16:57:56,  2.79it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32787/203307 [3:15:43<16:57:56,  2.79it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32788/203307 [3:15:48<16:58:17,  2.79it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32788/203307 [3:15:48<16:58:17,  2.79it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32789/203307 [3:15:51<16:58:35,  2.79it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32789/203307 [3:15:51<16:58:35,  2.79it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32790/203307 [3:15:56<16:58:55,  2.79it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32790/203307 [3:15:56<16:58:55,  2.79it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32791/203307 [3:16:00<16:59:13,  2.79it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32791/203307 [3:16:00<16:59:13,  2.79it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32792/203307 [3:16:03<16:59:31,  2.79it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32792/203307 [3:16:03<16:59:31,  2.79it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32793/203307 [3:16:08<16:59:51,  2.79it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32793/203307 [3:16:08<16:59:51,  2.79it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32794/203307 [3:16:12<17:00:09,  2.79it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32794/203307 [3:16:12<17:00:09,  2.79it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32795/203307 [3:16:16<17:00:30,  2.78it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32795/203307 [3:16:16<17:00:30,  2.78it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32796/203307 [3:16:20<17:00:50,  2.78it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32796/203307 [3:16:20<17:00:50,  2.78it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32797/203307 [3:16:24<17:01:08,  2.78it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32797/203307 [3:16:24<17:01:08,  2.78it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32798/203307 [3:16:29<17:01:28,  2.78it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32798/203307 [3:16:29<17:01:28,  2.78it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32799/203307 [3:16:32<17:01:45,  2.78it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32799/203307 [3:16:32<17:01:45,  2.78it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32800/203307 [3:16:36<17:02:03,  2.78it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32800/203307 [3:16:36<17:02:03,  2.78it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32801/203307 [3:16:40<17:02:21,  2.78it/s, v_num=line, training/loss=0.0726]Epoch 0:  16%|█▌        | 32801/203307 [3:16:40<17:02:21,  2.78it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32802/203307 [3:16:44<17:02:41,  2.78it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32802/203307 [3:16:44<17:02:41,  2.78it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32803/203307 [3:16:49<17:03:02,  2.78it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32803/203307 [3:16:49<17:03:02,  2.78it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32804/203307 [3:16:53<17:03:23,  2.78it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32804/203307 [3:16:53<17:03:23,  2.78it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32805/203307 [3:16:57<17:03:40,  2.78it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32805/203307 [3:16:57<17:03:40,  2.78it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32806/203307 [3:17:01<17:03:57,  2.78it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32806/203307 [3:17:01<17:03:57,  2.78it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32807/203307 [3:17:05<17:04:18,  2.77it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32807/203307 [3:17:05<17:04:18,  2.77it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32808/203307 [3:17:09<17:04:36,  2.77it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32808/203307 [3:17:09<17:04:36,  2.77it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32809/203307 [3:17:13<17:04:53,  2.77it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32809/203307 [3:17:13<17:04:53,  2.77it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32810/203307 [3:17:16<17:05:10,  2.77it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32810/203307 [3:17:16<17:05:10,  2.77it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32811/203307 [3:17:21<17:05:30,  2.77it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32811/203307 [3:17:21<17:05:30,  2.77it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32812/203307 [3:17:25<17:05:52,  2.77it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32812/203307 [3:17:25<17:05:52,  2.77it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32813/203307 [3:17:30<17:06:12,  2.77it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32813/203307 [3:17:30<17:06:12,  2.77it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32814/203307 [3:17:33<17:06:29,  2.77it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32814/203307 [3:17:33<17:06:29,  2.77it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32815/203307 [3:17:38<17:06:50,  2.77it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32815/203307 [3:17:38<17:06:50,  2.77it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32816/203307 [3:17:42<17:07:07,  2.77it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32816/203307 [3:17:42<17:07:07,  2.77it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32817/203307 [3:17:45<17:07:25,  2.77it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32817/203307 [3:17:45<17:07:25,  2.77it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32818/203307 [3:17:49<17:07:42,  2.76it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32818/203307 [3:17:49<17:07:42,  2.76it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32819/203307 [3:17:53<17:08:00,  2.76it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32819/203307 [3:17:53<17:08:00,  2.76it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32820/203307 [3:17:57<17:08:21,  2.76it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32820/203307 [3:17:57<17:08:21,  2.76it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32821/203307 [3:18:02<17:08:42,  2.76it/s, v_num=line, training/loss=0.0886]Epoch 0:  16%|█▌        | 32821/203307 [3:18:02<17:08:43,  2.76it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32822/203307 [3:18:06<17:09:00,  2.76it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32822/203307 [3:18:06<17:09:00,  2.76it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32823/203307 [3:18:10<17:09:20,  2.76it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32823/203307 [3:18:10<17:09:20,  2.76it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32824/203307 [3:18:14<17:09:38,  2.76it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32824/203307 [3:18:14<17:09:38,  2.76it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32825/203307 [3:18:18<17:09:55,  2.76it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32825/203307 [3:18:18<17:09:55,  2.76it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32826/203307 [3:18:22<17:10:12,  2.76it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32826/203307 [3:18:22<17:10:12,  2.76it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32827/203307 [3:18:25<17:10:29,  2.76it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32827/203307 [3:18:25<17:10:29,  2.76it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32828/203307 [3:18:29<17:10:47,  2.76it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32828/203307 [3:18:29<17:10:47,  2.76it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32829/203307 [3:18:34<17:11:08,  2.76it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32829/203307 [3:18:34<17:11:08,  2.76it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32830/203307 [3:18:37<17:11:25,  2.75it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32830/203307 [3:18:37<17:11:25,  2.75it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32831/203307 [3:18:41<17:11:43,  2.75it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32831/203307 [3:18:41<17:11:43,  2.75it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32832/203307 [3:18:46<17:12:03,  2.75it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32832/203307 [3:18:46<17:12:03,  2.75it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32833/203307 [3:18:49<17:12:21,  2.75it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32833/203307 [3:18:49<17:12:21,  2.75it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32834/203307 [3:18:53<17:12:38,  2.75it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32834/203307 [3:18:53<17:12:38,  2.75it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32835/203307 [3:18:57<17:12:56,  2.75it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32835/203307 [3:18:57<17:12:56,  2.75it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32836/203307 [3:19:01<17:13:13,  2.75it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32836/203307 [3:19:01<17:13:13,  2.75it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32837/203307 [3:19:04<17:13:30,  2.75it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32837/203307 [3:19:04<17:13:30,  2.75it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32838/203307 [3:19:09<17:13:52,  2.75it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32838/203307 [3:19:09<17:13:52,  2.75it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32839/203307 [3:19:13<17:14:09,  2.75it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32839/203307 [3:19:13<17:14:09,  2.75it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32840/203307 [3:19:17<17:14:29,  2.75it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32840/203307 [3:19:17<17:14:29,  2.75it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32841/203307 [3:19:21<17:14:46,  2.75it/s, v_num=line, training/loss=0.0853]Epoch 0:  16%|█▌        | 32841/203307 [3:19:21<17:14:46,  2.75it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32842/203307 [3:19:24<17:15:03,  2.74it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32842/203307 [3:19:24<17:15:03,  2.74it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32843/203307 [3:19:28<17:15:20,  2.74it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32843/203307 [3:19:28<17:15:20,  2.74it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32844/203307 [3:19:32<17:15:38,  2.74it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32844/203307 [3:19:32<17:15:38,  2.74it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32845/203307 [3:19:36<17:15:55,  2.74it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32845/203307 [3:19:36<17:15:55,  2.74it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32846/203307 [3:19:40<17:16:15,  2.74it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32846/203307 [3:19:40<17:16:15,  2.74it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32847/203307 [3:19:45<17:16:37,  2.74it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32847/203307 [3:19:45<17:16:37,  2.74it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32848/203307 [3:19:49<17:16:58,  2.74it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32848/203307 [3:19:49<17:16:58,  2.74it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32849/203307 [3:19:53<17:17:15,  2.74it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32849/203307 [3:19:53<17:17:15,  2.74it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32850/203307 [3:19:57<17:17:32,  2.74it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32850/203307 [3:19:57<17:17:32,  2.74it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32851/203307 [3:20:00<17:17:49,  2.74it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32851/203307 [3:20:00<17:17:49,  2.74it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32852/203307 [3:20:04<17:18:06,  2.74it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32852/203307 [3:20:04<17:18:06,  2.74it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32853/203307 [3:20:08<17:18:24,  2.74it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32853/203307 [3:20:08<17:18:24,  2.74it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32854/203307 [3:20:12<17:18:45,  2.73it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32854/203307 [3:20:12<17:18:45,  2.73it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32855/203307 [3:20:17<17:19:05,  2.73it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32855/203307 [3:20:17<17:19:05,  2.73it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32856/203307 [3:20:21<17:19:25,  2.73it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32856/203307 [3:20:21<17:19:25,  2.73it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32857/203307 [3:20:25<17:19:46,  2.73it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32857/203307 [3:20:25<17:19:46,  2.73it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32858/203307 [3:20:29<17:20:03,  2.73it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32858/203307 [3:20:29<17:20:03,  2.73it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32859/203307 [3:20:33<17:20:20,  2.73it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32859/203307 [3:20:33<17:20:20,  2.73it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32860/203307 [3:20:37<17:20:38,  2.73it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32860/203307 [3:20:37<17:20:38,  2.73it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32861/203307 [3:20:41<17:20:56,  2.73it/s, v_num=line, training/loss=0.0811]Epoch 0:  16%|█▌        | 32861/203307 [3:20:41<17:20:56,  2.73it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32862/203307 [3:20:45<17:21:14,  2.73it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32862/203307 [3:20:45<17:21:14,  2.73it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32863/203307 [3:20:49<17:21:34,  2.73it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32863/203307 [3:20:49<17:21:34,  2.73it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32864/203307 [3:20:54<17:21:56,  2.73it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32864/203307 [3:20:54<17:21:56,  2.73it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32865/203307 [3:20:58<17:22:17,  2.73it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32865/203307 [3:20:58<17:22:17,  2.73it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32866/203307 [3:21:02<17:22:34,  2.72it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32866/203307 [3:21:02<17:22:34,  2.72it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32867/203307 [3:21:06<17:22:51,  2.72it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32867/203307 [3:21:06<17:22:51,  2.72it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32868/203307 [3:21:09<17:23:08,  2.72it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32868/203307 [3:21:09<17:23:08,  2.72it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32869/203307 [3:21:13<17:23:25,  2.72it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32869/203307 [3:21:13<17:23:25,  2.72it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32870/203307 [3:21:17<17:23:43,  2.72it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32870/203307 [3:21:17<17:23:43,  2.72it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32871/203307 [3:21:21<17:24:05,  2.72it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32871/203307 [3:21:21<17:24:05,  2.72it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32872/203307 [3:21:25<17:24:22,  2.72it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32872/203307 [3:21:25<17:24:22,  2.72it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32873/203307 [3:21:30<17:24:43,  2.72it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32873/203307 [3:21:30<17:24:43,  2.72it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32874/203307 [3:21:34<17:25:02,  2.72it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32874/203307 [3:21:34<17:25:03,  2.72it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32875/203307 [3:21:38<17:25:20,  2.72it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32875/203307 [3:21:38<17:25:20,  2.72it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32876/203307 [3:21:42<17:25:38,  2.72it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32876/203307 [3:21:42<17:25:38,  2.72it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32877/203307 [3:21:45<17:25:55,  2.72it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32877/203307 [3:21:45<17:25:55,  2.72it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32878/203307 [3:21:49<17:26:12,  2.72it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32878/203307 [3:21:49<17:26:12,  2.72it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32879/203307 [3:21:54<17:26:33,  2.71it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32879/203307 [3:21:54<17:26:33,  2.71it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32880/203307 [3:21:57<17:26:51,  2.71it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32880/203307 [3:21:57<17:26:51,  2.71it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32881/203307 [3:22:02<17:27:12,  2.71it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▌        | 32881/203307 [3:22:02<17:27:12,  2.71it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32882/203307 [3:22:06<17:27:32,  2.71it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32882/203307 [3:22:06<17:27:32,  2.71it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32883/203307 [3:22:11<17:27:52,  2.71it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32883/203307 [3:22:11<17:27:52,  2.71it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32884/203307 [3:22:14<17:28:09,  2.71it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32884/203307 [3:22:14<17:28:09,  2.71it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32885/203307 [3:22:18<17:28:26,  2.71it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32885/203307 [3:22:18<17:28:26,  2.71it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32886/203307 [3:22:22<17:28:44,  2.71it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32886/203307 [3:22:22<17:28:44,  2.71it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32887/203307 [3:22:26<17:29:01,  2.71it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32887/203307 [3:22:26<17:29:01,  2.71it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32888/203307 [3:22:30<17:29:22,  2.71it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32888/203307 [3:22:30<17:29:22,  2.71it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32889/203307 [3:22:34<17:29:39,  2.71it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32889/203307 [3:22:34<17:29:39,  2.71it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32890/203307 [3:22:38<17:30:00,  2.71it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32890/203307 [3:22:38<17:30:00,  2.71it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32891/203307 [3:22:42<17:30:18,  2.70it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32891/203307 [3:22:42<17:30:18,  2.70it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32892/203307 [3:22:47<17:30:38,  2.70it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32892/203307 [3:22:47<17:30:38,  2.70it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32893/203307 [3:22:51<17:30:56,  2.70it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32893/203307 [3:22:51<17:30:56,  2.70it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32894/203307 [3:22:54<17:31:13,  2.70it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32894/203307 [3:22:54<17:31:13,  2.70it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32895/203307 [3:22:58<17:31:30,  2.70it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32895/203307 [3:22:58<17:31:30,  2.70it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32896/203307 [3:23:02<17:31:51,  2.70it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32896/203307 [3:23:03<17:31:51,  2.70it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32897/203307 [3:23:06<17:32:08,  2.70it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32897/203307 [3:23:06<17:32:09,  2.70it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32898/203307 [3:23:11<17:32:28,  2.70it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32898/203307 [3:23:11<17:32:29,  2.70it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32899/203307 [3:23:15<17:32:50,  2.70it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32899/203307 [3:23:15<17:32:50,  2.70it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32900/203307 [3:23:19<17:33:07,  2.70it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32900/203307 [3:23:19<17:33:07,  2.70it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32901/203307 [3:23:23<17:33:27,  2.70it/s, v_num=line, training/loss=0.0849]Epoch 0:  16%|█▌        | 32901/203307 [3:23:23<17:33:27,  2.70it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32902/203307 [3:23:27<17:33:44,  2.70it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32902/203307 [3:23:27<17:33:44,  2.70it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32903/203307 [3:23:31<17:34:01,  2.69it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32903/203307 [3:23:31<17:34:01,  2.69it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32904/203307 [3:23:35<17:34:22,  2.69it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32904/203307 [3:23:35<17:34:22,  2.69it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32905/203307 [3:23:39<17:34:39,  2.69it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32905/203307 [3:23:39<17:34:39,  2.69it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32906/203307 [3:23:43<17:34:56,  2.69it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32906/203307 [3:23:43<17:34:56,  2.69it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32907/203307 [3:23:47<17:35:18,  2.69it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32907/203307 [3:23:47<17:35:18,  2.69it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32908/203307 [3:23:51<17:35:35,  2.69it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32908/203307 [3:23:51<17:35:35,  2.69it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32909/203307 [3:23:55<17:35:52,  2.69it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32909/203307 [3:23:55<17:35:52,  2.69it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32910/203307 [3:23:59<17:36:13,  2.69it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32910/203307 [3:23:59<17:36:13,  2.69it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32911/203307 [3:24:03<17:36:30,  2.69it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32911/203307 [3:24:03<17:36:30,  2.69it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32912/203307 [3:24:07<17:36:47,  2.69it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32912/203307 [3:24:07<17:36:47,  2.69it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32913/203307 [3:24:11<17:37:08,  2.69it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32913/203307 [3:24:11<17:37:08,  2.69it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32914/203307 [3:24:15<17:37:24,  2.69it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32914/203307 [3:24:15<17:37:24,  2.69it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32915/203307 [3:24:19<17:37:45,  2.68it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32915/203307 [3:24:19<17:37:45,  2.68it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32916/203307 [3:24:24<17:38:06,  2.68it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32916/203307 [3:24:24<17:38:06,  2.68it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32917/203307 [3:24:28<17:38:23,  2.68it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32917/203307 [3:24:28<17:38:23,  2.68it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32918/203307 [3:24:31<17:38:40,  2.68it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32918/203307 [3:24:31<17:38:40,  2.68it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32919/203307 [3:24:36<17:39:00,  2.68it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32919/203307 [3:24:36<17:39:00,  2.68it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32920/203307 [3:24:39<17:39:18,  2.68it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32920/203307 [3:24:39<17:39:18,  2.68it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32921/203307 [3:24:44<17:39:38,  2.68it/s, v_num=line, training/loss=0.0814]Epoch 0:  16%|█▌        | 32921/203307 [3:24:44<17:39:38,  2.68it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32922/203307 [3:24:48<17:39:56,  2.68it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32922/203307 [3:24:48<17:39:56,  2.68it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32923/203307 [3:24:52<17:40:16,  2.68it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32923/203307 [3:24:52<17:40:16,  2.68it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32924/203307 [3:24:56<17:40:34,  2.68it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32924/203307 [3:24:56<17:40:34,  2.68it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32925/203307 [3:25:00<17:40:55,  2.68it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32925/203307 [3:25:00<17:40:55,  2.68it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32926/203307 [3:25:04<17:41:13,  2.68it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32926/203307 [3:25:04<17:41:13,  2.68it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32927/203307 [3:25:08<17:41:30,  2.68it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32927/203307 [3:25:08<17:41:30,  2.68it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32928/203307 [3:25:12<17:41:50,  2.67it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32928/203307 [3:25:12<17:41:50,  2.67it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32929/203307 [3:25:17<17:42:10,  2.67it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32929/203307 [3:25:17<17:42:10,  2.67it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32930/203307 [3:25:21<17:42:27,  2.67it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32930/203307 [3:25:21<17:42:27,  2.67it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32931/203307 [3:25:24<17:42:44,  2.67it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32931/203307 [3:25:24<17:42:45,  2.67it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32932/203307 [3:25:29<17:43:05,  2.67it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32932/203307 [3:25:29<17:43:05,  2.67it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32933/203307 [3:25:33<17:43:26,  2.67it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32933/203307 [3:25:33<17:43:26,  2.67it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32934/203307 [3:25:37<17:43:43,  2.67it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32934/203307 [3:25:37<17:43:43,  2.67it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32935/203307 [3:25:41<17:44:01,  2.67it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32935/203307 [3:25:41<17:44:01,  2.67it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32936/203307 [3:25:45<17:44:19,  2.67it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32936/203307 [3:25:45<17:44:19,  2.67it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32937/203307 [3:25:49<17:44:39,  2.67it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32937/203307 [3:25:49<17:44:39,  2.67it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32938/203307 [3:25:54<17:45:00,  2.67it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32938/203307 [3:25:54<17:45:00,  2.67it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32939/203307 [3:25:57<17:45:17,  2.67it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32939/203307 [3:25:57<17:45:17,  2.67it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32940/203307 [3:26:02<17:45:37,  2.66it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32940/203307 [3:26:02<17:45:37,  2.66it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32941/203307 [3:26:05<17:45:54,  2.66it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▌        | 32941/203307 [3:26:05<17:45:54,  2.66it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32942/203307 [3:26:10<17:46:15,  2.66it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32942/203307 [3:26:10<17:46:15,  2.66it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32943/203307 [3:26:14<17:46:32,  2.66it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32943/203307 [3:26:14<17:46:32,  2.66it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32944/203307 [3:26:17<17:46:50,  2.66it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32944/203307 [3:26:17<17:46:50,  2.66it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32945/203307 [3:26:21<17:47:06,  2.66it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32945/203307 [3:26:21<17:47:06,  2.66it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32946/203307 [3:26:26<17:47:27,  2.66it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32946/203307 [3:26:26<17:47:27,  2.66it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32947/203307 [3:26:29<17:47:44,  2.66it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32947/203307 [3:26:29<17:47:44,  2.66it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32948/203307 [3:26:34<17:48:05,  2.66it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32948/203307 [3:26:34<17:48:05,  2.66it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32949/203307 [3:26:38<17:48:22,  2.66it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32949/203307 [3:26:38<17:48:22,  2.66it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32950/203307 [3:26:41<17:48:40,  2.66it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32950/203307 [3:26:41<17:48:40,  2.66it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32951/203307 [3:26:46<17:49:01,  2.66it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32951/203307 [3:26:46<17:49:01,  2.66it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32952/203307 [3:26:50<17:49:18,  2.66it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32952/203307 [3:26:50<17:49:18,  2.66it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32953/203307 [3:26:54<17:49:36,  2.65it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32953/203307 [3:26:54<17:49:36,  2.65it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32954/203307 [3:26:58<17:49:56,  2.65it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32954/203307 [3:26:58<17:49:56,  2.65it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32955/203307 [3:27:02<17:50:16,  2.65it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32955/203307 [3:27:02<17:50:16,  2.65it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32956/203307 [3:27:06<17:50:33,  2.65it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32956/203307 [3:27:06<17:50:33,  2.65it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32957/203307 [3:27:10<17:50:53,  2.65it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32957/203307 [3:27:10<17:50:53,  2.65it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32958/203307 [3:27:14<17:51:10,  2.65it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32958/203307 [3:27:14<17:51:10,  2.65it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32959/203307 [3:27:19<17:51:31,  2.65it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32959/203307 [3:27:19<17:51:31,  2.65it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32960/203307 [3:27:22<17:51:48,  2.65it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32960/203307 [3:27:22<17:51:48,  2.65it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32961/203307 [3:27:26<17:52:05,  2.65it/s, v_num=line, training/loss=0.0745]Epoch 0:  16%|█▌        | 32961/203307 [3:27:26<17:52:05,  2.65it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32962/203307 [3:27:30<17:52:22,  2.65it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32962/203307 [3:27:30<17:52:22,  2.65it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32963/203307 [3:27:34<17:52:43,  2.65it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32963/203307 [3:27:34<17:52:43,  2.65it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32964/203307 [3:27:39<17:53:03,  2.65it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32964/203307 [3:27:39<17:53:03,  2.65it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32965/203307 [3:27:43<17:53:24,  2.64it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32965/203307 [3:27:43<17:53:24,  2.64it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32966/203307 [3:27:47<17:53:41,  2.64it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32966/203307 [3:27:47<17:53:41,  2.64it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32967/203307 [3:27:51<17:53:58,  2.64it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32967/203307 [3:27:51<17:53:58,  2.64it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32968/203307 [3:27:55<17:54:19,  2.64it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32968/203307 [3:27:55<17:54:19,  2.64it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32969/203307 [3:27:59<17:54:36,  2.64it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32969/203307 [3:27:59<17:54:36,  2.64it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32970/203307 [3:28:03<17:54:53,  2.64it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32970/203307 [3:28:03<17:54:53,  2.64it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32971/203307 [3:28:07<17:55:13,  2.64it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32971/203307 [3:28:07<17:55:13,  2.64it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32972/203307 [3:28:11<17:55:30,  2.64it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32972/203307 [3:28:11<17:55:30,  2.64it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32973/203307 [3:28:15<17:55:50,  2.64it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32973/203307 [3:28:15<17:55:51,  2.64it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32974/203307 [3:28:19<17:56:08,  2.64it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32974/203307 [3:28:19<17:56:08,  2.64it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32975/203307 [3:28:23<17:56:25,  2.64it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32975/203307 [3:28:23<17:56:25,  2.64it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32976/203307 [3:28:27<17:56:42,  2.64it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32976/203307 [3:28:27<17:56:42,  2.64it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32977/203307 [3:28:31<17:57:03,  2.64it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32977/203307 [3:28:31<17:57:03,  2.64it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32978/203307 [3:28:35<17:57:20,  2.64it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32978/203307 [3:28:35<17:57:20,  2.64it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32979/203307 [3:28:39<17:57:40,  2.63it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32979/203307 [3:28:39<17:57:40,  2.63it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32980/203307 [3:28:43<17:57:57,  2.63it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32980/203307 [3:28:43<17:57:57,  2.63it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32981/203307 [3:28:47<17:58:15,  2.63it/s, v_num=line, training/loss=0.0848]Epoch 0:  16%|█▌        | 32981/203307 [3:28:47<17:58:15,  2.63it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32982/203307 [3:28:51<17:58:36,  2.63it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32982/203307 [3:28:51<17:58:36,  2.63it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32983/203307 [3:28:55<17:58:53,  2.63it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32983/203307 [3:28:55<17:58:53,  2.63it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32984/203307 [3:28:59<17:59:10,  2.63it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32984/203307 [3:28:59<17:59:10,  2.63it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32985/203307 [3:29:03<17:59:31,  2.63it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32985/203307 [3:29:03<17:59:31,  2.63it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32986/203307 [3:29:07<17:59:48,  2.63it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32986/203307 [3:29:07<17:59:48,  2.63it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32987/203307 [3:29:11<18:00:05,  2.63it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32987/203307 [3:29:11<18:00:05,  2.63it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32988/203307 [3:29:15<18:00:26,  2.63it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32988/203307 [3:29:15<18:00:26,  2.63it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32989/203307 [3:29:19<18:00:43,  2.63it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32989/203307 [3:29:19<18:00:43,  2.63it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32990/203307 [3:29:23<18:01:03,  2.63it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32990/203307 [3:29:23<18:01:03,  2.63it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32991/203307 [3:29:28<18:01:23,  2.62it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32991/203307 [3:29:28<18:01:23,  2.62it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32992/203307 [3:29:32<18:01:40,  2.62it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32992/203307 [3:29:32<18:01:40,  2.62it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32993/203307 [3:29:35<18:01:58,  2.62it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32993/203307 [3:29:35<18:01:58,  2.62it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32994/203307 [3:29:40<18:02:20,  2.62it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32994/203307 [3:29:40<18:02:20,  2.62it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32995/203307 [3:29:44<18:02:37,  2.62it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32995/203307 [3:29:44<18:02:37,  2.62it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32996/203307 [3:29:48<18:02:58,  2.62it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32996/203307 [3:29:48<18:02:58,  2.62it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32997/203307 [3:29:52<18:03:15,  2.62it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32997/203307 [3:29:52<18:03:15,  2.62it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32998/203307 [3:29:57<18:03:36,  2.62it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32998/203307 [3:29:57<18:03:36,  2.62it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32999/203307 [3:30:00<18:03:53,  2.62it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 32999/203307 [3:30:00<18:03:53,  2.62it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 33000/203307 [3:30:05<18:04:13,  2.62it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 33000/203307 [3:30:05<18:04:14,  2.62it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 33001/203307 [3:30:09<18:04:31,  2.62it/s, v_num=line, training/loss=0.0863]Epoch 0:  16%|█▌        | 33001/203307 [3:30:09<18:04:31,  2.62it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33002/203307 [3:30:13<18:04:48,  2.62it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33002/203307 [3:30:13<18:04:48,  2.62it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33003/203307 [3:30:17<18:05:10,  2.62it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33003/203307 [3:30:17<18:05:10,  2.62it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33004/203307 [3:30:22<18:05:31,  2.61it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33004/203307 [3:30:22<18:05:31,  2.61it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33005/203307 [3:30:25<18:05:48,  2.61it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33005/203307 [3:30:25<18:05:48,  2.61it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33006/203307 [3:30:29<18:06:05,  2.61it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33006/203307 [3:30:29<18:06:05,  2.61it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33007/203307 [3:30:34<18:06:25,  2.61it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33007/203307 [3:30:34<18:06:26,  2.61it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33008/203307 [3:30:37<18:06:43,  2.61it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33008/203307 [3:30:37<18:06:43,  2.61it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33009/203307 [3:30:42<18:07:03,  2.61it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33009/203307 [3:30:42<18:07:03,  2.61it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33010/203307 [3:30:46<18:07:20,  2.61it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33010/203307 [3:30:46<18:07:20,  2.61it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33011/203307 [3:30:50<18:07:41,  2.61it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33011/203307 [3:30:50<18:07:41,  2.61it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33012/203307 [3:30:54<18:07:59,  2.61it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33012/203307 [3:30:54<18:07:59,  2.61it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33013/203307 [3:30:58<18:08:19,  2.61it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33013/203307 [3:30:58<18:08:19,  2.61it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33014/203307 [3:31:02<18:08:35,  2.61it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33014/203307 [3:31:02<18:08:36,  2.61it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33015/203307 [3:31:06<18:08:56,  2.61it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33015/203307 [3:31:06<18:08:56,  2.61it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33016/203307 [3:31:10<18:09:13,  2.61it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33016/203307 [3:31:10<18:09:13,  2.61it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33017/203307 [3:31:14<18:09:30,  2.60it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33017/203307 [3:31:14<18:09:30,  2.60it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33018/203307 [3:31:18<18:09:50,  2.60it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33018/203307 [3:31:18<18:09:50,  2.60it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33019/203307 [3:31:22<18:10:08,  2.60it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33019/203307 [3:31:22<18:10:08,  2.60it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33020/203307 [3:31:27<18:10:29,  2.60it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33020/203307 [3:31:27<18:10:29,  2.60it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33021/203307 [3:31:31<18:10:49,  2.60it/s, v_num=line, training/loss=0.0803]Epoch 0:  16%|█▌        | 33021/203307 [3:31:31<18:10:49,  2.60it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▌        | 33022/203307 [3:31:35<18:11:06,  2.60it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▌        | 33022/203307 [3:31:35<18:11:06,  2.60it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▌        | 33023/203307 [3:31:39<18:11:26,  2.60it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▌        | 33023/203307 [3:31:39<18:11:26,  2.60it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▌        | 33024/203307 [3:31:43<18:11:44,  2.60it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▌        | 33024/203307 [3:31:43<18:11:44,  2.60it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▌        | 33025/203307 [3:31:47<18:12:02,  2.60it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▌        | 33025/203307 [3:31:47<18:12:02,  2.60it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▌        | 33026/203307 [3:31:51<18:12:19,  2.60it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▌        | 33026/203307 [3:31:51<18:12:19,  2.60it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▌        | 33027/203307 [3:31:55<18:12:39,  2.60it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▌        | 33027/203307 [3:31:55<18:12:39,  2.60it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▌        | 33028/203307 [3:31:59<18:12:56,  2.60it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▌        | 33028/203307 [3:31:59<18:12:56,  2.60it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▌        | 33029/203307 [3:32:04<18:13:18,  2.60it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▌        | 33029/203307 [3:32:04<18:13:18,  2.60it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▌        | 33030/203307 [3:32:07<18:13:35,  2.60it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▌        | 33030/203307 [3:32:07<18:13:35,  2.60it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▌        | 33031/203307 [3:32:11<18:13:52,  2.59it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▌        | 33031/203307 [3:32:11<18:13:52,  2.59it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▌        | 33032/203307 [3:32:16<18:14:13,  2.59it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▌        | 33032/203307 [3:32:16<18:14:13,  2.59it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▌        | 33033/203307 [3:32:20<18:14:31,  2.59it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▌        | 33033/203307 [3:32:20<18:14:31,  2.59it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▌        | 33034/203307 [3:32:23<18:14:47,  2.59it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▌        | 33034/203307 [3:32:23<18:14:48,  2.59it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▌        | 33035/203307 [3:32:27<18:15:05,  2.59it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▌        | 33035/203307 [3:32:27<18:15:05,  2.59it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▌        | 33036/203307 [3:32:32<18:15:25,  2.59it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▌        | 33036/203307 [3:32:32<18:15:25,  2.59it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▌        | 33037/203307 [3:32:36<18:15:46,  2.59it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▌        | 33037/203307 [3:32:36<18:15:46,  2.59it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▋        | 33038/203307 [3:32:41<18:16:07,  2.59it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▋        | 33038/203307 [3:32:41<18:16:07,  2.59it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▋        | 33039/203307 [3:32:45<18:16:25,  2.59it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▋        | 33039/203307 [3:32:45<18:16:25,  2.59it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▋        | 33040/203307 [3:32:49<18:16:45,  2.59it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▋        | 33040/203307 [3:32:49<18:16:45,  2.59it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▋        | 33041/203307 [3:32:53<18:17:03,  2.59it/s, v_num=line, training/loss=0.0874]Epoch 0:  16%|█▋        | 33041/203307 [3:32:53<18:17:03,  2.59it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33042/203307 [3:32:57<18:17:20,  2.59it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33042/203307 [3:32:57<18:17:20,  2.59it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33043/203307 [3:33:01<18:17:38,  2.59it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33043/203307 [3:33:01<18:17:38,  2.59it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33044/203307 [3:33:04<18:17:55,  2.58it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33044/203307 [3:33:04<18:17:55,  2.58it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33045/203307 [3:33:09<18:18:16,  2.58it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33045/203307 [3:33:09<18:18:16,  2.58it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33046/203307 [3:33:13<18:18:37,  2.58it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33046/203307 [3:33:13<18:18:37,  2.58it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33047/203307 [3:33:17<18:18:55,  2.58it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33047/203307 [3:33:17<18:18:55,  2.58it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33048/203307 [3:33:22<18:19:15,  2.58it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33048/203307 [3:33:22<18:19:15,  2.58it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33049/203307 [3:33:26<18:19:32,  2.58it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33049/203307 [3:33:26<18:19:32,  2.58it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33050/203307 [3:33:29<18:19:50,  2.58it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33050/203307 [3:33:29<18:19:50,  2.58it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33051/203307 [3:33:33<18:20:07,  2.58it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33051/203307 [3:33:33<18:20:08,  2.58it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33052/203307 [3:33:37<18:20:25,  2.58it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33052/203307 [3:33:37<18:20:25,  2.58it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33053/203307 [3:33:41<18:20:42,  2.58it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33053/203307 [3:33:41<18:20:42,  2.58it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33054/203307 [3:33:45<18:21:03,  2.58it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33054/203307 [3:33:45<18:21:03,  2.58it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33055/203307 [3:33:50<18:21:24,  2.58it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33055/203307 [3:33:50<18:21:24,  2.58it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33056/203307 [3:33:54<18:21:41,  2.58it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33056/203307 [3:33:54<18:21:41,  2.58it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33057/203307 [3:33:58<18:22:01,  2.57it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33057/203307 [3:33:58<18:22:01,  2.57it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33058/203307 [3:34:02<18:22:18,  2.57it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33058/203307 [3:34:02<18:22:18,  2.57it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33059/203307 [3:34:06<18:22:35,  2.57it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33059/203307 [3:34:06<18:22:35,  2.57it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33060/203307 [3:34:09<18:22:52,  2.57it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33060/203307 [3:34:09<18:22:52,  2.57it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33061/203307 [3:34:13<18:23:09,  2.57it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33061/203307 [3:34:13<18:23:09,  2.57it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33062/203307 [3:34:17<18:23:26,  2.57it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33062/203307 [3:34:17<18:23:26,  2.57it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33063/203307 [3:34:22<18:23:47,  2.57it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33063/203307 [3:34:22<18:23:47,  2.57it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33064/203307 [3:34:25<18:24:04,  2.57it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33064/203307 [3:34:25<18:24:04,  2.57it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33065/203307 [3:34:30<18:24:24,  2.57it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33065/203307 [3:34:30<18:24:24,  2.57it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33066/203307 [3:34:33<18:24:41,  2.57it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33066/203307 [3:34:33<18:24:41,  2.57it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33067/203307 [3:34:37<18:24:58,  2.57it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33067/203307 [3:34:37<18:24:58,  2.57it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33068/203307 [3:34:41<18:25:15,  2.57it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33068/203307 [3:34:41<18:25:15,  2.57it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33069/203307 [3:34:45<18:25:33,  2.57it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33069/203307 [3:34:45<18:25:33,  2.57it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33070/203307 [3:34:49<18:25:50,  2.57it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33070/203307 [3:34:49<18:25:50,  2.57it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33071/203307 [3:34:53<18:26:11,  2.56it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33071/203307 [3:34:53<18:26:11,  2.56it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33072/203307 [3:34:58<18:26:32,  2.56it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33072/203307 [3:34:58<18:26:32,  2.56it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33073/203307 [3:35:02<18:26:52,  2.56it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33073/203307 [3:35:02<18:26:53,  2.56it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33074/203307 [3:35:06<18:27:10,  2.56it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33074/203307 [3:35:06<18:27:10,  2.56it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33075/203307 [3:35:10<18:27:27,  2.56it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33075/203307 [3:35:10<18:27:27,  2.56it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33076/203307 [3:35:14<18:27:45,  2.56it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33076/203307 [3:35:14<18:27:45,  2.56it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33077/203307 [3:35:18<18:28:02,  2.56it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33077/203307 [3:35:18<18:28:02,  2.56it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33078/203307 [3:35:21<18:28:20,  2.56it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33078/203307 [3:35:21<18:28:20,  2.56it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33079/203307 [3:35:26<18:28:40,  2.56it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33079/203307 [3:35:26<18:28:40,  2.56it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33080/203307 [3:35:30<18:28:58,  2.56it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33080/203307 [3:35:30<18:28:58,  2.56it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33081/203307 [3:35:34<18:29:19,  2.56it/s, v_num=line, training/loss=0.0796]Epoch 0:  16%|█▋        | 33081/203307 [3:35:34<18:29:19,  2.56it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33082/203307 [3:35:39<18:29:40,  2.56it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33082/203307 [3:35:39<18:29:40,  2.56it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33083/203307 [3:35:43<18:29:57,  2.56it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33083/203307 [3:35:43<18:29:57,  2.56it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33084/203307 [3:35:47<18:30:14,  2.56it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33084/203307 [3:35:47<18:30:14,  2.56it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33085/203307 [3:35:50<18:30:32,  2.55it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33085/203307 [3:35:50<18:30:32,  2.55it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33086/203307 [3:35:54<18:30:49,  2.55it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33086/203307 [3:35:54<18:30:49,  2.55it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33087/203307 [3:35:58<18:31:07,  2.55it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33087/203307 [3:35:58<18:31:07,  2.55it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33088/203307 [3:36:03<18:31:28,  2.55it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33088/203307 [3:36:03<18:31:28,  2.55it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33089/203307 [3:36:07<18:31:48,  2.55it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33089/203307 [3:36:07<18:31:48,  2.55it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33090/203307 [3:36:12<18:32:09,  2.55it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33090/203307 [3:36:12<18:32:09,  2.55it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33091/203307 [3:36:16<18:32:27,  2.55it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33091/203307 [3:36:16<18:32:27,  2.55it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33092/203307 [3:36:19<18:32:44,  2.55it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33092/203307 [3:36:19<18:32:44,  2.55it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33093/203307 [3:36:23<18:33:02,  2.55it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33093/203307 [3:36:23<18:33:02,  2.55it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33094/203307 [3:36:27<18:33:20,  2.55it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33094/203307 [3:36:27<18:33:20,  2.55it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33095/203307 [3:36:31<18:33:37,  2.55it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33095/203307 [3:36:31<18:33:37,  2.55it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33096/203307 [3:36:35<18:33:57,  2.55it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33096/203307 [3:36:35<18:33:57,  2.55it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33097/203307 [3:36:39<18:34:14,  2.55it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33097/203307 [3:36:39<18:34:14,  2.55it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33098/203307 [3:36:44<18:34:35,  2.55it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33098/203307 [3:36:44<18:34:35,  2.55it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33099/203307 [3:36:48<18:34:55,  2.54it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33099/203307 [3:36:48<18:34:55,  2.54it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33100/203307 [3:36:52<18:35:12,  2.54it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33100/203307 [3:36:52<18:35:12,  2.54it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33101/203307 [3:36:56<18:35:30,  2.54it/s, v_num=line, training/loss=0.0866]Epoch 0:  16%|█▋        | 33101/203307 [3:36:56<18:35:30,  2.54it/s, v_num=line, training/loss=0.090] Epoch 0:  16%|█▋        | 33102/203307 [3:37:00<18:35:47,  2.54it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33102/203307 [3:37:00<18:35:47,  2.54it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33103/203307 [3:37:03<18:36:04,  2.54it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33103/203307 [3:37:03<18:36:04,  2.54it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33104/203307 [3:37:08<18:36:25,  2.54it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33104/203307 [3:37:08<18:36:25,  2.54it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33105/203307 [3:37:12<18:36:41,  2.54it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33105/203307 [3:37:12<18:36:41,  2.54it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33106/203307 [3:37:15<18:36:58,  2.54it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33106/203307 [3:37:15<18:36:58,  2.54it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33107/203307 [3:37:20<18:37:18,  2.54it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33107/203307 [3:37:20<18:37:18,  2.54it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33108/203307 [3:37:24<18:37:38,  2.54it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33108/203307 [3:37:24<18:37:38,  2.54it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33109/203307 [3:37:28<18:37:54,  2.54it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33109/203307 [3:37:28<18:37:55,  2.54it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33110/203307 [3:37:32<18:38:11,  2.54it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33110/203307 [3:37:32<18:38:12,  2.54it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33111/203307 [3:37:35<18:38:29,  2.54it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33111/203307 [3:37:35<18:38:29,  2.54it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33112/203307 [3:37:39<18:38:46,  2.54it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33112/203307 [3:37:39<18:38:46,  2.54it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33113/203307 [3:37:44<18:39:06,  2.53it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33113/203307 [3:37:44<18:39:06,  2.53it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33114/203307 [3:37:47<18:39:24,  2.53it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33114/203307 [3:37:47<18:39:24,  2.53it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33115/203307 [3:37:52<18:39:44,  2.53it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33115/203307 [3:37:52<18:39:44,  2.53it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33116/203307 [3:37:56<18:40:01,  2.53it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33116/203307 [3:37:56<18:40:02,  2.53it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33117/203307 [3:38:00<18:40:21,  2.53it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33117/203307 [3:38:00<18:40:21,  2.53it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33118/203307 [3:38:04<18:40:39,  2.53it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33118/203307 [3:38:04<18:40:39,  2.53it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33119/203307 [3:38:08<18:40:56,  2.53it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33119/203307 [3:38:08<18:40:56,  2.53it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33120/203307 [3:38:12<18:41:14,  2.53it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33120/203307 [3:38:12<18:41:14,  2.53it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33121/203307 [3:38:16<18:41:34,  2.53it/s, v_num=line, training/loss=0.090]Epoch 0:  16%|█▋        | 33121/203307 [3:38:16<18:41:34,  2.53it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33122/203307 [3:38:20<18:41:51,  2.53it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33122/203307 [3:38:20<18:41:51,  2.53it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33123/203307 [3:38:24<18:42:12,  2.53it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33123/203307 [3:38:24<18:42:12,  2.53it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33124/203307 [3:38:29<18:42:33,  2.53it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33124/203307 [3:38:29<18:42:33,  2.53it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33125/203307 [3:38:33<18:42:50,  2.53it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33125/203307 [3:38:33<18:42:50,  2.53it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33126/203307 [3:38:37<18:43:10,  2.53it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33126/203307 [3:38:37<18:43:10,  2.53it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33127/203307 [3:38:41<18:43:27,  2.52it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33127/203307 [3:38:41<18:43:27,  2.52it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33128/203307 [3:38:45<18:43:44,  2.52it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33128/203307 [3:38:45<18:43:44,  2.52it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33129/203307 [3:38:49<18:44:05,  2.52it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33129/203307 [3:38:49<18:44:05,  2.52it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33130/203307 [3:38:53<18:44:22,  2.52it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33130/203307 [3:38:53<18:44:22,  2.52it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33131/203307 [3:38:57<18:44:39,  2.52it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33131/203307 [3:38:57<18:44:39,  2.52it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33132/203307 [3:39:01<18:45:00,  2.52it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33132/203307 [3:39:01<18:45:00,  2.52it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33133/203307 [3:39:06<18:45:21,  2.52it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33133/203307 [3:39:06<18:45:21,  2.52it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33134/203307 [3:39:10<18:45:38,  2.52it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33134/203307 [3:39:10<18:45:38,  2.52it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33135/203307 [3:39:14<18:45:59,  2.52it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33135/203307 [3:39:14<18:45:59,  2.52it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33136/203307 [3:39:18<18:46:16,  2.52it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33136/203307 [3:39:18<18:46:16,  2.52it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33137/203307 [3:39:22<18:46:34,  2.52it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33137/203307 [3:39:22<18:46:34,  2.52it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33138/203307 [3:39:27<18:46:54,  2.52it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33138/203307 [3:39:27<18:46:54,  2.52it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33139/203307 [3:39:30<18:47:11,  2.52it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33139/203307 [3:39:30<18:47:11,  2.52it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33140/203307 [3:39:35<18:47:31,  2.52it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33140/203307 [3:39:35<18:47:31,  2.52it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33141/203307 [3:39:39<18:47:53,  2.51it/s, v_num=line, training/loss=0.0921]Epoch 0:  16%|█▋        | 33141/203307 [3:39:39<18:47:53,  2.51it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33142/203307 [3:39:43<18:48:10,  2.51it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33142/203307 [3:39:43<18:48:10,  2.51it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33143/203307 [3:39:47<18:48:27,  2.51it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33143/203307 [3:39:47<18:48:27,  2.51it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33144/203307 [3:39:51<18:48:47,  2.51it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33144/203307 [3:39:51<18:48:47,  2.51it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33145/203307 [3:39:55<18:49:04,  2.51it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33145/203307 [3:39:55<18:49:04,  2.51it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33146/203307 [3:39:59<18:49:24,  2.51it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33146/203307 [3:39:59<18:49:24,  2.51it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33147/203307 [3:40:03<18:49:41,  2.51it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33147/203307 [3:40:03<18:49:41,  2.51it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33148/203307 [3:40:08<18:50:01,  2.51it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33148/203307 [3:40:08<18:50:01,  2.51it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33149/203307 [3:40:11<18:50:18,  2.51it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33149/203307 [3:40:11<18:50:18,  2.51it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33150/203307 [3:40:16<18:50:39,  2.51it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33150/203307 [3:40:16<18:50:39,  2.51it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33151/203307 [3:40:20<18:50:56,  2.51it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33151/203307 [3:40:20<18:50:56,  2.51it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33152/203307 [3:40:23<18:51:12,  2.51it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33152/203307 [3:40:23<18:51:12,  2.51it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33153/203307 [3:40:28<18:51:32,  2.51it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33153/203307 [3:40:28<18:51:32,  2.51it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33154/203307 [3:40:32<18:51:52,  2.51it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33154/203307 [3:40:32<18:51:52,  2.51it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33155/203307 [3:40:36<18:52:09,  2.50it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33155/203307 [3:40:36<18:52:09,  2.50it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33156/203307 [3:40:40<18:52:27,  2.50it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33156/203307 [3:40:40<18:52:27,  2.50it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33157/203307 [3:40:44<18:52:47,  2.50it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33157/203307 [3:40:44<18:52:47,  2.50it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33158/203307 [3:40:48<18:53:04,  2.50it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33158/203307 [3:40:48<18:53:04,  2.50it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33159/203307 [3:40:53<18:53:25,  2.50it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33159/203307 [3:40:53<18:53:25,  2.50it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33160/203307 [3:40:56<18:53:42,  2.50it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33160/203307 [3:40:56<18:53:42,  2.50it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33161/203307 [3:41:00<18:53:59,  2.50it/s, v_num=line, training/loss=0.0954]Epoch 0:  16%|█▋        | 33161/203307 [3:41:00<18:53:59,  2.50it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33162/203307 [3:41:04<18:54:18,  2.50it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33162/203307 [3:41:04<18:54:18,  2.50it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33163/203307 [3:41:09<18:54:39,  2.50it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33163/203307 [3:41:09<18:54:39,  2.50it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33164/203307 [3:41:13<18:54:56,  2.50it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33164/203307 [3:41:13<18:54:56,  2.50it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33165/203307 [3:41:17<18:55:16,  2.50it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33165/203307 [3:41:17<18:55:16,  2.50it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33166/203307 [3:41:21<18:55:33,  2.50it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33166/203307 [3:41:21<18:55:33,  2.50it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33167/203307 [3:41:25<18:55:54,  2.50it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33167/203307 [3:41:25<18:55:54,  2.50it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33168/203307 [3:41:29<18:56:11,  2.50it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33168/203307 [3:41:29<18:56:11,  2.50it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33169/203307 [3:41:33<18:56:28,  2.50it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33169/203307 [3:41:33<18:56:28,  2.50it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33170/203307 [3:41:37<18:56:45,  2.49it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33170/203307 [3:41:37<18:56:45,  2.49it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33171/203307 [3:41:41<18:57:06,  2.49it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33171/203307 [3:41:41<18:57:06,  2.49it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33172/203307 [3:41:45<18:57:23,  2.49it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33172/203307 [3:41:45<18:57:23,  2.49it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33173/203307 [3:41:50<18:57:43,  2.49it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33173/203307 [3:41:50<18:57:43,  2.49it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33174/203307 [3:41:53<18:58:00,  2.49it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33174/203307 [3:41:53<18:58:00,  2.49it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33175/203307 [3:41:57<18:58:16,  2.49it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33175/203307 [3:41:57<18:58:17,  2.49it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33176/203307 [3:42:02<18:58:37,  2.49it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33176/203307 [3:42:02<18:58:38,  2.49it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33177/203307 [3:42:05<18:58:54,  2.49it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33177/203307 [3:42:05<18:58:54,  2.49it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33178/203307 [3:42:09<18:59:11,  2.49it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33178/203307 [3:42:09<18:59:11,  2.49it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33179/203307 [3:42:14<18:59:31,  2.49it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33179/203307 [3:42:14<18:59:31,  2.49it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33180/203307 [3:42:18<18:59:50,  2.49it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33180/203307 [3:42:18<18:59:50,  2.49it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33181/203307 [3:42:22<19:00:07,  2.49it/s, v_num=line, training/loss=0.0878]Epoch 0:  16%|█▋        | 33181/203307 [3:42:22<19:00:07,  2.49it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33182/203307 [3:42:26<19:00:27,  2.49it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33182/203307 [3:42:26<19:00:27,  2.49it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33183/203307 [3:42:30<19:00:44,  2.49it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33183/203307 [3:42:30<19:00:44,  2.49it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33184/203307 [3:42:33<19:01:01,  2.48it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33184/203307 [3:42:33<19:01:01,  2.48it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33185/203307 [3:42:38<19:01:22,  2.48it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33185/203307 [3:42:38<19:01:22,  2.48it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33186/203307 [3:42:42<19:01:39,  2.48it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33186/203307 [3:42:42<19:01:39,  2.48it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33187/203307 [3:42:46<19:01:56,  2.48it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33187/203307 [3:42:46<19:01:56,  2.48it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33188/203307 [3:42:50<19:02:16,  2.48it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33188/203307 [3:42:50<19:02:16,  2.48it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33189/203307 [3:42:54<19:02:36,  2.48it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33189/203307 [3:42:54<19:02:36,  2.48it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33190/203307 [3:42:59<19:02:56,  2.48it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33190/203307 [3:42:59<19:02:56,  2.48it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33191/203307 [3:43:03<19:03:13,  2.48it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33191/203307 [3:43:03<19:03:13,  2.48it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33192/203307 [3:43:06<19:03:30,  2.48it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33192/203307 [3:43:06<19:03:30,  2.48it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33193/203307 [3:43:11<19:03:50,  2.48it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33193/203307 [3:43:11<19:03:50,  2.48it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33194/203307 [3:43:15<19:04:07,  2.48it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33194/203307 [3:43:15<19:04:07,  2.48it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33195/203307 [3:43:18<19:04:23,  2.48it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33195/203307 [3:43:18<19:04:23,  2.48it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33196/203307 [3:43:23<19:04:43,  2.48it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33196/203307 [3:43:23<19:04:43,  2.48it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33197/203307 [3:43:26<19:05:00,  2.48it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33197/203307 [3:43:26<19:05:00,  2.48it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33198/203307 [3:43:31<19:05:20,  2.48it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33198/203307 [3:43:31<19:05:20,  2.48it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33199/203307 [3:43:34<19:05:36,  2.47it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33199/203307 [3:43:35<19:05:37,  2.47it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33200/203307 [3:43:38<19:05:53,  2.47it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33200/203307 [3:43:38<19:05:53,  2.47it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33201/203307 [3:43:42<19:06:10,  2.47it/s, v_num=line, training/loss=0.0816]Epoch 0:  16%|█▋        | 33201/203307 [3:43:42<19:06:10,  2.47it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33202/203307 [3:43:47<19:06:31,  2.47it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33202/203307 [3:43:47<19:06:31,  2.47it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33203/203307 [3:43:50<19:06:48,  2.47it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33203/203307 [3:43:50<19:06:48,  2.47it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33204/203307 [3:43:55<19:07:08,  2.47it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33204/203307 [3:43:55<19:07:08,  2.47it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33205/203307 [3:43:58<19:07:25,  2.47it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33205/203307 [3:43:59<19:07:25,  2.47it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33206/203307 [3:44:02<19:07:41,  2.47it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33206/203307 [3:44:02<19:07:41,  2.47it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33207/203307 [3:44:07<19:08:01,  2.47it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33207/203307 [3:44:07<19:08:01,  2.47it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33208/203307 [3:44:10<19:08:18,  2.47it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33208/203307 [3:44:10<19:08:18,  2.47it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33209/203307 [3:44:14<19:08:35,  2.47it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33209/203307 [3:44:14<19:08:35,  2.47it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33210/203307 [3:44:18<19:08:52,  2.47it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33210/203307 [3:44:18<19:08:52,  2.47it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33211/203307 [3:44:23<19:09:13,  2.47it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33211/203307 [3:44:23<19:09:13,  2.47it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33212/203307 [3:44:26<19:09:29,  2.47it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33212/203307 [3:44:26<19:09:29,  2.47it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33213/203307 [3:44:31<19:09:49,  2.47it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33213/203307 [3:44:31<19:09:49,  2.47it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33214/203307 [3:44:34<19:10:06,  2.46it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33214/203307 [3:44:34<19:10:06,  2.46it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33215/203307 [3:44:39<19:10:26,  2.46it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33215/203307 [3:44:39<19:10:26,  2.46it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33216/203307 [3:44:43<19:10:45,  2.46it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33216/203307 [3:44:43<19:10:45,  2.46it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33217/203307 [3:44:47<19:11:02,  2.46it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33217/203307 [3:44:47<19:11:02,  2.46it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33218/203307 [3:44:51<19:11:19,  2.46it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33218/203307 [3:44:51<19:11:19,  2.46it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33219/203307 [3:44:55<19:11:39,  2.46it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33219/203307 [3:44:55<19:11:39,  2.46it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33220/203307 [3:44:59<19:11:56,  2.46it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33220/203307 [3:44:59<19:11:56,  2.46it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33221/203307 [3:45:03<19:12:16,  2.46it/s, v_num=line, training/loss=0.0856]Epoch 0:  16%|█▋        | 33221/203307 [3:45:03<19:12:16,  2.46it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33222/203307 [3:45:07<19:12:32,  2.46it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33222/203307 [3:45:07<19:12:33,  2.46it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33223/203307 [3:45:11<19:12:52,  2.46it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33223/203307 [3:45:11<19:12:52,  2.46it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33224/203307 [3:45:15<19:13:09,  2.46it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33224/203307 [3:45:15<19:13:09,  2.46it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33225/203307 [3:45:19<19:13:28,  2.46it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33225/203307 [3:45:19<19:13:28,  2.46it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33226/203307 [3:45:23<19:13:45,  2.46it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33226/203307 [3:45:23<19:13:45,  2.46it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33227/203307 [3:45:27<19:14:02,  2.46it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33227/203307 [3:45:27<19:14:02,  2.46it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33228/203307 [3:45:31<19:14:22,  2.46it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33228/203307 [3:45:31<19:14:22,  2.46it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33229/203307 [3:45:36<19:14:42,  2.45it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33229/203307 [3:45:36<19:14:42,  2.45it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33230/203307 [3:45:39<19:14:59,  2.45it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33230/203307 [3:45:39<19:14:59,  2.45it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33231/203307 [3:45:43<19:15:16,  2.45it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33231/203307 [3:45:43<19:15:16,  2.45it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33232/203307 [3:45:48<19:15:36,  2.45it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33232/203307 [3:45:48<19:15:36,  2.45it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33233/203307 [3:45:51<19:15:53,  2.45it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33233/203307 [3:45:51<19:15:53,  2.45it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33234/203307 [3:45:56<19:16:13,  2.45it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33234/203307 [3:45:56<19:16:13,  2.45it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33235/203307 [3:45:59<19:16:29,  2.45it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33235/203307 [3:46:00<19:16:30,  2.45it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33236/203307 [3:46:03<19:16:47,  2.45it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33236/203307 [3:46:03<19:16:47,  2.45it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33237/203307 [3:46:08<19:17:07,  2.45it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33237/203307 [3:46:08<19:17:07,  2.45it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33238/203307 [3:46:12<19:17:27,  2.45it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33238/203307 [3:46:12<19:17:27,  2.45it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33239/203307 [3:46:16<19:17:44,  2.45it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33239/203307 [3:46:16<19:17:44,  2.45it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33240/203307 [3:46:20<19:18:03,  2.45it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33240/203307 [3:46:20<19:18:03,  2.45it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33241/203307 [3:46:24<19:18:20,  2.45it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33241/203307 [3:46:24<19:18:20,  2.45it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33242/203307 [3:46:28<19:18:37,  2.45it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33242/203307 [3:46:28<19:18:37,  2.45it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33243/203307 [3:46:32<19:18:57,  2.45it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33243/203307 [3:46:32<19:18:57,  2.45it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33244/203307 [3:46:36<19:19:14,  2.45it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33244/203307 [3:46:36<19:19:14,  2.45it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33245/203307 [3:46:41<19:19:34,  2.44it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33245/203307 [3:46:41<19:19:34,  2.44it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33246/203307 [3:46:45<19:19:54,  2.44it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33246/203307 [3:46:45<19:19:54,  2.44it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33247/203307 [3:46:49<19:20:11,  2.44it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33247/203307 [3:46:49<19:20:11,  2.44it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33248/203307 [3:46:53<19:20:31,  2.44it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33248/203307 [3:46:53<19:20:31,  2.44it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33249/203307 [3:46:57<19:20:48,  2.44it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33249/203307 [3:46:57<19:20:48,  2.44it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33250/203307 [3:47:01<19:21:04,  2.44it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33250/203307 [3:47:01<19:21:04,  2.44it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33251/203307 [3:47:04<19:21:21,  2.44it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33251/203307 [3:47:04<19:21:21,  2.44it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33252/203307 [3:47:09<19:21:41,  2.44it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33252/203307 [3:47:09<19:21:41,  2.44it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33253/203307 [3:47:12<19:21:57,  2.44it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33253/203307 [3:47:12<19:21:57,  2.44it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33254/203307 [3:47:17<19:22:17,  2.44it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33254/203307 [3:47:17<19:22:17,  2.44it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33255/203307 [3:47:21<19:22:34,  2.44it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33255/203307 [3:47:21<19:22:34,  2.44it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33256/203307 [3:47:24<19:22:51,  2.44it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33256/203307 [3:47:24<19:22:51,  2.44it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33257/203307 [3:47:29<19:23:10,  2.44it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33257/203307 [3:47:29<19:23:10,  2.44it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33258/203307 [3:47:32<19:23:27,  2.44it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33258/203307 [3:47:32<19:23:27,  2.44it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33259/203307 [3:47:36<19:23:44,  2.44it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33259/203307 [3:47:36<19:23:44,  2.44it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33260/203307 [3:47:40<19:24:01,  2.43it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33260/203307 [3:47:40<19:24:02,  2.43it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33261/203307 [3:47:45<19:24:22,  2.43it/s, v_num=line, training/loss=0.0829]Epoch 0:  16%|█▋        | 33261/203307 [3:47:45<19:24:22,  2.43it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33262/203307 [3:47:48<19:24:39,  2.43it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33262/203307 [3:47:48<19:24:39,  2.43it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33263/203307 [3:47:53<19:24:59,  2.43it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33263/203307 [3:47:53<19:24:59,  2.43it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33264/203307 [3:47:57<19:25:16,  2.43it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33264/203307 [3:47:57<19:25:16,  2.43it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33265/203307 [3:48:01<19:25:36,  2.43it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33265/203307 [3:48:01<19:25:36,  2.43it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33266/203307 [3:48:05<19:25:52,  2.43it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33266/203307 [3:48:05<19:25:52,  2.43it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33267/203307 [3:48:09<19:26:10,  2.43it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33267/203307 [3:48:09<19:26:10,  2.43it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33268/203307 [3:48:12<19:26:27,  2.43it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33268/203307 [3:48:12<19:26:27,  2.43it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33269/203307 [3:48:16<19:26:44,  2.43it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33269/203307 [3:48:16<19:26:44,  2.43it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33270/203307 [3:48:21<19:27:04,  2.43it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33270/203307 [3:48:21<19:27:04,  2.43it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33271/203307 [3:48:25<19:27:24,  2.43it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33271/203307 [3:48:25<19:27:24,  2.43it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33272/203307 [3:48:29<19:27:41,  2.43it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33272/203307 [3:48:29<19:27:41,  2.43it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33273/203307 [3:48:33<19:28:01,  2.43it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33273/203307 [3:48:33<19:28:01,  2.43it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33274/203307 [3:48:37<19:28:18,  2.43it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33274/203307 [3:48:37<19:28:18,  2.43it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33275/203307 [3:48:41<19:28:35,  2.43it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33275/203307 [3:48:41<19:28:35,  2.43it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33276/203307 [3:48:45<19:28:52,  2.42it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33276/203307 [3:48:45<19:28:52,  2.42it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33277/203307 [3:48:49<19:29:09,  2.42it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33277/203307 [3:48:49<19:29:09,  2.42it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33278/203307 [3:48:52<19:29:26,  2.42it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33278/203307 [3:48:53<19:29:26,  2.42it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33279/203307 [3:48:57<19:29:46,  2.42it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33279/203307 [3:48:57<19:29:47,  2.42it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33280/203307 [3:49:01<19:30:07,  2.42it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33280/203307 [3:49:01<19:30:07,  2.42it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33281/203307 [3:49:05<19:30:24,  2.42it/s, v_num=line, training/loss=0.0873]Epoch 0:  16%|█▋        | 33281/203307 [3:49:05<19:30:24,  2.42it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33282/203307 [3:49:10<19:30:45,  2.42it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33282/203307 [3:49:10<19:30:45,  2.42it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33283/203307 [3:49:14<19:31:02,  2.42it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33283/203307 [3:49:14<19:31:02,  2.42it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33284/203307 [3:49:17<19:31:18,  2.42it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33284/203307 [3:49:17<19:31:19,  2.42it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33285/203307 [3:49:21<19:31:36,  2.42it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33285/203307 [3:49:21<19:31:36,  2.42it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33286/203307 [3:49:25<19:31:53,  2.42it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33286/203307 [3:49:25<19:31:53,  2.42it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33287/203307 [3:49:29<19:32:09,  2.42it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33287/203307 [3:49:29<19:32:09,  2.42it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33288/203307 [3:49:33<19:32:30,  2.42it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33288/203307 [3:49:33<19:32:30,  2.42it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33289/203307 [3:49:38<19:32:50,  2.42it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33289/203307 [3:49:38<19:32:50,  2.42it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33290/203307 [3:49:42<19:33:10,  2.42it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33290/203307 [3:49:42<19:33:11,  2.42it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33291/203307 [3:49:46<19:33:27,  2.41it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33291/203307 [3:49:46<19:33:27,  2.41it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33292/203307 [3:49:50<19:33:44,  2.41it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33292/203307 [3:49:50<19:33:45,  2.41it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33293/203307 [3:49:54<19:34:01,  2.41it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33293/203307 [3:49:54<19:34:01,  2.41it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33294/203307 [3:49:58<19:34:19,  2.41it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33294/203307 [3:49:58<19:34:19,  2.41it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33295/203307 [3:50:01<19:34:36,  2.41it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33295/203307 [3:50:01<19:34:36,  2.41it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33296/203307 [3:50:06<19:34:56,  2.41it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33296/203307 [3:50:06<19:34:56,  2.41it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33297/203307 [3:50:10<19:35:16,  2.41it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33297/203307 [3:50:10<19:35:16,  2.41it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33298/203307 [3:50:15<19:35:36,  2.41it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33298/203307 [3:50:15<19:35:36,  2.41it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33299/203307 [3:50:19<19:35:53,  2.41it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33299/203307 [3:50:19<19:35:53,  2.41it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33300/203307 [3:50:22<19:36:10,  2.41it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33300/203307 [3:50:22<19:36:10,  2.41it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33301/203307 [3:50:26<19:36:27,  2.41it/s, v_num=line, training/loss=0.0824]Epoch 0:  16%|█▋        | 33301/203307 [3:50:26<19:36:27,  2.41it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33302/203307 [3:50:30<19:36:44,  2.41it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33302/203307 [3:50:30<19:36:44,  2.41it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33303/203307 [3:50:34<19:37:01,  2.41it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33303/203307 [3:50:34<19:37:01,  2.41it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33304/203307 [3:50:38<19:37:21,  2.41it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33304/203307 [3:50:38<19:37:21,  2.41it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33305/203307 [3:50:42<19:37:39,  2.41it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33305/203307 [3:50:42<19:37:39,  2.41it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33306/203307 [3:50:47<19:37:59,  2.41it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33306/203307 [3:50:47<19:37:59,  2.41it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33307/203307 [3:50:51<19:38:19,  2.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33307/203307 [3:50:51<19:38:19,  2.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33308/203307 [3:50:55<19:38:36,  2.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33308/203307 [3:50:55<19:38:36,  2.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33309/203307 [3:50:59<19:38:53,  2.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33309/203307 [3:50:59<19:38:53,  2.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33310/203307 [3:51:03<19:39:10,  2.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33310/203307 [3:51:03<19:39:10,  2.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33311/203307 [3:51:07<19:39:27,  2.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33311/203307 [3:51:07<19:39:27,  2.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33312/203307 [3:51:10<19:39:44,  2.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33312/203307 [3:51:10<19:39:44,  2.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33313/203307 [3:51:15<19:40:04,  2.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33313/203307 [3:51:15<19:40:04,  2.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33314/203307 [3:51:18<19:40:20,  2.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33314/203307 [3:51:18<19:40:20,  2.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33315/203307 [3:51:23<19:40:40,  2.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33315/203307 [3:51:23<19:40:40,  2.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33316/203307 [3:51:27<19:40:57,  2.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33316/203307 [3:51:27<19:40:57,  2.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33317/203307 [3:51:30<19:41:14,  2.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33317/203307 [3:51:30<19:41:14,  2.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33318/203307 [3:51:34<19:41:30,  2.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33318/203307 [3:51:34<19:41:30,  2.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33319/203307 [3:51:38<19:41:47,  2.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33319/203307 [3:51:38<19:41:47,  2.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33320/203307 [3:51:42<19:42:05,  2.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33320/203307 [3:51:42<19:42:05,  2.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33321/203307 [3:51:46<19:42:25,  2.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  16%|█▋        | 33321/203307 [3:51:46<19:42:25,  2.40it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33322/203307 [3:51:50<19:42:41,  2.40it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33322/203307 [3:51:50<19:42:42,  2.40it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33323/203307 [3:51:55<19:43:02,  2.39it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33323/203307 [3:51:55<19:43:02,  2.39it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33324/203307 [3:51:59<19:43:21,  2.39it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33324/203307 [3:51:59<19:43:21,  2.39it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33325/203307 [3:52:02<19:43:37,  2.39it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33325/203307 [3:52:02<19:43:37,  2.39it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33326/203307 [3:52:06<19:43:53,  2.39it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33326/203307 [3:52:06<19:43:53,  2.39it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33327/203307 [3:52:10<19:44:10,  2.39it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33327/203307 [3:52:10<19:44:10,  2.39it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33328/203307 [3:52:14<19:44:27,  2.39it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33328/203307 [3:52:14<19:44:27,  2.39it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33329/203307 [3:52:18<19:44:46,  2.39it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33329/203307 [3:52:18<19:44:46,  2.39it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33330/203307 [3:52:22<19:45:03,  2.39it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33330/203307 [3:52:22<19:45:03,  2.39it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33331/203307 [3:52:26<19:45:19,  2.39it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33331/203307 [3:52:26<19:45:19,  2.39it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33332/203307 [3:52:30<19:45:40,  2.39it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33332/203307 [3:52:30<19:45:40,  2.39it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33333/203307 [3:52:34<19:45:59,  2.39it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33333/203307 [3:52:34<19:45:59,  2.39it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33334/203307 [3:52:38<19:46:15,  2.39it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33334/203307 [3:52:38<19:46:15,  2.39it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33335/203307 [3:52:42<19:46:32,  2.39it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33335/203307 [3:52:42<19:46:32,  2.39it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33336/203307 [3:52:46<19:46:49,  2.39it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33336/203307 [3:52:46<19:46:49,  2.39it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33337/203307 [3:52:49<19:47:06,  2.39it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33337/203307 [3:52:49<19:47:06,  2.39it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33338/203307 [3:52:54<19:47:26,  2.39it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33338/203307 [3:52:54<19:47:26,  2.39it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33339/203307 [3:52:58<19:47:43,  2.39it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33339/203307 [3:52:58<19:47:43,  2.39it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33340/203307 [3:53:02<19:48:02,  2.38it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33340/203307 [3:53:02<19:48:02,  2.38it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33341/203307 [3:53:06<19:48:22,  2.38it/s, v_num=line, training/loss=0.0784]Epoch 0:  16%|█▋        | 33341/203307 [3:53:06<19:48:22,  2.38it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33342/203307 [3:53:11<19:48:42,  2.38it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33342/203307 [3:53:11<19:48:42,  2.38it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33343/203307 [3:53:14<19:48:58,  2.38it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33343/203307 [3:53:14<19:48:58,  2.38it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33344/203307 [3:53:18<19:49:14,  2.38it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33344/203307 [3:53:18<19:49:15,  2.38it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33345/203307 [3:53:22<19:49:31,  2.38it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33345/203307 [3:53:22<19:49:31,  2.38it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33346/203307 [3:53:26<19:49:51,  2.38it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33346/203307 [3:53:26<19:49:51,  2.38it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33347/203307 [3:53:30<19:50:07,  2.38it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33347/203307 [3:53:30<19:50:07,  2.38it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33348/203307 [3:53:34<19:50:26,  2.38it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33348/203307 [3:53:34<19:50:26,  2.38it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33349/203307 [3:53:39<19:50:46,  2.38it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33349/203307 [3:53:39<19:50:46,  2.38it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33350/203307 [3:53:42<19:51:03,  2.38it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33350/203307 [3:53:42<19:51:03,  2.38it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33351/203307 [3:53:47<19:51:22,  2.38it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33351/203307 [3:53:47<19:51:22,  2.38it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33352/203307 [3:53:51<19:51:39,  2.38it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33352/203307 [3:53:51<19:51:39,  2.38it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33353/203307 [3:53:54<19:51:55,  2.38it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33353/203307 [3:53:54<19:51:55,  2.38it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33354/203307 [3:53:59<19:52:15,  2.38it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33354/203307 [3:53:59<19:52:15,  2.38it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33355/203307 [3:54:02<19:52:32,  2.38it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33355/203307 [3:54:02<19:52:32,  2.38it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33356/203307 [3:54:06<19:52:49,  2.37it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33356/203307 [3:54:06<19:52:49,  2.37it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33357/203307 [3:54:11<19:53:09,  2.37it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33357/203307 [3:54:11<19:53:09,  2.37it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33358/203307 [3:54:15<19:53:29,  2.37it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33358/203307 [3:54:15<19:53:29,  2.37it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33359/203307 [3:54:19<19:53:46,  2.37it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33359/203307 [3:54:19<19:53:46,  2.37it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33360/203307 [3:54:23<19:54:06,  2.37it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33360/203307 [3:54:23<19:54:06,  2.37it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33361/203307 [3:54:27<19:54:23,  2.37it/s, v_num=line, training/loss=0.0881]Epoch 0:  16%|█▋        | 33361/203307 [3:54:27<19:54:23,  2.37it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33362/203307 [3:54:31<19:54:39,  2.37it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33362/203307 [3:54:31<19:54:39,  2.37it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33363/203307 [3:54:35<19:54:59,  2.37it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33363/203307 [3:54:35<19:54:59,  2.37it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33364/203307 [3:54:39<19:55:16,  2.37it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33364/203307 [3:54:39<19:55:16,  2.37it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33365/203307 [3:54:44<19:55:35,  2.37it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33365/203307 [3:54:44<19:55:35,  2.37it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33366/203307 [3:54:47<19:55:52,  2.37it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33366/203307 [3:54:47<19:55:52,  2.37it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33367/203307 [3:54:52<19:56:13,  2.37it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33367/203307 [3:54:52<19:56:13,  2.37it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33368/203307 [3:54:56<19:56:30,  2.37it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33368/203307 [3:54:56<19:56:30,  2.37it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33369/203307 [3:55:00<19:56:49,  2.37it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33369/203307 [3:55:00<19:56:49,  2.37it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33370/203307 [3:55:04<19:57:06,  2.37it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33370/203307 [3:55:04<19:57:06,  2.37it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33371/203307 [3:55:08<19:57:26,  2.37it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33371/203307 [3:55:08<19:57:26,  2.37it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33372/203307 [3:55:12<19:57:42,  2.36it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33372/203307 [3:55:12<19:57:42,  2.36it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33373/203307 [3:55:16<19:58:02,  2.36it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33373/203307 [3:55:16<19:58:02,  2.36it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33374/203307 [3:55:20<19:58:19,  2.36it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33374/203307 [3:55:20<19:58:19,  2.36it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33375/203307 [3:55:25<19:58:39,  2.36it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33375/203307 [3:55:25<19:58:39,  2.36it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33376/203307 [3:55:28<19:58:55,  2.36it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33376/203307 [3:55:28<19:58:55,  2.36it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33377/203307 [3:55:32<19:59:12,  2.36it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33377/203307 [3:55:32<19:59:12,  2.36it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33378/203307 [3:55:36<19:59:32,  2.36it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33378/203307 [3:55:36<19:59:32,  2.36it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33379/203307 [3:55:41<19:59:51,  2.36it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33379/203307 [3:55:41<19:59:51,  2.36it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33380/203307 [3:55:45<20:00:08,  2.36it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33380/203307 [3:55:45<20:00:08,  2.36it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33381/203307 [3:55:49<20:00:25,  2.36it/s, v_num=line, training/loss=0.0893]Epoch 0:  16%|█▋        | 33381/203307 [3:55:49<20:00:25,  2.36it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33382/203307 [3:55:53<20:00:45,  2.36it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33382/203307 [3:55:53<20:00:45,  2.36it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33383/203307 [3:55:57<20:01:01,  2.36it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33383/203307 [3:55:57<20:01:02,  2.36it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33384/203307 [3:56:01<20:01:22,  2.36it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33384/203307 [3:56:01<20:01:22,  2.36it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33385/203307 [3:56:05<20:01:38,  2.36it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33385/203307 [3:56:05<20:01:38,  2.36it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33386/203307 [3:56:09<20:01:55,  2.36it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33386/203307 [3:56:09<20:01:55,  2.36it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33387/203307 [3:56:13<20:02:14,  2.36it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33387/203307 [3:56:13<20:02:14,  2.36it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33388/203307 [3:56:17<20:02:34,  2.35it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33388/203307 [3:56:17<20:02:34,  2.35it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33389/203307 [3:56:21<20:02:50,  2.35it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33389/203307 [3:56:21<20:02:50,  2.35it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33390/203307 [3:56:26<20:03:10,  2.35it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33390/203307 [3:56:26<20:03:10,  2.35it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33391/203307 [3:56:29<20:03:27,  2.35it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33391/203307 [3:56:29<20:03:27,  2.35it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33392/203307 [3:56:33<20:03:43,  2.35it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33392/203307 [3:56:33<20:03:43,  2.35it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33393/203307 [3:56:37<20:04:03,  2.35it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33393/203307 [3:56:37<20:04:03,  2.35it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33394/203307 [3:56:41<20:04:20,  2.35it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33394/203307 [3:56:41<20:04:20,  2.35it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33395/203307 [3:56:45<20:04:37,  2.35it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33395/203307 [3:56:45<20:04:37,  2.35it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33396/203307 [3:56:50<20:04:57,  2.35it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33396/203307 [3:56:50<20:04:57,  2.35it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33397/203307 [3:56:53<20:05:14,  2.35it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33397/203307 [3:56:53<20:05:14,  2.35it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33398/203307 [3:56:58<20:05:34,  2.35it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33398/203307 [3:56:58<20:05:34,  2.35it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33399/203307 [3:57:02<20:05:51,  2.35it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33399/203307 [3:57:02<20:05:51,  2.35it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33400/203307 [3:57:05<20:06:07,  2.35it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33400/203307 [3:57:05<20:06:07,  2.35it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33401/203307 [3:57:10<20:06:29,  2.35it/s, v_num=line, training/loss=0.0933]Epoch 0:  16%|█▋        | 33401/203307 [3:57:10<20:06:29,  2.35it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33402/203307 [3:57:14<20:06:46,  2.35it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33402/203307 [3:57:14<20:06:46,  2.35it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33403/203307 [3:57:18<20:07:02,  2.35it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33403/203307 [3:57:18<20:07:02,  2.35it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33404/203307 [3:57:22<20:07:22,  2.35it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33404/203307 [3:57:22<20:07:22,  2.35it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33405/203307 [3:57:27<20:07:42,  2.34it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33405/203307 [3:57:27<20:07:42,  2.34it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33406/203307 [3:57:30<20:07:58,  2.34it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33406/203307 [3:57:30<20:07:58,  2.34it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33407/203307 [3:57:35<20:08:18,  2.34it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33407/203307 [3:57:35<20:08:18,  2.34it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33408/203307 [3:57:38<20:08:35,  2.34it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33408/203307 [3:57:39<20:08:35,  2.34it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33409/203307 [3:57:42<20:08:51,  2.34it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33409/203307 [3:57:42<20:08:51,  2.34it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33410/203307 [3:57:47<20:09:12,  2.34it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33410/203307 [3:57:47<20:09:12,  2.34it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33411/203307 [3:57:51<20:09:28,  2.34it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33411/203307 [3:57:51<20:09:28,  2.34it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33412/203307 [3:57:54<20:09:44,  2.34it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33412/203307 [3:57:54<20:09:44,  2.34it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33413/203307 [3:57:59<20:10:04,  2.34it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33413/203307 [3:57:59<20:10:04,  2.34it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33414/203307 [3:58:03<20:10:24,  2.34it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33414/203307 [3:58:03<20:10:24,  2.34it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33415/203307 [3:58:07<20:10:43,  2.34it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33415/203307 [3:58:07<20:10:43,  2.34it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33416/203307 [3:58:11<20:11:00,  2.34it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33416/203307 [3:58:11<20:11:00,  2.34it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33417/203307 [3:58:15<20:11:16,  2.34it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33417/203307 [3:58:15<20:11:16,  2.34it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33418/203307 [3:58:19<20:11:33,  2.34it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33418/203307 [3:58:19<20:11:33,  2.34it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33419/203307 [3:58:23<20:11:54,  2.34it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33419/203307 [3:58:23<20:11:54,  2.34it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33420/203307 [3:58:27<20:12:10,  2.34it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33420/203307 [3:58:27<20:12:10,  2.34it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33421/203307 [3:58:31<20:12:29,  2.34it/s, v_num=line, training/loss=0.0909]Epoch 0:  16%|█▋        | 33421/203307 [3:58:31<20:12:29,  2.34it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33422/203307 [3:58:35<20:12:45,  2.33it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33422/203307 [3:58:35<20:12:45,  2.33it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33423/203307 [3:58:39<20:13:05,  2.33it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33423/203307 [3:58:39<20:13:05,  2.33it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33424/203307 [3:58:43<20:13:22,  2.33it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33424/203307 [3:58:43<20:13:22,  2.33it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33425/203307 [3:58:47<20:13:38,  2.33it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33425/203307 [3:58:47<20:13:39,  2.33it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33426/203307 [3:58:51<20:13:55,  2.33it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33426/203307 [3:58:51<20:13:55,  2.33it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33427/203307 [3:58:55<20:14:16,  2.33it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33427/203307 [3:58:55<20:14:16,  2.33it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33428/203307 [3:58:59<20:14:32,  2.33it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33428/203307 [3:58:59<20:14:32,  2.33it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33429/203307 [3:59:03<20:14:51,  2.33it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33429/203307 [3:59:03<20:14:51,  2.33it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33430/203307 [3:59:07<20:15:08,  2.33it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33430/203307 [3:59:07<20:15:08,  2.33it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33431/203307 [3:59:11<20:15:24,  2.33it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33431/203307 [3:59:11<20:15:24,  2.33it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33432/203307 [3:59:15<20:15:44,  2.33it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33432/203307 [3:59:15<20:15:44,  2.33it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33433/203307 [3:59:19<20:16:00,  2.33it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33433/203307 [3:59:19<20:16:00,  2.33it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33434/203307 [3:59:23<20:16:17,  2.33it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33434/203307 [3:59:23<20:16:17,  2.33it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33435/203307 [3:59:26<20:16:33,  2.33it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33435/203307 [3:59:26<20:16:33,  2.33it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33436/203307 [3:59:31<20:16:54,  2.33it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33436/203307 [3:59:31<20:16:54,  2.33it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33437/203307 [3:59:35<20:17:10,  2.33it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33437/203307 [3:59:35<20:17:11,  2.33it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33438/203307 [3:59:39<20:17:30,  2.33it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33438/203307 [3:59:39<20:17:30,  2.33it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33439/203307 [3:59:43<20:17:47,  2.32it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33439/203307 [3:59:43<20:17:47,  2.32it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33440/203307 [3:59:47<20:18:06,  2.32it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33440/203307 [3:59:47<20:18:06,  2.32it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33441/203307 [3:59:52<20:18:25,  2.32it/s, v_num=line, training/loss=0.0822]Epoch 0:  16%|█▋        | 33441/203307 [3:59:52<20:18:25,  2.32it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33442/203307 [3:59:55<20:18:42,  2.32it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33442/203307 [3:59:55<20:18:42,  2.32it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33443/203307 [3:59:59<20:18:57,  2.32it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33443/203307 [3:59:59<20:18:58,  2.32it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33444/203307 [4:00:03<20:19:14,  2.32it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33444/203307 [4:00:03<20:19:14,  2.32it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33445/203307 [4:00:07<20:19:34,  2.32it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33445/203307 [4:00:07<20:19:34,  2.32it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33446/203307 [4:00:12<20:19:54,  2.32it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33446/203307 [4:00:12<20:19:54,  2.32it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33447/203307 [4:00:15<20:20:10,  2.32it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33447/203307 [4:00:15<20:20:10,  2.32it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33448/203307 [4:00:20<20:20:29,  2.32it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33448/203307 [4:00:20<20:20:29,  2.32it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33449/203307 [4:00:23<20:20:45,  2.32it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33449/203307 [4:00:23<20:20:45,  2.32it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33450/203307 [4:00:28<20:21:04,  2.32it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33450/203307 [4:00:28<20:21:04,  2.32it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33451/203307 [4:00:31<20:21:21,  2.32it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33451/203307 [4:00:31<20:21:21,  2.32it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33452/203307 [4:00:35<20:21:37,  2.32it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33452/203307 [4:00:35<20:21:37,  2.32it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33453/203307 [4:00:40<20:21:57,  2.32it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33453/203307 [4:00:40<20:21:57,  2.32it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33454/203307 [4:00:44<20:22:17,  2.32it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33454/203307 [4:00:44<20:22:17,  2.32it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33455/203307 [4:00:48<20:22:33,  2.32it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33455/203307 [4:00:48<20:22:33,  2.32it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33456/203307 [4:00:51<20:22:50,  2.31it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33456/203307 [4:00:51<20:22:50,  2.31it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33457/203307 [4:00:56<20:23:09,  2.31it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33457/203307 [4:00:56<20:23:09,  2.31it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33458/203307 [4:01:00<20:23:26,  2.31it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33458/203307 [4:01:00<20:23:26,  2.31it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33459/203307 [4:01:04<20:23:45,  2.31it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33459/203307 [4:01:04<20:23:45,  2.31it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33460/203307 [4:01:08<20:24:01,  2.31it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33460/203307 [4:01:08<20:24:01,  2.31it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33461/203307 [4:01:11<20:24:18,  2.31it/s, v_num=line, training/loss=0.0785]Epoch 0:  16%|█▋        | 33461/203307 [4:01:11<20:24:18,  2.31it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33462/203307 [4:01:16<20:24:38,  2.31it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33462/203307 [4:01:16<20:24:38,  2.31it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33463/203307 [4:01:20<20:24:57,  2.31it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33463/203307 [4:01:20<20:24:57,  2.31it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33464/203307 [4:01:24<20:25:14,  2.31it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33464/203307 [4:01:24<20:25:14,  2.31it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33465/203307 [4:01:28<20:25:33,  2.31it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33465/203307 [4:01:28<20:25:33,  2.31it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33466/203307 [4:01:32<20:25:49,  2.31it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33466/203307 [4:01:32<20:25:50,  2.31it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33467/203307 [4:01:36<20:26:06,  2.31it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33467/203307 [4:01:36<20:26:06,  2.31it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33468/203307 [4:01:40<20:26:25,  2.31it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33468/203307 [4:01:40<20:26:25,  2.31it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33469/203307 [4:01:44<20:26:41,  2.31it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33469/203307 [4:01:44<20:26:41,  2.31it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33470/203307 [4:01:48<20:26:58,  2.31it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33470/203307 [4:01:48<20:26:58,  2.31it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33471/203307 [4:01:52<20:27:18,  2.31it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33471/203307 [4:01:52<20:27:18,  2.31it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33472/203307 [4:01:56<20:27:34,  2.31it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33472/203307 [4:01:56<20:27:34,  2.31it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33473/203307 [4:02:00<20:27:54,  2.31it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33473/203307 [4:02:00<20:27:54,  2.31it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33474/203307 [4:02:04<20:28:10,  2.30it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33474/203307 [4:02:04<20:28:11,  2.30it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33475/203307 [4:02:08<20:28:27,  2.30it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33475/203307 [4:02:08<20:28:27,  2.30it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33476/203307 [4:02:11<20:28:43,  2.30it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33476/203307 [4:02:11<20:28:43,  2.30it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33477/203307 [4:02:16<20:29:03,  2.30it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33477/203307 [4:02:16<20:29:03,  2.30it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33478/203307 [4:02:20<20:29:19,  2.30it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33478/203307 [4:02:20<20:29:19,  2.30it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33479/203307 [4:02:24<20:29:39,  2.30it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33479/203307 [4:02:24<20:29:39,  2.30it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33480/203307 [4:02:28<20:29:55,  2.30it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33480/203307 [4:02:28<20:29:55,  2.30it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33481/203307 [4:02:31<20:30:11,  2.30it/s, v_num=line, training/loss=0.0794]Epoch 0:  16%|█▋        | 33481/203307 [4:02:31<20:30:11,  2.30it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33482/203307 [4:02:36<20:30:30,  2.30it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33482/203307 [4:02:36<20:30:31,  2.30it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33483/203307 [4:02:40<20:30:47,  2.30it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33483/203307 [4:02:40<20:30:47,  2.30it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33484/203307 [4:02:43<20:31:04,  2.30it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33484/203307 [4:02:43<20:31:04,  2.30it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33485/203307 [4:02:47<20:31:20,  2.30it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33485/203307 [4:02:47<20:31:20,  2.30it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33486/203307 [4:02:51<20:31:39,  2.30it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33486/203307 [4:02:51<20:31:39,  2.30it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33487/203307 [4:02:55<20:31:55,  2.30it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33487/203307 [4:02:55<20:31:55,  2.30it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33488/203307 [4:02:59<20:32:15,  2.30it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33488/203307 [4:02:59<20:32:15,  2.30it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33489/203307 [4:03:03<20:32:31,  2.30it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33489/203307 [4:03:03<20:32:31,  2.30it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33490/203307 [4:03:07<20:32:50,  2.30it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33490/203307 [4:03:07<20:32:50,  2.30it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33491/203307 [4:03:11<20:33:07,  2.30it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33491/203307 [4:03:11<20:33:07,  2.30it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33492/203307 [4:03:15<20:33:23,  2.29it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33492/203307 [4:03:15<20:33:23,  2.29it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33493/203307 [4:03:19<20:33:39,  2.29it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33493/203307 [4:03:19<20:33:39,  2.29it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33494/203307 [4:03:23<20:33:57,  2.29it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33494/203307 [4:03:23<20:33:57,  2.29it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33495/203307 [4:03:27<20:34:16,  2.29it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33495/203307 [4:03:27<20:34:16,  2.29it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33496/203307 [4:03:31<20:34:35,  2.29it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33496/203307 [4:03:31<20:34:35,  2.29it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33497/203307 [4:03:36<20:34:55,  2.29it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33497/203307 [4:03:36<20:34:55,  2.29it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33498/203307 [4:03:40<20:35:14,  2.29it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33498/203307 [4:03:40<20:35:14,  2.29it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33499/203307 [4:03:44<20:35:30,  2.29it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33499/203307 [4:03:44<20:35:31,  2.29it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33500/203307 [4:03:48<20:35:47,  2.29it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33500/203307 [4:03:48<20:35:47,  2.29it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33501/203307 [4:03:51<20:36:03,  2.29it/s, v_num=line, training/loss=0.0815]Epoch 0:  16%|█▋        | 33501/203307 [4:03:51<20:36:03,  2.29it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33502/203307 [4:03:55<20:36:20,  2.29it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33502/203307 [4:03:55<20:36:20,  2.29it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33503/203307 [4:03:59<20:36:36,  2.29it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33503/203307 [4:03:59<20:36:36,  2.29it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33504/203307 [4:04:03<20:36:56,  2.29it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33504/203307 [4:04:03<20:36:56,  2.29it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33505/203307 [4:04:08<20:37:16,  2.29it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33505/203307 [4:04:08<20:37:16,  2.29it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33506/203307 [4:04:12<20:37:33,  2.29it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33506/203307 [4:04:12<20:37:33,  2.29it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33507/203307 [4:04:16<20:37:52,  2.29it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33507/203307 [4:04:16<20:37:52,  2.29it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33508/203307 [4:04:20<20:38:09,  2.29it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33508/203307 [4:04:20<20:38:09,  2.29it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33509/203307 [4:04:23<20:38:25,  2.29it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33509/203307 [4:04:23<20:38:25,  2.29it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33510/203307 [4:04:27<20:38:42,  2.28it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33510/203307 [4:04:27<20:38:42,  2.28it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33511/203307 [4:04:31<20:38:58,  2.28it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33511/203307 [4:04:31<20:38:58,  2.28it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33512/203307 [4:04:35<20:39:14,  2.28it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33512/203307 [4:04:35<20:39:14,  2.28it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33513/203307 [4:04:39<20:39:34,  2.28it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33513/203307 [4:04:39<20:39:34,  2.28it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33514/203307 [4:04:44<20:39:55,  2.28it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33514/203307 [4:04:44<20:39:55,  2.28it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33515/203307 [4:04:48<20:40:14,  2.28it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33515/203307 [4:04:48<20:40:14,  2.28it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33516/203307 [4:04:52<20:40:31,  2.28it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33516/203307 [4:04:52<20:40:31,  2.28it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33517/203307 [4:04:56<20:40:48,  2.28it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33517/203307 [4:04:56<20:40:48,  2.28it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33518/203307 [4:05:00<20:41:04,  2.28it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33518/203307 [4:05:00<20:41:04,  2.28it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33519/203307 [4:05:03<20:41:21,  2.28it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33519/203307 [4:05:03<20:41:21,  2.28it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33520/203307 [4:05:07<20:41:38,  2.28it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33520/203307 [4:05:07<20:41:38,  2.28it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33521/203307 [4:05:12<20:41:57,  2.28it/s, v_num=line, training/loss=0.0869]Epoch 0:  16%|█▋        | 33521/203307 [4:05:12<20:41:58,  2.28it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33522/203307 [4:05:16<20:42:17,  2.28it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33522/203307 [4:05:16<20:42:17,  2.28it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33523/203307 [4:05:21<20:42:37,  2.28it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33523/203307 [4:05:21<20:42:37,  2.28it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33524/203307 [4:05:24<20:42:54,  2.28it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33524/203307 [4:05:24<20:42:54,  2.28it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33525/203307 [4:05:28<20:43:11,  2.28it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33525/203307 [4:05:28<20:43:11,  2.28it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33526/203307 [4:05:32<20:43:28,  2.28it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33526/203307 [4:05:32<20:43:28,  2.28it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33527/203307 [4:05:36<20:43:45,  2.28it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33527/203307 [4:05:36<20:43:45,  2.28it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33528/203307 [4:05:40<20:44:01,  2.27it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33528/203307 [4:05:40<20:44:01,  2.27it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33529/203307 [4:05:44<20:44:21,  2.27it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33529/203307 [4:05:44<20:44:21,  2.27it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33530/203307 [4:05:48<20:44:38,  2.27it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33530/203307 [4:05:48<20:44:38,  2.27it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33531/203307 [4:05:53<20:44:58,  2.27it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33531/203307 [4:05:53<20:44:58,  2.27it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33532/203307 [4:05:57<20:45:18,  2.27it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33532/203307 [4:05:57<20:45:18,  2.27it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33533/203307 [4:06:01<20:45:34,  2.27it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33533/203307 [4:06:01<20:45:34,  2.27it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33534/203307 [4:06:05<20:45:51,  2.27it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33534/203307 [4:06:05<20:45:51,  2.27it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33535/203307 [4:06:08<20:46:07,  2.27it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33535/203307 [4:06:08<20:46:07,  2.27it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33536/203307 [4:06:12<20:46:24,  2.27it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33536/203307 [4:06:12<20:46:24,  2.27it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33537/203307 [4:06:16<20:46:41,  2.27it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33537/203307 [4:06:16<20:46:41,  2.27it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33538/203307 [4:06:20<20:47:00,  2.27it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33538/203307 [4:06:20<20:47:00,  2.27it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33539/203307 [4:06:24<20:47:16,  2.27it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33539/203307 [4:06:24<20:47:16,  2.27it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33540/203307 [4:06:29<20:47:36,  2.27it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33540/203307 [4:06:29<20:47:36,  2.27it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33541/203307 [4:06:32<20:47:53,  2.27it/s, v_num=line, training/loss=0.0832]Epoch 0:  16%|█▋        | 33541/203307 [4:06:32<20:47:53,  2.27it/s, v_num=line, training/loss=0.0787]Epoch 0:  16%|█▋        | 33542/203307 [4:06:36<20:48:09,  2.27it/s, v_num=line, training/loss=0.0787]Epoch 0:  16%|█▋        | 33542/203307 [4:06:36<20:48:09,  2.27it/s, v_num=line, training/loss=0.0787]Epoch 0:  16%|█▋        | 33543/203307 [4:06:40<20:48:25,  2.27it/s, v_num=line, training/loss=0.0787]Epoch 0:  16%|█▋        | 33543/203307 [4:06:40<20:48:25,  2.27it/s, v_num=line, training/loss=0.0787]Epoch 0:  16%|█▋        | 33544/203307 [4:06:44<20:48:42,  2.27it/s, v_num=line, training/loss=0.0787]Epoch 0:  16%|█▋        | 33544/203307 [4:06:44<20:48:42,  2.27it/s, v_num=line, training/loss=0.0787]Epoch 0:  16%|█▋        | 33545/203307 [4:06:47<20:48:58,  2.27it/s, v_num=line, training/loss=0.0787]Epoch 0:  16%|█▋        | 33545/203307 [4:06:47<20:48:58,  2.27it/s, v_num=line, training/loss=0.0787]Epoch 0:  17%|█▋        | 33546/203307 [4:06:52<20:49:17,  2.26it/s, v_num=line, training/loss=0.0787]Epoch 0:  17%|█▋        | 33546/203307 [4:06:52<20:49:17,  2.26it/s, v_num=line, training/loss=0.0787]Epoch 0:  17%|█▋        | 33547/203307 [4:06:55<20:49:33,  2.26it/s, v_num=line, training/loss=0.0787]Epoch 0:  17%|█▋        | 33547/203307 [4:06:55<20:49:33,  2.26it/s, v_num=line, training/loss=0.0787]Epoch 0:  17%|█▋        | 33548/203307 [4:07:00<20:49:53,  2.26it/s, v_num=line, training/loss=0.0787]Epoch 0:  17%|█▋        | 33548/203307 [4:07:00<20:49:54,  2.26it/s, v_num=line, training/loss=0.0787]Epoch 0:  17%|█▋        | 33549/203307 [4:07:04<20:50:14,  2.26it/s, v_num=line, training/loss=0.0787]Epoch 0:  17%|█▋        | 33549/203307 [4:07:04<20:50:14,  2.26it/s, v_num=line, training/loss=0.0787]Epoch 0:  17%|█▋        | 33550/203307 [4:07:08<20:50:30,  2.26it/s, v_num=line, training/loss=0.0787]Epoch 0:  17%|█▋        | 33550/203307 [4:07:08<20:50:30,  2.26it/s, v_num=line, training/loss=0.0787]Epoch 0:  17%|█▋        | 33551/203307 [4:07:12<20:50:46,  2.26it/s, v_num=line, training/loss=0.0787]Epoch 0:  17%|█▋        | 33551/203307 [4:07:12<20:50:46,  2.26it/s, v_num=line, training/loss=0.0787]Epoch 0:  17%|█▋        | 33552/203307 [4:07:16<20:51:03,  2.26it/s, v_num=line, training/loss=0.0787]Epoch 0:  17%|█▋        | 33552/203307 [4:07:16<20:51:03,  2.26it/s, v_num=line, training/loss=0.0787]Epoch 0:  17%|█▋        | 33553/203307 [4:07:20<20:51:20,  2.26it/s, v_num=line, training/loss=0.0787]Epoch 0:  17%|█▋        | 33553/203307 [4:07:20<20:51:20,  2.26it/s, v_num=line, training/loss=0.0787]Epoch 0:  17%|█▋        | 33554/203307 [4:07:24<20:51:39,  2.26it/s, v_num=line, training/loss=0.0787]Epoch 0:  17%|█▋        | 33554/203307 [4:07:24<20:51:39,  2.26it/s, v_num=line, training/loss=0.0787]Epoch 0:  17%|█▋        | 33555/203307 [4:07:28<20:51:56,  2.26it/s, v_num=line, training/loss=0.0787]Epoch 0:  17%|█▋        | 33555/203307 [4:07:28<20:51:56,  2.26it/s, v_num=line, training/loss=0.0787]Epoch 0:  17%|█▋        | 33556/203307 [4:07:32<20:52:13,  2.26it/s, v_num=line, training/loss=0.0787]Epoch 0:  17%|█▋        | 33556/203307 [4:07:32<20:52:13,  2.26it/s, v_num=line, training/loss=0.0787]Epoch 0:  17%|█▋        | 33557/203307 [4:07:36<20:52:33,  2.26it/s, v_num=line, training/loss=0.0787]Epoch 0:  17%|█▋        | 33557/203307 [4:07:36<20:52:33,  2.26it/s, v_num=line, training/loss=0.0787]Epoch 0:  17%|█▋        | 33558/203307 [4:07:40<20:52:52,  2.26it/s, v_num=line, training/loss=0.0787]Epoch 0:  17%|█▋        | 33558/203307 [4:07:41<20:52:52,  2.26it/s, v_num=line, training/loss=0.0787]Epoch 0:  17%|█▋        | 33559/203307 [4:07:44<20:53:08,  2.26it/s, v_num=line, training/loss=0.0787]Epoch 0:  17%|█▋        | 33559/203307 [4:07:44<20:53:08,  2.26it/s, v_num=line, training/loss=0.0787]Epoch 0:  17%|█▋        | 33560/203307 [4:07:48<20:53:24,  2.26it/s, v_num=line, training/loss=0.0787]Epoch 0:  17%|█▋        | 33560/203307 [4:07:48<20:53:24,  2.26it/s, v_num=line, training/loss=0.0787]Epoch 0:  17%|█▋        | 33561/203307 [4:07:52<20:53:41,  2.26it/s, v_num=line, training/loss=0.0787]Epoch 0:  17%|█▋        | 33561/203307 [4:07:52<20:53:41,  2.26it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33562/203307 [4:07:56<20:53:57,  2.26it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33562/203307 [4:07:56<20:53:57,  2.26it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33563/203307 [4:08:00<20:54:17,  2.26it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33563/203307 [4:08:00<20:54:17,  2.26it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33564/203307 [4:08:04<20:54:33,  2.26it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33564/203307 [4:08:04<20:54:33,  2.26it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33565/203307 [4:08:08<20:54:52,  2.25it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33565/203307 [4:08:08<20:54:53,  2.25it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33566/203307 [4:08:12<20:55:12,  2.25it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33566/203307 [4:08:12<20:55:12,  2.25it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33567/203307 [4:08:17<20:55:31,  2.25it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33567/203307 [4:08:17<20:55:31,  2.25it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33568/203307 [4:08:21<20:55:48,  2.25it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33568/203307 [4:08:21<20:55:48,  2.25it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33569/203307 [4:08:24<20:56:04,  2.25it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33569/203307 [4:08:24<20:56:04,  2.25it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33570/203307 [4:08:28<20:56:21,  2.25it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33570/203307 [4:08:28<20:56:21,  2.25it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33571/203307 [4:08:33<20:56:40,  2.25it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33571/203307 [4:08:33<20:56:40,  2.25it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33572/203307 [4:08:36<20:56:57,  2.25it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33572/203307 [4:08:36<20:56:57,  2.25it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33573/203307 [4:08:41<20:57:16,  2.25it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33573/203307 [4:08:41<20:57:16,  2.25it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33574/203307 [4:08:45<20:57:33,  2.25it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33574/203307 [4:08:45<20:57:33,  2.25it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33575/203307 [4:08:49<20:57:53,  2.25it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33575/203307 [4:08:49<20:57:53,  2.25it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33576/203307 [4:08:53<20:58:12,  2.25it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33576/203307 [4:08:53<20:58:12,  2.25it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33577/203307 [4:08:57<20:58:29,  2.25it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33577/203307 [4:08:57<20:58:29,  2.25it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33578/203307 [4:09:01<20:58:45,  2.25it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33578/203307 [4:09:01<20:58:45,  2.25it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33579/203307 [4:09:05<20:59:05,  2.25it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33579/203307 [4:09:05<20:59:05,  2.25it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33580/203307 [4:09:09<20:59:21,  2.25it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33580/203307 [4:09:09<20:59:21,  2.25it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33581/203307 [4:09:13<20:59:38,  2.25it/s, v_num=line, training/loss=0.0805]Epoch 0:  17%|█▋        | 33581/203307 [4:09:13<20:59:38,  2.25it/s, v_num=line, training/loss=0.079] Epoch 0:  17%|█▋        | 33582/203307 [4:09:17<20:59:57,  2.25it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33582/203307 [4:09:17<20:59:58,  2.25it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33583/203307 [4:09:22<21:00:17,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33583/203307 [4:09:22<21:00:17,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33584/203307 [4:09:26<21:00:34,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33584/203307 [4:09:26<21:00:34,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33585/203307 [4:09:30<21:00:53,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33585/203307 [4:09:30<21:00:53,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33586/203307 [4:09:34<21:01:09,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33586/203307 [4:09:34<21:01:09,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33587/203307 [4:09:38<21:01:26,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33587/203307 [4:09:38<21:01:26,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33588/203307 [4:09:42<21:01:45,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33588/203307 [4:09:42<21:01:45,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33589/203307 [4:09:46<21:02:02,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33589/203307 [4:09:46<21:02:02,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33590/203307 [4:09:50<21:02:21,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33590/203307 [4:09:50<21:02:21,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33591/203307 [4:09:54<21:02:37,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33591/203307 [4:09:54<21:02:37,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33592/203307 [4:09:58<21:02:57,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33592/203307 [4:09:58<21:02:57,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33593/203307 [4:10:02<21:03:14,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33593/203307 [4:10:02<21:03:14,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33594/203307 [4:10:06<21:03:33,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33594/203307 [4:10:06<21:03:33,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33595/203307 [4:10:10<21:03:49,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33595/203307 [4:10:10<21:03:49,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33596/203307 [4:10:14<21:04:08,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33596/203307 [4:10:14<21:04:08,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33597/203307 [4:10:18<21:04:24,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33597/203307 [4:10:18<21:04:24,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33598/203307 [4:10:23<21:04:43,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33598/203307 [4:10:23<21:04:43,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33599/203307 [4:10:26<21:05:00,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33599/203307 [4:10:26<21:05:00,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33600/203307 [4:10:30<21:05:16,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33600/203307 [4:10:30<21:05:16,  2.24it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33601/203307 [4:10:35<21:05:36,  2.23it/s, v_num=line, training/loss=0.079]Epoch 0:  17%|█▋        | 33601/203307 [4:10:35<21:05:36,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33602/203307 [4:10:38<21:05:52,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33602/203307 [4:10:38<21:05:52,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33603/203307 [4:10:43<21:06:11,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33603/203307 [4:10:43<21:06:11,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33604/203307 [4:10:47<21:06:31,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33604/203307 [4:10:47<21:06:31,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33605/203307 [4:10:51<21:06:47,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33605/203307 [4:10:51<21:06:47,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33606/203307 [4:10:54<21:07:03,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33606/203307 [4:10:54<21:07:03,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33607/203307 [4:10:59<21:07:22,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33607/203307 [4:10:59<21:07:22,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33608/203307 [4:11:03<21:07:38,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33608/203307 [4:11:03<21:07:38,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33609/203307 [4:11:07<21:07:58,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33609/203307 [4:11:07<21:07:58,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33610/203307 [4:11:11<21:08:15,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33610/203307 [4:11:11<21:08:15,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33611/203307 [4:11:15<21:08:31,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33611/203307 [4:11:15<21:08:31,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33612/203307 [4:11:19<21:08:50,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33612/203307 [4:11:19<21:08:50,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33613/203307 [4:11:23<21:09:10,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33613/203307 [4:11:23<21:09:10,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33614/203307 [4:11:27<21:09:26,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33614/203307 [4:11:27<21:09:26,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33615/203307 [4:11:31<21:09:45,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33615/203307 [4:11:31<21:09:45,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33616/203307 [4:11:35<21:10:01,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33616/203307 [4:11:35<21:10:02,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33617/203307 [4:11:39<21:10:18,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33617/203307 [4:11:39<21:10:18,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33618/203307 [4:11:43<21:10:38,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33618/203307 [4:11:43<21:10:38,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33619/203307 [4:11:47<21:10:54,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33619/203307 [4:11:47<21:10:54,  2.23it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33620/203307 [4:11:51<21:11:10,  2.22it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33620/203307 [4:11:51<21:11:10,  2.22it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33621/203307 [4:11:55<21:11:29,  2.22it/s, v_num=line, training/loss=0.0893]Epoch 0:  17%|█▋        | 33621/203307 [4:11:55<21:11:29,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33622/203307 [4:11:59<21:11:46,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33622/203307 [4:11:59<21:11:46,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33623/203307 [4:12:03<21:12:05,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33623/203307 [4:12:03<21:12:05,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33624/203307 [4:12:07<21:12:21,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33624/203307 [4:12:07<21:12:21,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33625/203307 [4:12:11<21:12:37,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33625/203307 [4:12:11<21:12:37,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33626/203307 [4:12:15<21:12:53,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33626/203307 [4:12:15<21:12:53,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33627/203307 [4:12:19<21:13:13,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33627/203307 [4:12:19<21:13:13,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33628/203307 [4:12:23<21:13:29,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33628/203307 [4:12:23<21:13:29,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33629/203307 [4:12:27<21:13:48,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33629/203307 [4:12:27<21:13:48,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33630/203307 [4:12:31<21:14:07,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33630/203307 [4:12:31<21:14:07,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33631/203307 [4:12:35<21:14:23,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33631/203307 [4:12:35<21:14:23,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33632/203307 [4:12:39<21:14:42,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33632/203307 [4:12:39<21:14:42,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33633/203307 [4:12:43<21:14:58,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33633/203307 [4:12:43<21:14:58,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33634/203307 [4:12:47<21:15:15,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33634/203307 [4:12:47<21:15:15,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33635/203307 [4:12:51<21:15:34,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33635/203307 [4:12:51<21:15:34,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33636/203307 [4:12:55<21:15:50,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33636/203307 [4:12:55<21:15:50,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33637/203307 [4:12:59<21:16:06,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33637/203307 [4:12:59<21:16:06,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33638/203307 [4:13:03<21:16:25,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33638/203307 [4:13:03<21:16:26,  2.22it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33639/203307 [4:13:07<21:16:44,  2.21it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33639/203307 [4:13:07<21:16:44,  2.21it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33640/203307 [4:13:12<21:17:03,  2.21it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33640/203307 [4:13:12<21:17:03,  2.21it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33641/203307 [4:13:15<21:17:19,  2.21it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 33641/203307 [4:13:16<21:17:19,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33642/203307 [4:13:19<21:17:36,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33642/203307 [4:13:19<21:17:36,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33643/203307 [4:13:23<21:17:52,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33643/203307 [4:13:23<21:17:52,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33644/203307 [4:13:28<21:18:12,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33644/203307 [4:13:28<21:18:13,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33645/203307 [4:13:31<21:18:29,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33645/203307 [4:13:31<21:18:29,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33646/203307 [4:13:36<21:18:48,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33646/203307 [4:13:36<21:18:48,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33647/203307 [4:13:40<21:19:04,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33647/203307 [4:13:40<21:19:04,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33648/203307 [4:13:44<21:19:24,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33648/203307 [4:13:44<21:19:24,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33649/203307 [4:13:48<21:19:40,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33649/203307 [4:13:48<21:19:40,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33650/203307 [4:13:52<21:19:56,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33650/203307 [4:13:52<21:19:57,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33651/203307 [4:13:55<21:20:12,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33651/203307 [4:13:55<21:20:12,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33652/203307 [4:13:59<21:20:29,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33652/203307 [4:13:59<21:20:29,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33653/203307 [4:14:04<21:20:49,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33653/203307 [4:14:04<21:20:49,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33654/203307 [4:14:08<21:21:08,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33654/203307 [4:14:08<21:21:09,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33655/203307 [4:14:12<21:21:25,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33655/203307 [4:14:12<21:21:25,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33656/203307 [4:14:16<21:21:41,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33656/203307 [4:14:16<21:21:41,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33657/203307 [4:14:20<21:22:01,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33657/203307 [4:14:20<21:22:01,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33658/203307 [4:14:24<21:22:17,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33658/203307 [4:14:24<21:22:17,  2.21it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33659/203307 [4:14:28<21:22:33,  2.20it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33659/203307 [4:14:28<21:22:33,  2.20it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33660/203307 [4:14:31<21:22:50,  2.20it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33660/203307 [4:14:31<21:22:50,  2.20it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33661/203307 [4:14:36<21:23:10,  2.20it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33661/203307 [4:14:36<21:23:10,  2.20it/s, v_num=line, training/loss=0.077] Epoch 0:  17%|█▋        | 33662/203307 [4:14:40<21:23:26,  2.20it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33662/203307 [4:14:40<21:23:26,  2.20it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33663/203307 [4:14:44<21:23:46,  2.20it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33663/203307 [4:14:44<21:23:46,  2.20it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33664/203307 [4:14:48<21:24:02,  2.20it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33664/203307 [4:14:48<21:24:02,  2.20it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33665/203307 [4:14:52<21:24:21,  2.20it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33665/203307 [4:14:52<21:24:21,  2.20it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33666/203307 [4:14:56<21:24:40,  2.20it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33666/203307 [4:14:56<21:24:40,  2.20it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33667/203307 [4:15:00<21:24:56,  2.20it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33667/203307 [4:15:00<21:24:56,  2.20it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33668/203307 [4:15:04<21:25:12,  2.20it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33668/203307 [4:15:04<21:25:12,  2.20it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33669/203307 [4:15:08<21:25:28,  2.20it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33669/203307 [4:15:08<21:25:28,  2.20it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33670/203307 [4:15:12<21:25:49,  2.20it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33670/203307 [4:15:12<21:25:49,  2.20it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33671/203307 [4:15:17<21:26:08,  2.20it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33671/203307 [4:15:17<21:26:08,  2.20it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33672/203307 [4:15:20<21:26:24,  2.20it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33672/203307 [4:15:20<21:26:24,  2.20it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33673/203307 [4:15:25<21:26:43,  2.20it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33673/203307 [4:15:25<21:26:43,  2.20it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33674/203307 [4:15:29<21:26:59,  2.20it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33674/203307 [4:15:29<21:27:00,  2.20it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33675/203307 [4:15:33<21:27:18,  2.20it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33675/203307 [4:15:33<21:27:18,  2.20it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33676/203307 [4:15:37<21:27:34,  2.20it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33676/203307 [4:15:37<21:27:35,  2.20it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33677/203307 [4:15:40<21:27:51,  2.20it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33677/203307 [4:15:40<21:27:51,  2.20it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33678/203307 [4:15:44<21:28:07,  2.19it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33678/203307 [4:15:44<21:28:07,  2.19it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33679/203307 [4:15:49<21:28:27,  2.19it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33679/203307 [4:15:49<21:28:27,  2.19it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33680/203307 [4:15:52<21:28:43,  2.19it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33680/203307 [4:15:52<21:28:43,  2.19it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33681/203307 [4:15:56<21:28:59,  2.19it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 33681/203307 [4:15:56<21:28:59,  2.19it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33682/203307 [4:16:00<21:29:18,  2.19it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33682/203307 [4:16:00<21:29:18,  2.19it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33683/203307 [4:16:04<21:29:34,  2.19it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33683/203307 [4:16:04<21:29:34,  2.19it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33684/203307 [4:16:08<21:29:53,  2.19it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33684/203307 [4:16:08<21:29:53,  2.19it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33685/203307 [4:16:12<21:30:09,  2.19it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33685/203307 [4:16:12<21:30:09,  2.19it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33686/203307 [4:16:16<21:30:25,  2.19it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33686/203307 [4:16:16<21:30:25,  2.19it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33687/203307 [4:16:20<21:30:45,  2.19it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33687/203307 [4:16:20<21:30:45,  2.19it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33688/203307 [4:16:25<21:31:04,  2.19it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33688/203307 [4:16:25<21:31:04,  2.19it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33689/203307 [4:16:28<21:31:20,  2.19it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33689/203307 [4:16:28<21:31:20,  2.19it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33690/203307 [4:16:33<21:31:39,  2.19it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33690/203307 [4:16:33<21:31:39,  2.19it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33691/203307 [4:16:36<21:31:54,  2.19it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33691/203307 [4:16:36<21:31:54,  2.19it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33692/203307 [4:16:40<21:32:11,  2.19it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33692/203307 [4:16:40<21:32:11,  2.19it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33693/203307 [4:16:45<21:32:30,  2.19it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33693/203307 [4:16:45<21:32:30,  2.19it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33694/203307 [4:16:48<21:32:47,  2.19it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33694/203307 [4:16:48<21:32:47,  2.19it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33695/203307 [4:16:52<21:33:03,  2.19it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33695/203307 [4:16:52<21:33:03,  2.19it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33696/203307 [4:16:57<21:33:23,  2.19it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33696/203307 [4:16:57<21:33:23,  2.19it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33697/203307 [4:17:00<21:33:39,  2.19it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33697/203307 [4:17:00<21:33:39,  2.19it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33698/203307 [4:17:05<21:33:58,  2.18it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33698/203307 [4:17:05<21:33:58,  2.18it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33699/203307 [4:17:09<21:34:14,  2.18it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33699/203307 [4:17:09<21:34:15,  2.18it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33700/203307 [4:17:12<21:34:31,  2.18it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33700/203307 [4:17:12<21:34:31,  2.18it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33701/203307 [4:17:16<21:34:47,  2.18it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 33701/203307 [4:17:16<21:34:47,  2.18it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33702/203307 [4:17:20<21:35:06,  2.18it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33702/203307 [4:17:20<21:35:06,  2.18it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33703/203307 [4:17:24<21:35:22,  2.18it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33703/203307 [4:17:24<21:35:22,  2.18it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33704/203307 [4:17:29<21:35:42,  2.18it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33704/203307 [4:17:29<21:35:42,  2.18it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33705/203307 [4:17:33<21:36:01,  2.18it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33705/203307 [4:17:33<21:36:01,  2.18it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33706/203307 [4:17:37<21:36:18,  2.18it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33706/203307 [4:17:37<21:36:18,  2.18it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33707/203307 [4:17:41<21:36:37,  2.18it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33707/203307 [4:17:41<21:36:37,  2.18it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33708/203307 [4:17:45<21:36:53,  2.18it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33708/203307 [4:17:45<21:36:53,  2.18it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33709/203307 [4:17:49<21:37:09,  2.18it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33709/203307 [4:17:49<21:37:09,  2.18it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33710/203307 [4:17:52<21:37:25,  2.18it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33710/203307 [4:17:52<21:37:25,  2.18it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33711/203307 [4:17:57<21:37:44,  2.18it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33711/203307 [4:17:57<21:37:44,  2.18it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33712/203307 [4:18:01<21:38:00,  2.18it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33712/203307 [4:18:01<21:38:00,  2.18it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33713/203307 [4:18:05<21:38:19,  2.18it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33713/203307 [4:18:05<21:38:20,  2.18it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33714/203307 [4:18:09<21:38:35,  2.18it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33714/203307 [4:18:09<21:38:35,  2.18it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33715/203307 [4:18:13<21:38:54,  2.18it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33715/203307 [4:18:13<21:38:54,  2.18it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33716/203307 [4:18:17<21:39:10,  2.18it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33716/203307 [4:18:17<21:39:10,  2.18it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33717/203307 [4:18:20<21:39:26,  2.18it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33717/203307 [4:18:20<21:39:26,  2.18it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33718/203307 [4:18:24<21:39:42,  2.17it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33718/203307 [4:18:24<21:39:42,  2.17it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33719/203307 [4:18:28<21:39:58,  2.17it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33719/203307 [4:18:28<21:39:58,  2.17it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33720/203307 [4:18:32<21:40:17,  2.17it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33720/203307 [4:18:32<21:40:17,  2.17it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33721/203307 [4:18:37<21:40:36,  2.17it/s, v_num=line, training/loss=0.075]Epoch 0:  17%|█▋        | 33721/203307 [4:18:37<21:40:36,  2.17it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33722/203307 [4:18:41<21:40:56,  2.17it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33722/203307 [4:18:41<21:40:56,  2.17it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33723/203307 [4:18:45<21:41:15,  2.17it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33723/203307 [4:18:45<21:41:15,  2.17it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33724/203307 [4:18:49<21:41:31,  2.17it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33724/203307 [4:18:49<21:41:31,  2.17it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33725/203307 [4:18:53<21:41:47,  2.17it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33725/203307 [4:18:53<21:41:47,  2.17it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33726/203307 [4:18:57<21:42:04,  2.17it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33726/203307 [4:18:57<21:42:04,  2.17it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33727/203307 [4:19:01<21:42:20,  2.17it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33727/203307 [4:19:01<21:42:20,  2.17it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33728/203307 [4:19:04<21:42:37,  2.17it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33728/203307 [4:19:04<21:42:37,  2.17it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33729/203307 [4:19:09<21:42:56,  2.17it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33729/203307 [4:19:09<21:42:56,  2.17it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33730/203307 [4:19:13<21:43:12,  2.17it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33730/203307 [4:19:13<21:43:12,  2.17it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33731/203307 [4:19:17<21:43:32,  2.17it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33731/203307 [4:19:17<21:43:32,  2.17it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33732/203307 [4:19:21<21:43:51,  2.17it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33732/203307 [4:19:21<21:43:51,  2.17it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33733/203307 [4:19:25<21:44:07,  2.17it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33733/203307 [4:19:25<21:44:08,  2.17it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33734/203307 [4:19:29<21:44:23,  2.17it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33734/203307 [4:19:29<21:44:23,  2.17it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33735/203307 [4:19:33<21:44:39,  2.17it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33735/203307 [4:19:33<21:44:40,  2.17it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33736/203307 [4:19:37<21:44:56,  2.17it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33736/203307 [4:19:37<21:44:56,  2.17it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33737/203307 [4:19:40<21:45:12,  2.17it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33737/203307 [4:19:40<21:45:12,  2.17it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33738/203307 [4:19:45<21:45:32,  2.16it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33738/203307 [4:19:45<21:45:32,  2.16it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33739/203307 [4:19:49<21:45:51,  2.16it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33739/203307 [4:19:49<21:45:51,  2.16it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33740/203307 [4:19:54<21:46:11,  2.16it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33740/203307 [4:19:54<21:46:11,  2.16it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33741/203307 [4:19:57<21:46:27,  2.16it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 33741/203307 [4:19:57<21:46:27,  2.16it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33742/203307 [4:20:01<21:46:43,  2.16it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33742/203307 [4:20:01<21:46:43,  2.16it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33743/203307 [4:20:05<21:46:59,  2.16it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33743/203307 [4:20:05<21:47:00,  2.16it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33744/203307 [4:20:09<21:47:16,  2.16it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33744/203307 [4:20:09<21:47:16,  2.16it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33745/203307 [4:20:13<21:47:32,  2.16it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33745/203307 [4:20:13<21:47:32,  2.16it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33746/203307 [4:20:17<21:47:52,  2.16it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33746/203307 [4:20:17<21:47:52,  2.16it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33747/203307 [4:20:21<21:48:11,  2.16it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33747/203307 [4:20:21<21:48:11,  2.16it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33748/203307 [4:20:26<21:48:30,  2.16it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33748/203307 [4:20:26<21:48:30,  2.16it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33749/203307 [4:20:30<21:48:46,  2.16it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33749/203307 [4:20:30<21:48:46,  2.16it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33750/203307 [4:20:33<21:49:02,  2.16it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33750/203307 [4:20:33<21:49:02,  2.16it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33751/203307 [4:20:37<21:49:18,  2.16it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33751/203307 [4:20:37<21:49:19,  2.16it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33752/203307 [4:20:41<21:49:35,  2.16it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33752/203307 [4:20:41<21:49:35,  2.16it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33753/203307 [4:20:45<21:49:51,  2.16it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33753/203307 [4:20:45<21:49:51,  2.16it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33754/203307 [4:20:49<21:50:11,  2.16it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33754/203307 [4:20:49<21:50:11,  2.16it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33755/203307 [4:20:53<21:50:27,  2.16it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33755/203307 [4:20:53<21:50:27,  2.16it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33756/203307 [4:20:57<21:50:46,  2.16it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33756/203307 [4:20:57<21:50:46,  2.16it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33757/203307 [4:21:02<21:51:06,  2.16it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33757/203307 [4:21:02<21:51:06,  2.16it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33758/203307 [4:21:05<21:51:21,  2.15it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33758/203307 [4:21:05<21:51:22,  2.15it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33759/203307 [4:21:09<21:51:38,  2.15it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33759/203307 [4:21:09<21:51:38,  2.15it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33760/203307 [4:21:13<21:51:54,  2.15it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33760/203307 [4:21:13<21:51:54,  2.15it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33761/203307 [4:21:17<21:52:10,  2.15it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 33761/203307 [4:21:17<21:52:10,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33762/203307 [4:21:21<21:52:26,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33762/203307 [4:21:21<21:52:26,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33763/203307 [4:21:25<21:52:45,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33763/203307 [4:21:25<21:52:45,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33764/203307 [4:21:29<21:53:01,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33764/203307 [4:21:29<21:53:01,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33765/203307 [4:21:33<21:53:20,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33765/203307 [4:21:33<21:53:21,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33766/203307 [4:21:37<21:53:37,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33766/203307 [4:21:37<21:53:37,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33767/203307 [4:21:41<21:53:53,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33767/203307 [4:21:41<21:53:53,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33768/203307 [4:21:44<21:54:09,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33768/203307 [4:21:44<21:54:09,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33769/203307 [4:21:48<21:54:25,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33769/203307 [4:21:48<21:54:25,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33770/203307 [4:21:52<21:54:42,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33770/203307 [4:21:52<21:54:42,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33771/203307 [4:21:56<21:55:01,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33771/203307 [4:21:56<21:55:01,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33772/203307 [4:22:00<21:55:17,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33772/203307 [4:22:00<21:55:17,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33773/203307 [4:22:05<21:55:36,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33773/203307 [4:22:05<21:55:36,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33774/203307 [4:22:09<21:55:56,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33774/203307 [4:22:09<21:55:56,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33775/203307 [4:22:13<21:56:12,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33775/203307 [4:22:13<21:56:12,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33776/203307 [4:22:16<21:56:27,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33776/203307 [4:22:16<21:56:27,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33777/203307 [4:22:20<21:56:44,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33777/203307 [4:22:20<21:56:44,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33778/203307 [4:22:24<21:57:00,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33778/203307 [4:22:24<21:57:00,  2.15it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33779/203307 [4:22:28<21:57:19,  2.14it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33779/203307 [4:22:28<21:57:19,  2.14it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33780/203307 [4:22:32<21:57:35,  2.14it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33780/203307 [4:22:32<21:57:35,  2.14it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33781/203307 [4:22:36<21:57:51,  2.14it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 33781/203307 [4:22:36<21:57:51,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33782/203307 [4:22:40<21:58:10,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33782/203307 [4:22:40<21:58:10,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33783/203307 [4:22:45<21:58:30,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33783/203307 [4:22:45<21:58:30,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33784/203307 [4:22:49<21:58:47,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33784/203307 [4:22:49<21:58:47,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33785/203307 [4:22:52<21:59:03,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33785/203307 [4:22:52<21:59:03,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33786/203307 [4:22:56<21:59:19,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33786/203307 [4:22:56<21:59:19,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33787/203307 [4:23:00<21:59:36,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33787/203307 [4:23:00<21:59:36,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33788/203307 [4:23:05<21:59:55,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33788/203307 [4:23:05<21:59:55,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33789/203307 [4:23:08<22:00:11,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33789/203307 [4:23:08<22:00:11,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33790/203307 [4:23:13<22:00:30,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33790/203307 [4:23:13<22:00:30,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33791/203307 [4:23:17<22:00:50,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33791/203307 [4:23:17<22:00:50,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33792/203307 [4:23:22<22:01:09,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33792/203307 [4:23:22<22:01:09,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33793/203307 [4:23:25<22:01:25,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33793/203307 [4:23:25<22:01:26,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33794/203307 [4:23:29<22:01:42,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33794/203307 [4:23:29<22:01:42,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33795/203307 [4:23:33<22:01:58,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33795/203307 [4:23:33<22:01:58,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33796/203307 [4:23:37<22:02:17,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33796/203307 [4:23:37<22:02:17,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33797/203307 [4:23:41<22:02:33,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33797/203307 [4:23:41<22:02:33,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33798/203307 [4:23:45<22:02:52,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33798/203307 [4:23:45<22:02:52,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33799/203307 [4:23:49<22:03:08,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33799/203307 [4:23:49<22:03:08,  2.14it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33800/203307 [4:23:54<22:03:28,  2.13it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33800/203307 [4:23:54<22:03:28,  2.13it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33801/203307 [4:23:58<22:03:48,  2.13it/s, v_num=line, training/loss=0.0763]Epoch 0:  17%|█▋        | 33801/203307 [4:23:58<22:03:48,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33802/203307 [4:24:02<22:04:04,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33802/203307 [4:24:02<22:04:04,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33803/203307 [4:24:06<22:04:20,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33803/203307 [4:24:06<22:04:20,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33804/203307 [4:24:10<22:04:39,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33804/203307 [4:24:10<22:04:40,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33805/203307 [4:24:14<22:04:56,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33805/203307 [4:24:14<22:04:56,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33806/203307 [4:24:18<22:05:12,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33806/203307 [4:24:18<22:05:12,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33807/203307 [4:24:22<22:05:32,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33807/203307 [4:24:22<22:05:32,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33808/203307 [4:24:26<22:05:48,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33808/203307 [4:24:26<22:05:48,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33809/203307 [4:24:31<22:06:07,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33809/203307 [4:24:31<22:06:07,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33810/203307 [4:24:35<22:06:26,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33810/203307 [4:24:35<22:06:26,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33811/203307 [4:24:39<22:06:42,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33811/203307 [4:24:39<22:06:42,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33812/203307 [4:24:42<22:06:58,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33812/203307 [4:24:42<22:06:58,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33813/203307 [4:24:47<22:07:17,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33813/203307 [4:24:47<22:07:17,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33814/203307 [4:24:50<22:07:33,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33814/203307 [4:24:50<22:07:33,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33815/203307 [4:24:55<22:07:52,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33815/203307 [4:24:55<22:07:52,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33816/203307 [4:24:58<22:08:08,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33816/203307 [4:24:59<22:08:08,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33817/203307 [4:25:03<22:08:27,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33817/203307 [4:25:03<22:08:27,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33818/203307 [4:25:07<22:08:43,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33818/203307 [4:25:07<22:08:43,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33819/203307 [4:25:11<22:09:02,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33819/203307 [4:25:11<22:09:02,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33820/203307 [4:25:15<22:09:18,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33820/203307 [4:25:15<22:09:18,  2.13it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33821/203307 [4:25:19<22:09:36,  2.12it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 33821/203307 [4:25:19<22:09:37,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33822/203307 [4:25:23<22:09:52,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33822/203307 [4:25:23<22:09:52,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33823/203307 [4:25:27<22:10:11,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33823/203307 [4:25:27<22:10:11,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33824/203307 [4:25:31<22:10:27,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33824/203307 [4:25:31<22:10:27,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33825/203307 [4:25:35<22:10:43,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33825/203307 [4:25:35<22:10:43,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33826/203307 [4:25:39<22:11:03,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33826/203307 [4:25:39<22:11:03,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33827/203307 [4:25:43<22:11:18,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33827/203307 [4:25:43<22:11:18,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33828/203307 [4:25:47<22:11:37,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33828/203307 [4:25:47<22:11:37,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33829/203307 [4:25:51<22:11:56,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33829/203307 [4:25:51<22:11:56,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33830/203307 [4:25:55<22:12:12,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33830/203307 [4:25:55<22:12:12,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33831/203307 [4:25:59<22:12:27,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33831/203307 [4:25:59<22:12:28,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33832/203307 [4:26:03<22:12:47,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33832/203307 [4:26:03<22:12:47,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33833/203307 [4:26:07<22:13:02,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33833/203307 [4:26:07<22:13:02,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33834/203307 [4:26:11<22:13:18,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33834/203307 [4:26:11<22:13:18,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33835/203307 [4:26:15<22:13:38,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33835/203307 [4:26:15<22:13:38,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33836/203307 [4:26:19<22:13:54,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33836/203307 [4:26:19<22:13:54,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33837/203307 [4:26:23<22:14:13,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33837/203307 [4:26:23<22:14:13,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33838/203307 [4:26:28<22:14:32,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33838/203307 [4:26:28<22:14:32,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33839/203307 [4:26:31<22:14:48,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33839/203307 [4:26:31<22:14:48,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33840/203307 [4:26:36<22:15:07,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33840/203307 [4:26:36<22:15:07,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33841/203307 [4:26:40<22:15:23,  2.12it/s, v_num=line, training/loss=0.0814]Epoch 0:  17%|█▋        | 33841/203307 [4:26:40<22:15:23,  2.12it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33842/203307 [4:26:43<22:15:39,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33842/203307 [4:26:43<22:15:40,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33843/203307 [4:26:48<22:15:59,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33843/203307 [4:26:48<22:15:59,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33844/203307 [4:26:52<22:16:15,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33844/203307 [4:26:52<22:16:15,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33845/203307 [4:26:55<22:16:31,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33845/203307 [4:26:55<22:16:31,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33846/203307 [4:27:00<22:16:50,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33846/203307 [4:27:00<22:16:50,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33847/203307 [4:27:04<22:17:06,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33847/203307 [4:27:04<22:17:06,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33848/203307 [4:27:08<22:17:25,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33848/203307 [4:27:08<22:17:25,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33849/203307 [4:27:12<22:17:41,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33849/203307 [4:27:12<22:17:41,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33850/203307 [4:27:15<22:17:57,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33850/203307 [4:27:15<22:17:57,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33851/203307 [4:27:19<22:18:13,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33851/203307 [4:27:19<22:18:13,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33852/203307 [4:27:24<22:18:32,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33852/203307 [4:27:24<22:18:32,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33853/203307 [4:27:27<22:18:48,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33853/203307 [4:27:27<22:18:48,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33854/203307 [4:27:32<22:19:07,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33854/203307 [4:27:32<22:19:07,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33855/203307 [4:27:36<22:19:25,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33855/203307 [4:27:36<22:19:25,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33856/203307 [4:27:40<22:19:41,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33856/203307 [4:27:40<22:19:41,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33857/203307 [4:27:44<22:20:00,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33857/203307 [4:27:44<22:20:00,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33858/203307 [4:27:48<22:20:16,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33858/203307 [4:27:48<22:20:16,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33859/203307 [4:27:51<22:20:31,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33859/203307 [4:27:51<22:20:31,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33860/203307 [4:27:55<22:20:47,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33860/203307 [4:27:55<22:20:47,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33861/203307 [4:27:59<22:21:06,  2.11it/s, v_num=line, training/loss=0.0721]Epoch 0:  17%|█▋        | 33861/203307 [4:27:59<22:21:06,  2.11it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33862/203307 [4:28:03<22:21:22,  2.11it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33862/203307 [4:28:03<22:21:22,  2.11it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33863/203307 [4:28:07<22:21:41,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33863/203307 [4:28:07<22:21:41,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33864/203307 [4:28:12<22:21:59,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33864/203307 [4:28:12<22:21:59,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33865/203307 [4:28:16<22:22:18,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33865/203307 [4:28:16<22:22:18,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33866/203307 [4:28:20<22:22:33,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33866/203307 [4:28:20<22:22:33,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33867/203307 [4:28:23<22:22:49,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33867/203307 [4:28:23<22:22:49,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33868/203307 [4:28:27<22:23:05,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33868/203307 [4:28:27<22:23:05,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33869/203307 [4:28:32<22:23:24,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33869/203307 [4:28:32<22:23:24,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33870/203307 [4:28:35<22:23:40,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33870/203307 [4:28:35<22:23:40,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33871/203307 [4:28:40<22:23:59,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33871/203307 [4:28:40<22:23:59,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33872/203307 [4:28:43<22:24:15,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33872/203307 [4:28:43<22:24:15,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33873/203307 [4:28:48<22:24:34,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33873/203307 [4:28:48<22:24:34,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33874/203307 [4:28:51<22:24:49,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33874/203307 [4:28:51<22:24:49,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33875/203307 [4:28:55<22:25:05,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33875/203307 [4:28:55<22:25:05,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33876/203307 [4:28:59<22:25:21,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33876/203307 [4:28:59<22:25:21,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33877/203307 [4:29:03<22:25:37,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33877/203307 [4:29:03<22:25:37,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33878/203307 [4:29:07<22:25:57,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33878/203307 [4:29:07<22:25:57,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33879/203307 [4:29:12<22:26:16,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33879/203307 [4:29:12<22:26:16,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33880/203307 [4:29:15<22:26:32,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33880/203307 [4:29:15<22:26:32,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33881/203307 [4:29:19<22:26:48,  2.10it/s, v_num=line, training/loss=0.0811]Epoch 0:  17%|█▋        | 33881/203307 [4:29:19<22:26:48,  2.10it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33882/203307 [4:29:24<22:27:07,  2.10it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33882/203307 [4:29:24<22:27:07,  2.10it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33883/203307 [4:29:27<22:27:23,  2.10it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33883/203307 [4:29:27<22:27:23,  2.10it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33884/203307 [4:29:31<22:27:39,  2.10it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33884/203307 [4:29:31<22:27:39,  2.10it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33885/203307 [4:29:35<22:27:56,  2.09it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33885/203307 [4:29:35<22:27:56,  2.09it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33886/203307 [4:29:39<22:28:11,  2.09it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33886/203307 [4:29:39<22:28:11,  2.09it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33887/203307 [4:29:43<22:28:31,  2.09it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33887/203307 [4:29:43<22:28:31,  2.09it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33888/203307 [4:29:48<22:28:50,  2.09it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33888/203307 [4:29:48<22:28:50,  2.09it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33889/203307 [4:29:51<22:29:06,  2.09it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33889/203307 [4:29:51<22:29:06,  2.09it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33890/203307 [4:29:56<22:29:24,  2.09it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33890/203307 [4:29:56<22:29:24,  2.09it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33891/203307 [4:30:00<22:29:43,  2.09it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33891/203307 [4:30:00<22:29:43,  2.09it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33892/203307 [4:30:04<22:29:58,  2.09it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33892/203307 [4:30:04<22:29:59,  2.09it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33893/203307 [4:30:07<22:30:15,  2.09it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33893/203307 [4:30:07<22:30:15,  2.09it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33894/203307 [4:30:11<22:30:31,  2.09it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33894/203307 [4:30:11<22:30:31,  2.09it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33895/203307 [4:30:16<22:30:50,  2.09it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33895/203307 [4:30:16<22:30:50,  2.09it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33896/203307 [4:30:20<22:31:09,  2.09it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33896/203307 [4:30:20<22:31:09,  2.09it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33897/203307 [4:30:24<22:31:25,  2.09it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33897/203307 [4:30:24<22:31:25,  2.09it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33898/203307 [4:30:28<22:31:43,  2.09it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33898/203307 [4:30:28<22:31:43,  2.09it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33899/203307 [4:30:32<22:31:59,  2.09it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33899/203307 [4:30:32<22:31:59,  2.09it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33900/203307 [4:30:36<22:32:18,  2.09it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33900/203307 [4:30:36<22:32:18,  2.09it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33901/203307 [4:30:40<22:32:33,  2.09it/s, v_num=line, training/loss=0.0856]Epoch 0:  17%|█▋        | 33901/203307 [4:30:40<22:32:33,  2.09it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33902/203307 [4:30:43<22:32:49,  2.09it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33902/203307 [4:30:43<22:32:49,  2.09it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33903/203307 [4:30:47<22:33:05,  2.09it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33903/203307 [4:30:47<22:33:05,  2.09it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33904/203307 [4:30:52<22:33:24,  2.09it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33904/203307 [4:30:52<22:33:24,  2.09it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33905/203307 [4:30:55<22:33:40,  2.09it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33905/203307 [4:30:55<22:33:40,  2.09it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33906/203307 [4:30:59<22:33:55,  2.09it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33906/203307 [4:30:59<22:33:55,  2.09it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33907/203307 [4:31:03<22:34:14,  2.08it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33907/203307 [4:31:03<22:34:14,  2.08it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33908/203307 [4:31:07<22:34:30,  2.08it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33908/203307 [4:31:07<22:34:30,  2.08it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33909/203307 [4:31:11<22:34:48,  2.08it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33909/203307 [4:31:11<22:34:48,  2.08it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33910/203307 [4:31:15<22:35:04,  2.08it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33910/203307 [4:31:15<22:35:04,  2.08it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33911/203307 [4:31:19<22:35:19,  2.08it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33911/203307 [4:31:19<22:35:19,  2.08it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33912/203307 [4:31:22<22:35:34,  2.08it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33912/203307 [4:31:22<22:35:35,  2.08it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33913/203307 [4:31:27<22:35:54,  2.08it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33913/203307 [4:31:27<22:35:54,  2.08it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33914/203307 [4:31:30<22:36:09,  2.08it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33914/203307 [4:31:30<22:36:09,  2.08it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33915/203307 [4:31:35<22:36:28,  2.08it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33915/203307 [4:31:35<22:36:28,  2.08it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33916/203307 [4:31:38<22:36:43,  2.08it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33916/203307 [4:31:38<22:36:43,  2.08it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33917/203307 [4:31:42<22:36:59,  2.08it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33917/203307 [4:31:42<22:36:59,  2.08it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33918/203307 [4:31:46<22:37:17,  2.08it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33918/203307 [4:31:46<22:37:17,  2.08it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33919/203307 [4:31:50<22:37:33,  2.08it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33919/203307 [4:31:50<22:37:33,  2.08it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33920/203307 [4:31:54<22:37:48,  2.08it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33920/203307 [4:31:54<22:37:48,  2.08it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33921/203307 [4:31:58<22:38:08,  2.08it/s, v_num=line, training/loss=0.0741]Epoch 0:  17%|█▋        | 33921/203307 [4:31:58<22:38:08,  2.08it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33922/203307 [4:32:02<22:38:24,  2.08it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33922/203307 [4:32:02<22:38:24,  2.08it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33923/203307 [4:32:06<22:38:42,  2.08it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33923/203307 [4:32:06<22:38:42,  2.08it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33924/203307 [4:32:10<22:38:58,  2.08it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33924/203307 [4:32:10<22:38:58,  2.08it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33925/203307 [4:32:14<22:39:14,  2.08it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33925/203307 [4:32:14<22:39:14,  2.08it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33926/203307 [4:32:17<22:39:29,  2.08it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33926/203307 [4:32:17<22:39:29,  2.08it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33927/203307 [4:32:22<22:39:48,  2.08it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33927/203307 [4:32:22<22:39:48,  2.08it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33928/203307 [4:32:25<22:40:03,  2.08it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33928/203307 [4:32:25<22:40:03,  2.08it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33929/203307 [4:32:30<22:40:22,  2.08it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33929/203307 [4:32:30<22:40:22,  2.08it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33930/203307 [4:32:34<22:40:41,  2.07it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33930/203307 [4:32:34<22:40:41,  2.07it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33931/203307 [4:32:38<22:40:57,  2.07it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33931/203307 [4:32:38<22:40:57,  2.07it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33932/203307 [4:32:42<22:41:16,  2.07it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33932/203307 [4:32:42<22:41:16,  2.07it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33933/203307 [4:32:46<22:41:32,  2.07it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33933/203307 [4:32:46<22:41:32,  2.07it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33934/203307 [4:32:50<22:41:48,  2.07it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33934/203307 [4:32:50<22:41:48,  2.07it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33935/203307 [4:32:54<22:42:04,  2.07it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33935/203307 [4:32:54<22:42:04,  2.07it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33936/203307 [4:32:58<22:42:23,  2.07it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33936/203307 [4:32:58<22:42:23,  2.07it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33937/203307 [4:33:02<22:42:38,  2.07it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33937/203307 [4:33:02<22:42:38,  2.07it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33938/203307 [4:33:06<22:42:57,  2.07it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33938/203307 [4:33:06<22:42:57,  2.07it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33939/203307 [4:33:11<22:43:17,  2.07it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33939/203307 [4:33:11<22:43:17,  2.07it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33940/203307 [4:33:15<22:43:36,  2.07it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33940/203307 [4:33:15<22:43:36,  2.07it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33941/203307 [4:33:19<22:43:52,  2.07it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 33941/203307 [4:33:19<22:43:52,  2.07it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33942/203307 [4:33:22<22:44:07,  2.07it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33942/203307 [4:33:22<22:44:07,  2.07it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33943/203307 [4:33:26<22:44:23,  2.07it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33943/203307 [4:33:26<22:44:23,  2.07it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33944/203307 [4:33:30<22:44:39,  2.07it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33944/203307 [4:33:30<22:44:39,  2.07it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33945/203307 [4:33:34<22:44:58,  2.07it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33945/203307 [4:33:34<22:44:58,  2.07it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33946/203307 [4:33:39<22:45:17,  2.07it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33946/203307 [4:33:39<22:45:17,  2.07it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33947/203307 [4:33:43<22:45:36,  2.07it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33947/203307 [4:33:43<22:45:36,  2.07it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33948/203307 [4:33:47<22:45:54,  2.07it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33948/203307 [4:33:47<22:45:54,  2.07it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33949/203307 [4:33:51<22:46:10,  2.07it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33949/203307 [4:33:51<22:46:10,  2.07it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33950/203307 [4:33:55<22:46:25,  2.07it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33950/203307 [4:33:55<22:46:26,  2.07it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33951/203307 [4:33:58<22:46:41,  2.07it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33951/203307 [4:33:58<22:46:41,  2.07it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33952/203307 [4:34:02<22:46:57,  2.06it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33952/203307 [4:34:02<22:46:57,  2.06it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33953/203307 [4:34:06<22:47:13,  2.06it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33953/203307 [4:34:06<22:47:13,  2.06it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33954/203307 [4:34:10<22:47:32,  2.06it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33954/203307 [4:34:10<22:47:32,  2.06it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33955/203307 [4:34:14<22:47:48,  2.06it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33955/203307 [4:34:14<22:47:48,  2.06it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33956/203307 [4:34:19<22:48:07,  2.06it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33956/203307 [4:34:19<22:48:07,  2.06it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33957/203307 [4:34:23<22:48:26,  2.06it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33957/203307 [4:34:23<22:48:26,  2.06it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33958/203307 [4:34:27<22:48:41,  2.06it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33958/203307 [4:34:27<22:48:42,  2.06it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33959/203307 [4:34:30<22:48:57,  2.06it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33959/203307 [4:34:30<22:48:57,  2.06it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33960/203307 [4:34:34<22:49:13,  2.06it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33960/203307 [4:34:34<22:49:13,  2.06it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33961/203307 [4:34:38<22:49:29,  2.06it/s, v_num=line, training/loss=0.0896]Epoch 0:  17%|█▋        | 33961/203307 [4:34:38<22:49:29,  2.06it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33962/203307 [4:34:42<22:49:45,  2.06it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33962/203307 [4:34:42<22:49:45,  2.06it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33963/203307 [4:34:46<22:50:03,  2.06it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33963/203307 [4:34:46<22:50:03,  2.06it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33964/203307 [4:34:50<22:50:19,  2.06it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33964/203307 [4:34:50<22:50:19,  2.06it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33965/203307 [4:34:54<22:50:38,  2.06it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33965/203307 [4:34:54<22:50:38,  2.06it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33966/203307 [4:34:58<22:50:54,  2.06it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33966/203307 [4:34:58<22:50:54,  2.06it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33967/203307 [4:35:02<22:51:09,  2.06it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33967/203307 [4:35:02<22:51:09,  2.06it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33968/203307 [4:35:05<22:51:25,  2.06it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33968/203307 [4:35:05<22:51:25,  2.06it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33969/203307 [4:35:09<22:51:41,  2.06it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33969/203307 [4:35:09<22:51:41,  2.06it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33970/203307 [4:35:13<22:51:57,  2.06it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33970/203307 [4:35:13<22:51:57,  2.06it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33971/203307 [4:35:17<22:52:15,  2.06it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33971/203307 [4:35:17<22:52:15,  2.06it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33972/203307 [4:35:21<22:52:34,  2.06it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33972/203307 [4:35:21<22:52:34,  2.06it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33973/203307 [4:35:26<22:52:53,  2.06it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33973/203307 [4:35:26<22:52:53,  2.06it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33974/203307 [4:35:30<22:53:08,  2.06it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33974/203307 [4:35:30<22:53:09,  2.06it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33975/203307 [4:35:33<22:53:24,  2.05it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33975/203307 [4:35:33<22:53:24,  2.05it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33976/203307 [4:35:37<22:53:40,  2.05it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33976/203307 [4:35:37<22:53:40,  2.05it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33977/203307 [4:35:41<22:53:56,  2.05it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33977/203307 [4:35:41<22:53:56,  2.05it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33978/203307 [4:35:45<22:54:12,  2.05it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33978/203307 [4:35:45<22:54:12,  2.05it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33979/203307 [4:35:49<22:54:30,  2.05it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33979/203307 [4:35:49<22:54:30,  2.05it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33980/203307 [4:35:53<22:54:46,  2.05it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33980/203307 [4:35:53<22:54:46,  2.05it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33981/203307 [4:35:57<22:55:05,  2.05it/s, v_num=line, training/loss=0.0911]Epoch 0:  17%|█▋        | 33981/203307 [4:35:57<22:55:05,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33982/203307 [4:36:01<22:55:24,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33982/203307 [4:36:01<22:55:24,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33983/203307 [4:36:05<22:55:39,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33983/203307 [4:36:05<22:55:39,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33984/203307 [4:36:09<22:55:55,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33984/203307 [4:36:09<22:55:55,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33985/203307 [4:36:12<22:56:10,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33985/203307 [4:36:12<22:56:10,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33986/203307 [4:36:16<22:56:26,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33986/203307 [4:36:16<22:56:26,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33987/203307 [4:36:20<22:56:42,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33987/203307 [4:36:20<22:56:42,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33988/203307 [4:36:24<22:57:01,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33988/203307 [4:36:24<22:57:01,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33989/203307 [4:36:28<22:57:16,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33989/203307 [4:36:28<22:57:16,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33990/203307 [4:36:32<22:57:34,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33990/203307 [4:36:32<22:57:35,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33991/203307 [4:36:37<22:57:54,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33991/203307 [4:36:37<22:57:54,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33992/203307 [4:36:40<22:58:09,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33992/203307 [4:36:40<22:58:09,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33993/203307 [4:36:44<22:58:25,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33993/203307 [4:36:44<22:58:25,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33994/203307 [4:36:48<22:58:41,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33994/203307 [4:36:48<22:58:41,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33995/203307 [4:36:52<22:58:57,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33995/203307 [4:36:52<22:58:57,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33996/203307 [4:36:56<22:59:16,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33996/203307 [4:36:56<22:59:16,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33997/203307 [4:37:00<22:59:31,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33997/203307 [4:37:00<22:59:31,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33998/203307 [4:37:04<22:59:50,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33998/203307 [4:37:04<22:59:50,  2.05it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33999/203307 [4:37:09<23:00:09,  2.04it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 33999/203307 [4:37:09<23:00:09,  2.04it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 34000/203307 [4:37:12<23:00:25,  2.04it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 34000/203307 [4:37:12<23:00:25,  2.04it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 34001/203307 [4:37:16<23:00:40,  2.04it/s, v_num=line, training/loss=0.0781]Epoch 0:  17%|█▋        | 34001/203307 [4:37:16<23:00:40,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34002/203307 [4:37:20<23:00:56,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34002/203307 [4:37:20<23:00:56,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34003/203307 [4:37:24<23:01:12,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34003/203307 [4:37:24<23:01:12,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34004/203307 [4:37:28<23:01:31,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34004/203307 [4:37:28<23:01:31,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34005/203307 [4:37:32<23:01:46,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34005/203307 [4:37:32<23:01:46,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34006/203307 [4:37:35<23:02:02,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34006/203307 [4:37:35<23:02:02,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34007/203307 [4:37:40<23:02:21,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34007/203307 [4:37:40<23:02:21,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34008/203307 [4:37:44<23:02:40,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34008/203307 [4:37:44<23:02:40,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34009/203307 [4:37:48<23:02:56,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34009/203307 [4:37:48<23:02:56,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34010/203307 [4:37:52<23:03:12,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34010/203307 [4:37:52<23:03:12,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34011/203307 [4:37:56<23:03:28,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34011/203307 [4:37:56<23:03:28,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34012/203307 [4:37:59<23:03:44,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34012/203307 [4:37:59<23:03:44,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34013/203307 [4:38:04<23:04:04,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34013/203307 [4:38:04<23:04:04,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34014/203307 [4:38:08<23:04:19,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34014/203307 [4:38:08<23:04:19,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34015/203307 [4:38:12<23:04:38,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34015/203307 [4:38:12<23:04:38,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34016/203307 [4:38:16<23:04:54,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34016/203307 [4:38:16<23:04:54,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34017/203307 [4:38:20<23:05:14,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34017/203307 [4:38:20<23:05:14,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34018/203307 [4:38:24<23:05:30,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34018/203307 [4:38:24<23:05:30,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34019/203307 [4:38:28<23:05:45,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34019/203307 [4:38:28<23:05:46,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34020/203307 [4:38:32<23:06:01,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34020/203307 [4:38:32<23:06:01,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34021/203307 [4:38:36<23:06:21,  2.04it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34021/203307 [4:38:36<23:06:21,  2.04it/s, v_num=line, training/loss=0.082] Epoch 0:  17%|█▋        | 34022/203307 [4:38:40<23:06:37,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34022/203307 [4:38:40<23:06:37,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34023/203307 [4:38:44<23:06:56,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34023/203307 [4:38:44<23:06:56,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34024/203307 [4:38:48<23:07:11,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34024/203307 [4:38:48<23:07:11,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34025/203307 [4:38:53<23:07:31,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34025/203307 [4:38:53<23:07:31,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34026/203307 [4:38:57<23:07:50,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34026/203307 [4:38:57<23:07:50,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34027/203307 [4:39:01<23:08:06,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34027/203307 [4:39:01<23:08:06,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34028/203307 [4:39:05<23:08:22,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34028/203307 [4:39:05<23:08:22,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34029/203307 [4:39:09<23:08:42,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34029/203307 [4:39:09<23:08:42,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34030/203307 [4:39:13<23:08:58,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34030/203307 [4:39:13<23:08:58,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34031/203307 [4:39:17<23:09:14,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34031/203307 [4:39:17<23:09:14,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34032/203307 [4:39:21<23:09:33,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34032/203307 [4:39:21<23:09:33,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34033/203307 [4:39:25<23:09:49,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34033/203307 [4:39:25<23:09:49,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34034/203307 [4:39:30<23:10:09,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34034/203307 [4:39:30<23:10:09,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34035/203307 [4:39:34<23:10:28,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34035/203307 [4:39:34<23:10:28,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34036/203307 [4:39:38<23:10:43,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34036/203307 [4:39:38<23:10:44,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34037/203307 [4:39:42<23:10:59,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34037/203307 [4:39:42<23:10:59,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34038/203307 [4:39:46<23:11:18,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34038/203307 [4:39:46<23:11:18,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34039/203307 [4:39:50<23:11:34,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34039/203307 [4:39:50<23:11:34,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34040/203307 [4:39:54<23:11:53,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34040/203307 [4:39:54<23:11:53,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34041/203307 [4:39:58<23:12:10,  2.03it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34041/203307 [4:39:58<23:12:10,  2.03it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34042/203307 [4:40:02<23:12:25,  2.03it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34042/203307 [4:40:02<23:12:25,  2.03it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34043/203307 [4:40:07<23:12:45,  2.03it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34043/203307 [4:40:07<23:12:45,  2.03it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34044/203307 [4:40:11<23:13:04,  2.03it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34044/203307 [4:40:11<23:13:04,  2.03it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34045/203307 [4:40:15<23:13:20,  2.02it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34045/203307 [4:40:15<23:13:20,  2.02it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34046/203307 [4:40:19<23:13:39,  2.02it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34046/203307 [4:40:19<23:13:39,  2.02it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34047/203307 [4:40:23<23:13:55,  2.02it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34047/203307 [4:40:23<23:13:55,  2.02it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34048/203307 [4:40:27<23:14:14,  2.02it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34048/203307 [4:40:27<23:14:14,  2.02it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34049/203307 [4:40:31<23:14:30,  2.02it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34049/203307 [4:40:31<23:14:30,  2.02it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34050/203307 [4:40:35<23:14:46,  2.02it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34050/203307 [4:40:35<23:14:46,  2.02it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34051/203307 [4:40:39<23:15:05,  2.02it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34051/203307 [4:40:39<23:15:05,  2.02it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34052/203307 [4:40:43<23:15:21,  2.02it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34052/203307 [4:40:43<23:15:21,  2.02it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34053/203307 [4:40:47<23:15:39,  2.02it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34053/203307 [4:40:47<23:15:39,  2.02it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34054/203307 [4:40:52<23:15:58,  2.02it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34054/203307 [4:40:52<23:15:58,  2.02it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34055/203307 [4:40:56<23:16:13,  2.02it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34055/203307 [4:40:56<23:16:13,  2.02it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34056/203307 [4:40:59<23:16:29,  2.02it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34056/203307 [4:40:59<23:16:29,  2.02it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34057/203307 [4:41:04<23:16:48,  2.02it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34057/203307 [4:41:04<23:16:48,  2.02it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34058/203307 [4:41:07<23:17:04,  2.02it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34058/203307 [4:41:07<23:17:04,  2.02it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34059/203307 [4:41:11<23:17:20,  2.02it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34059/203307 [4:41:11<23:17:20,  2.02it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34060/203307 [4:41:16<23:17:40,  2.02it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34060/203307 [4:41:16<23:17:40,  2.02it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34061/203307 [4:41:20<23:17:55,  2.02it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34061/203307 [4:41:20<23:17:56,  2.02it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34062/203307 [4:41:24<23:18:14,  2.02it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34062/203307 [4:41:24<23:18:14,  2.02it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34063/203307 [4:41:28<23:18:33,  2.02it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34063/203307 [4:41:28<23:18:33,  2.02it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34064/203307 [4:41:32<23:18:49,  2.02it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34064/203307 [4:41:32<23:18:49,  2.02it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34065/203307 [4:41:37<23:19:08,  2.02it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34065/203307 [4:41:37<23:19:08,  2.02it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34066/203307 [4:41:40<23:19:23,  2.02it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34066/203307 [4:41:40<23:19:23,  2.02it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34067/203307 [4:41:44<23:19:39,  2.02it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34067/203307 [4:41:44<23:19:39,  2.02it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34068/203307 [4:41:48<23:19:54,  2.01it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34068/203307 [4:41:48<23:19:54,  2.01it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34069/203307 [4:41:52<23:20:14,  2.01it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34069/203307 [4:41:52<23:20:14,  2.01it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34070/203307 [4:41:56<23:20:29,  2.01it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34070/203307 [4:41:56<23:20:30,  2.01it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34071/203307 [4:42:00<23:20:48,  2.01it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34071/203307 [4:42:00<23:20:48,  2.01it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34072/203307 [4:42:04<23:21:04,  2.01it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34072/203307 [4:42:04<23:21:04,  2.01it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34073/203307 [4:42:09<23:21:23,  2.01it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34073/203307 [4:42:09<23:21:23,  2.01it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34074/203307 [4:42:12<23:21:39,  2.01it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34074/203307 [4:42:12<23:21:39,  2.01it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34075/203307 [4:42:16<23:21:54,  2.01it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34075/203307 [4:42:16<23:21:54,  2.01it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34076/203307 [4:42:20<23:22:10,  2.01it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34076/203307 [4:42:20<23:22:10,  2.01it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34077/203307 [4:42:24<23:22:29,  2.01it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34077/203307 [4:42:24<23:22:29,  2.01it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34078/203307 [4:42:28<23:22:45,  2.01it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34078/203307 [4:42:28<23:22:45,  2.01it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34079/203307 [4:42:32<23:23:04,  2.01it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34079/203307 [4:42:32<23:23:04,  2.01it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34080/203307 [4:42:37<23:23:22,  2.01it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34080/203307 [4:42:37<23:23:22,  2.01it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34081/203307 [4:42:40<23:23:37,  2.01it/s, v_num=line, training/loss=0.0906]Epoch 0:  17%|█▋        | 34081/203307 [4:42:40<23:23:38,  2.01it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34082/203307 [4:42:45<23:23:56,  2.01it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34082/203307 [4:42:45<23:23:56,  2.01it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34083/203307 [4:42:49<23:24:12,  2.01it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34083/203307 [4:42:49<23:24:12,  2.01it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34084/203307 [4:42:52<23:24:27,  2.01it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34084/203307 [4:42:52<23:24:27,  2.01it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34085/203307 [4:42:56<23:24:43,  2.01it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34085/203307 [4:42:56<23:24:43,  2.01it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34086/203307 [4:43:01<23:25:03,  2.01it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34086/203307 [4:43:01<23:25:03,  2.01it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34087/203307 [4:43:04<23:25:18,  2.01it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34087/203307 [4:43:04<23:25:18,  2.01it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34088/203307 [4:43:09<23:25:37,  2.01it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34088/203307 [4:43:09<23:25:37,  2.01it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34089/203307 [4:43:13<23:25:55,  2.01it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34089/203307 [4:43:13<23:25:55,  2.01it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34090/203307 [4:43:17<23:26:13,  2.01it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34090/203307 [4:43:17<23:26:13,  2.01it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34091/203307 [4:43:21<23:26:29,  2.01it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34091/203307 [4:43:21<23:26:29,  2.01it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34092/203307 [4:43:25<23:26:44,  2.00it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34092/203307 [4:43:25<23:26:44,  2.00it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34093/203307 [4:43:28<23:26:59,  2.00it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34093/203307 [4:43:28<23:27:00,  2.00it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34094/203307 [4:43:32<23:27:15,  2.00it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34094/203307 [4:43:32<23:27:15,  2.00it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34095/203307 [4:43:37<23:27:34,  2.00it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34095/203307 [4:43:37<23:27:34,  2.00it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34096/203307 [4:43:41<23:27:53,  2.00it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34096/203307 [4:43:41<23:27:53,  2.00it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34097/203307 [4:43:45<23:28:08,  2.00it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34097/203307 [4:43:45<23:28:08,  2.00it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34098/203307 [4:43:49<23:28:27,  2.00it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34098/203307 [4:43:49<23:28:27,  2.00it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34099/203307 [4:43:53<23:28:42,  2.00it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34099/203307 [4:43:53<23:28:42,  2.00it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34100/203307 [4:43:56<23:28:58,  2.00it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34100/203307 [4:43:56<23:28:58,  2.00it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34101/203307 [4:44:00<23:29:14,  2.00it/s, v_num=line, training/loss=0.0872]Epoch 0:  17%|█▋        | 34101/203307 [4:44:00<23:29:14,  2.00it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34102/203307 [4:44:04<23:29:29,  2.00it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34102/203307 [4:44:04<23:29:29,  2.00it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34103/203307 [4:44:08<23:29:49,  2.00it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34103/203307 [4:44:08<23:29:49,  2.00it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34104/203307 [4:44:13<23:30:07,  2.00it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34104/203307 [4:44:13<23:30:07,  2.00it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34105/203307 [4:44:16<23:30:23,  2.00it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34105/203307 [4:44:17<23:30:23,  2.00it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34106/203307 [4:44:20<23:30:38,  2.00it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34106/203307 [4:44:20<23:30:38,  2.00it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34107/203307 [4:44:25<23:30:57,  2.00it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34107/203307 [4:44:25<23:30:57,  2.00it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34108/203307 [4:44:28<23:31:13,  2.00it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34108/203307 [4:44:28<23:31:13,  2.00it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34109/203307 [4:44:32<23:31:28,  2.00it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34109/203307 [4:44:32<23:31:28,  2.00it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34110/203307 [4:44:36<23:31:44,  2.00it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34110/203307 [4:44:36<23:31:44,  2.00it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34111/203307 [4:44:39<23:31:59,  2.00it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34111/203307 [4:44:39<23:31:59,  2.00it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34112/203307 [4:44:44<23:32:19,  2.00it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34112/203307 [4:44:44<23:32:19,  2.00it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34113/203307 [4:44:48<23:32:38,  2.00it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34113/203307 [4:44:48<23:32:38,  2.00it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34114/203307 [4:44:52<23:32:53,  2.00it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34114/203307 [4:44:52<23:32:53,  2.00it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34115/203307 [4:44:57<23:33:12,  2.00it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34115/203307 [4:44:57<23:33:12,  2.00it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34116/203307 [4:45:01<23:33:30,  1.99it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34116/203307 [4:45:01<23:33:30,  1.99it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34117/203307 [4:45:04<23:33:45,  1.99it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34117/203307 [4:45:05<23:33:45,  1.99it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34118/203307 [4:45:08<23:34:01,  1.99it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34118/203307 [4:45:08<23:34:01,  1.99it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34119/203307 [4:45:12<23:34:16,  1.99it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34119/203307 [4:45:12<23:34:16,  1.99it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34120/203307 [4:45:16<23:34:32,  1.99it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34120/203307 [4:45:16<23:34:32,  1.99it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34121/203307 [4:45:20<23:34:52,  1.99it/s, v_num=line, training/loss=0.0871]Epoch 0:  17%|█▋        | 34121/203307 [4:45:20<23:34:52,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34122/203307 [4:45:24<23:35:07,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34122/203307 [4:45:24<23:35:08,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34123/203307 [4:45:28<23:35:26,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34123/203307 [4:45:28<23:35:26,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34124/203307 [4:45:32<23:35:42,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34124/203307 [4:45:32<23:35:42,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34125/203307 [4:45:37<23:36:00,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34125/203307 [4:45:37<23:36:00,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34126/203307 [4:45:40<23:36:16,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34126/203307 [4:45:40<23:36:16,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34127/203307 [4:45:44<23:36:31,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34127/203307 [4:45:44<23:36:31,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34128/203307 [4:45:48<23:36:47,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34128/203307 [4:45:48<23:36:47,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34129/203307 [4:45:52<23:37:06,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34129/203307 [4:45:52<23:37:06,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34130/203307 [4:45:56<23:37:22,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34130/203307 [4:45:56<23:37:22,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34131/203307 [4:46:00<23:37:37,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34131/203307 [4:46:00<23:37:37,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34132/203307 [4:46:04<23:37:56,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34132/203307 [4:46:04<23:37:56,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34133/203307 [4:46:08<23:38:11,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34133/203307 [4:46:08<23:38:11,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34134/203307 [4:46:12<23:38:30,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34134/203307 [4:46:12<23:38:30,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34135/203307 [4:46:16<23:38:45,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34135/203307 [4:46:16<23:38:45,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34136/203307 [4:46:20<23:39:01,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34136/203307 [4:46:20<23:39:01,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34137/203307 [4:46:23<23:39:16,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34137/203307 [4:46:23<23:39:16,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34138/203307 [4:46:28<23:39:35,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34138/203307 [4:46:28<23:39:35,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34139/203307 [4:46:32<23:39:51,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34139/203307 [4:46:32<23:39:51,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34140/203307 [4:46:36<23:40:10,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34140/203307 [4:46:36<23:40:10,  1.99it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34141/203307 [4:46:40<23:40:25,  1.98it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34141/203307 [4:46:40<23:40:25,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34142/203307 [4:46:43<23:40:41,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34142/203307 [4:46:43<23:40:41,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34143/203307 [4:46:48<23:40:59,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34143/203307 [4:46:48<23:40:59,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34144/203307 [4:46:52<23:41:15,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34144/203307 [4:46:52<23:41:15,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34145/203307 [4:46:55<23:41:30,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34145/203307 [4:46:55<23:41:30,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34146/203307 [4:47:00<23:41:49,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34146/203307 [4:47:00<23:41:49,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34147/203307 [4:47:04<23:42:08,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34147/203307 [4:47:04<23:42:08,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34148/203307 [4:47:08<23:42:26,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34148/203307 [4:47:08<23:42:26,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34149/203307 [4:47:12<23:42:41,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34149/203307 [4:47:12<23:42:42,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34150/203307 [4:47:16<23:42:57,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34150/203307 [4:47:16<23:42:57,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34151/203307 [4:47:19<23:43:12,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34151/203307 [4:47:20<23:43:12,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34152/203307 [4:47:24<23:43:31,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34152/203307 [4:47:24<23:43:31,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34153/203307 [4:47:28<23:43:46,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34153/203307 [4:47:28<23:43:46,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34154/203307 [4:47:32<23:44:04,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34154/203307 [4:47:32<23:44:04,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34155/203307 [4:47:36<23:44:23,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34155/203307 [4:47:36<23:44:23,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34156/203307 [4:47:40<23:44:39,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34156/203307 [4:47:40<23:44:39,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34157/203307 [4:47:44<23:44:57,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34157/203307 [4:47:44<23:44:57,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34158/203307 [4:47:48<23:45:13,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34158/203307 [4:47:48<23:45:13,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34159/203307 [4:47:52<23:45:29,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34159/203307 [4:47:52<23:45:29,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34160/203307 [4:47:56<23:45:44,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34160/203307 [4:47:56<23:45:44,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34161/203307 [4:48:00<23:46:03,  1.98it/s, v_num=line, training/loss=0.0774]Epoch 0:  17%|█▋        | 34161/203307 [4:48:00<23:46:03,  1.98it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34162/203307 [4:48:04<23:46:18,  1.98it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34162/203307 [4:48:04<23:46:18,  1.98it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34163/203307 [4:48:08<23:46:37,  1.98it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34163/203307 [4:48:08<23:46:37,  1.98it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34164/203307 [4:48:13<23:46:56,  1.98it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34164/203307 [4:48:13<23:46:56,  1.98it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34165/203307 [4:48:17<23:47:15,  1.98it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34165/203307 [4:48:17<23:47:15,  1.98it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34166/203307 [4:48:21<23:47:30,  1.97it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34166/203307 [4:48:21<23:47:30,  1.97it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34167/203307 [4:48:24<23:47:46,  1.97it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34167/203307 [4:48:24<23:47:46,  1.97it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34168/203307 [4:48:28<23:48:01,  1.97it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34168/203307 [4:48:28<23:48:01,  1.97it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34169/203307 [4:48:32<23:48:17,  1.97it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34169/203307 [4:48:32<23:48:17,  1.97it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34170/203307 [4:48:36<23:48:36,  1.97it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34170/203307 [4:48:36<23:48:36,  1.97it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34171/203307 [4:48:41<23:48:54,  1.97it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34171/203307 [4:48:41<23:48:54,  1.97it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34172/203307 [4:48:44<23:49:10,  1.97it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34172/203307 [4:48:44<23:49:10,  1.97it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34173/203307 [4:48:49<23:49:29,  1.97it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34173/203307 [4:48:49<23:49:29,  1.97it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34174/203307 [4:48:53<23:49:45,  1.97it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34174/203307 [4:48:53<23:49:45,  1.97it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34175/203307 [4:48:57<23:50:01,  1.97it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34175/203307 [4:48:57<23:50:01,  1.97it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34176/203307 [4:49:00<23:50:16,  1.97it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34176/203307 [4:49:00<23:50:16,  1.97it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34177/203307 [4:49:04<23:50:32,  1.97it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34177/203307 [4:49:04<23:50:32,  1.97it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34178/203307 [4:49:08<23:50:47,  1.97it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34178/203307 [4:49:08<23:50:47,  1.97it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34179/203307 [4:49:12<23:51:07,  1.97it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34179/203307 [4:49:12<23:51:07,  1.97it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34180/203307 [4:49:16<23:51:22,  1.97it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34180/203307 [4:49:16<23:51:23,  1.97it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34181/203307 [4:49:21<23:51:41,  1.97it/s, v_num=line, training/loss=0.0725]Epoch 0:  17%|█▋        | 34181/203307 [4:49:21<23:51:41,  1.97it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34182/203307 [4:49:25<23:52:00,  1.97it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34182/203307 [4:49:25<23:52:00,  1.97it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34183/203307 [4:49:29<23:52:16,  1.97it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34183/203307 [4:49:29<23:52:16,  1.97it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34184/203307 [4:49:33<23:52:31,  1.97it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34184/203307 [4:49:33<23:52:31,  1.97it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34185/203307 [4:49:36<23:52:47,  1.97it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34185/203307 [4:49:36<23:52:47,  1.97it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34186/203307 [4:49:40<23:53:03,  1.97it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34186/203307 [4:49:40<23:53:03,  1.97it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34187/203307 [4:49:44<23:53:19,  1.97it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34187/203307 [4:49:44<23:53:19,  1.97it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34188/203307 [4:49:48<23:53:38,  1.97it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34188/203307 [4:49:48<23:53:38,  1.97it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34189/203307 [4:49:52<23:53:53,  1.97it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34189/203307 [4:49:52<23:53:53,  1.97it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34190/203307 [4:49:57<23:54:12,  1.97it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34190/203307 [4:49:57<23:54:12,  1.97it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34191/203307 [4:50:00<23:54:27,  1.96it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34191/203307 [4:50:00<23:54:27,  1.96it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34192/203307 [4:50:04<23:54:43,  1.96it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34192/203307 [4:50:04<23:54:43,  1.96it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34193/203307 [4:50:08<23:54:58,  1.96it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34193/203307 [4:50:08<23:54:58,  1.96it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34194/203307 [4:50:11<23:55:13,  1.96it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34194/203307 [4:50:11<23:55:14,  1.96it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34195/203307 [4:50:15<23:55:29,  1.96it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34195/203307 [4:50:15<23:55:29,  1.96it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34196/203307 [4:50:20<23:55:48,  1.96it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34196/203307 [4:50:20<23:55:48,  1.96it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34197/203307 [4:50:24<23:56:06,  1.96it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34197/203307 [4:50:24<23:56:06,  1.96it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34198/203307 [4:50:28<23:56:24,  1.96it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34198/203307 [4:50:28<23:56:24,  1.96it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34199/203307 [4:50:33<23:56:43,  1.96it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34199/203307 [4:50:33<23:56:43,  1.96it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34200/203307 [4:50:36<23:56:58,  1.96it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34200/203307 [4:50:36<23:56:58,  1.96it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34201/203307 [4:50:40<23:57:14,  1.96it/s, v_num=line, training/loss=0.0808]Epoch 0:  17%|█▋        | 34201/203307 [4:50:40<23:57:14,  1.96it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34202/203307 [4:50:44<23:57:29,  1.96it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34202/203307 [4:50:44<23:57:30,  1.96it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34203/203307 [4:50:48<23:57:45,  1.96it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34203/203307 [4:50:48<23:57:45,  1.96it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34204/203307 [4:50:52<23:58:04,  1.96it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34204/203307 [4:50:52<23:58:04,  1.96it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34205/203307 [4:50:56<23:58:19,  1.96it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34205/203307 [4:50:56<23:58:19,  1.96it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34206/203307 [4:51:00<23:58:37,  1.96it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34206/203307 [4:51:00<23:58:37,  1.96it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34207/203307 [4:51:04<23:58:56,  1.96it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34207/203307 [4:51:04<23:58:56,  1.96it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34208/203307 [4:51:08<23:59:11,  1.96it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34208/203307 [4:51:08<23:59:11,  1.96it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34209/203307 [4:51:12<23:59:26,  1.96it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34209/203307 [4:51:12<23:59:26,  1.96it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34210/203307 [4:51:15<23:59:42,  1.96it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34210/203307 [4:51:15<23:59:42,  1.96it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34211/203307 [4:51:19<23:59:57,  1.96it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34211/203307 [4:51:19<23:59:57,  1.96it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34212/203307 [4:51:23<24:00:13,  1.96it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34212/203307 [4:51:23<24:00:13,  1.96it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34213/203307 [4:51:27<24:00:31,  1.96it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34213/203307 [4:51:27<24:00:31,  1.96it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34214/203307 [4:51:31<24:00:46,  1.96it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34214/203307 [4:51:31<24:00:46,  1.96it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34215/203307 [4:51:35<24:01:04,  1.96it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34215/203307 [4:51:35<24:01:05,  1.96it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34216/203307 [4:51:40<24:01:23,  1.96it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34216/203307 [4:51:40<24:01:23,  1.96it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34217/203307 [4:51:43<24:01:39,  1.95it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34217/203307 [4:51:43<24:01:39,  1.95it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34218/203307 [4:51:47<24:01:54,  1.95it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34218/203307 [4:51:47<24:01:54,  1.95it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34219/203307 [4:51:51<24:02:09,  1.95it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34219/203307 [4:51:51<24:02:09,  1.95it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34220/203307 [4:51:55<24:02:25,  1.95it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34220/203307 [4:51:55<24:02:25,  1.95it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34221/203307 [4:51:59<24:02:43,  1.95it/s, v_num=line, training/loss=0.0849]Epoch 0:  17%|█▋        | 34221/203307 [4:51:59<24:02:43,  1.95it/s, v_num=line, training/loss=0.082] Epoch 0:  17%|█▋        | 34222/203307 [4:52:03<24:02:59,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34222/203307 [4:52:03<24:02:59,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34223/203307 [4:52:07<24:03:17,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34223/203307 [4:52:07<24:03:17,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34224/203307 [4:52:11<24:03:35,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34224/203307 [4:52:11<24:03:35,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34225/203307 [4:52:16<24:03:54,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34225/203307 [4:52:16<24:03:54,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34226/203307 [4:52:19<24:04:09,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34226/203307 [4:52:19<24:04:09,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34227/203307 [4:52:23<24:04:25,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34227/203307 [4:52:23<24:04:25,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34228/203307 [4:52:27<24:04:40,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34228/203307 [4:52:27<24:04:40,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34229/203307 [4:52:31<24:04:59,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34229/203307 [4:52:31<24:04:59,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34230/203307 [4:52:35<24:05:14,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34230/203307 [4:52:35<24:05:14,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34231/203307 [4:52:39<24:05:29,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34231/203307 [4:52:39<24:05:29,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34232/203307 [4:52:43<24:05:48,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34232/203307 [4:52:43<24:05:48,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34233/203307 [4:52:48<24:06:07,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34233/203307 [4:52:48<24:06:07,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34234/203307 [4:52:51<24:06:22,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34234/203307 [4:52:51<24:06:22,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34235/203307 [4:52:55<24:06:37,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34235/203307 [4:52:55<24:06:37,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34236/203307 [4:52:59<24:06:53,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34236/203307 [4:52:59<24:06:53,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34237/203307 [4:53:03<24:07:08,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34237/203307 [4:53:03<24:07:08,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34238/203307 [4:53:07<24:07:27,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34238/203307 [4:53:07<24:07:27,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34239/203307 [4:53:11<24:07:42,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34239/203307 [4:53:11<24:07:42,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34240/203307 [4:53:15<24:08:00,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34240/203307 [4:53:15<24:08:00,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34241/203307 [4:53:19<24:08:16,  1.95it/s, v_num=line, training/loss=0.082]Epoch 0:  17%|█▋        | 34241/203307 [4:53:19<24:08:16,  1.95it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34242/203307 [4:53:23<24:08:34,  1.95it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34242/203307 [4:53:23<24:08:34,  1.95it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34243/203307 [4:53:27<24:08:49,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34243/203307 [4:53:27<24:08:49,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34244/203307 [4:53:30<24:09:04,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34244/203307 [4:53:30<24:09:04,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34245/203307 [4:53:34<24:09:20,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34245/203307 [4:53:34<24:09:20,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34246/203307 [4:53:38<24:09:38,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34246/203307 [4:53:38<24:09:38,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34247/203307 [4:53:42<24:09:54,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34247/203307 [4:53:42<24:09:54,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34248/203307 [4:53:47<24:10:13,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34248/203307 [4:53:47<24:10:13,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34249/203307 [4:53:50<24:10:28,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34249/203307 [4:53:50<24:10:28,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34250/203307 [4:53:54<24:10:43,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34250/203307 [4:53:54<24:10:43,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34251/203307 [4:53:59<24:11:03,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34251/203307 [4:53:59<24:11:03,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34252/203307 [4:54:02<24:11:18,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34252/203307 [4:54:02<24:11:18,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34253/203307 [4:54:06<24:11:33,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34253/203307 [4:54:06<24:11:33,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34254/203307 [4:54:10<24:11:52,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34254/203307 [4:54:10<24:11:52,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34255/203307 [4:54:14<24:12:07,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34255/203307 [4:54:14<24:12:07,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34256/203307 [4:54:18<24:12:22,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34256/203307 [4:54:18<24:12:22,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34257/203307 [4:54:22<24:12:41,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34257/203307 [4:54:22<24:12:41,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34258/203307 [4:54:26<24:12:56,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34258/203307 [4:54:26<24:12:56,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34259/203307 [4:54:30<24:13:15,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34259/203307 [4:54:30<24:13:15,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34260/203307 [4:54:35<24:13:33,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34260/203307 [4:54:35<24:13:33,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34261/203307 [4:54:38<24:13:48,  1.94it/s, v_num=line, training/loss=0.077]Epoch 0:  17%|█▋        | 34261/203307 [4:54:38<24:13:48,  1.94it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34262/203307 [4:54:42<24:14:04,  1.94it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34262/203307 [4:54:42<24:14:04,  1.94it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34263/203307 [4:54:47<24:14:23,  1.94it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34263/203307 [4:54:47<24:14:23,  1.94it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34264/203307 [4:54:50<24:14:38,  1.94it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34264/203307 [4:54:50<24:14:38,  1.94it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34265/203307 [4:54:55<24:14:56,  1.94it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34265/203307 [4:54:55<24:14:56,  1.94it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34266/203307 [4:54:58<24:15:12,  1.94it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34266/203307 [4:54:58<24:15:12,  1.94it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34267/203307 [4:55:02<24:15:27,  1.94it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34267/203307 [4:55:02<24:15:27,  1.94it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34268/203307 [4:55:07<24:15:46,  1.94it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34268/203307 [4:55:07<24:15:46,  1.94it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34269/203307 [4:55:11<24:16:04,  1.93it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34269/203307 [4:55:11<24:16:04,  1.93it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34270/203307 [4:55:15<24:16:19,  1.93it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34270/203307 [4:55:15<24:16:19,  1.93it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34271/203307 [4:55:19<24:16:38,  1.93it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34271/203307 [4:55:19<24:16:38,  1.93it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34272/203307 [4:55:23<24:16:53,  1.93it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34272/203307 [4:55:23<24:16:53,  1.93it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34273/203307 [4:55:27<24:17:11,  1.93it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34273/203307 [4:55:27<24:17:11,  1.93it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34274/203307 [4:55:31<24:17:27,  1.93it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34274/203307 [4:55:31<24:17:27,  1.93it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34275/203307 [4:55:34<24:17:42,  1.93it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34275/203307 [4:55:34<24:17:42,  1.93it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34276/203307 [4:55:38<24:17:58,  1.93it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34276/203307 [4:55:38<24:17:58,  1.93it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34277/203307 [4:55:43<24:18:17,  1.93it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34277/203307 [4:55:43<24:18:17,  1.93it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34278/203307 [4:55:47<24:18:35,  1.93it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34278/203307 [4:55:47<24:18:35,  1.93it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34279/203307 [4:55:51<24:18:53,  1.93it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34279/203307 [4:55:51<24:18:53,  1.93it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34280/203307 [4:55:55<24:19:08,  1.93it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34280/203307 [4:55:55<24:19:08,  1.93it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34281/203307 [4:55:59<24:19:24,  1.93it/s, v_num=line, training/loss=0.0806]Epoch 0:  17%|█▋        | 34281/203307 [4:55:59<24:19:24,  1.93it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34282/203307 [4:56:03<24:19:43,  1.93it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34282/203307 [4:56:03<24:19:43,  1.93it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34283/203307 [4:56:07<24:19:58,  1.93it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34283/203307 [4:56:07<24:19:58,  1.93it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34284/203307 [4:56:11<24:20:13,  1.93it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34284/203307 [4:56:11<24:20:13,  1.93it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34285/203307 [4:56:15<24:20:32,  1.93it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34285/203307 [4:56:15<24:20:32,  1.93it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34286/203307 [4:56:19<24:20:48,  1.93it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34286/203307 [4:56:19<24:20:48,  1.93it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34287/203307 [4:56:23<24:21:06,  1.93it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34287/203307 [4:56:23<24:21:06,  1.93it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34288/203307 [4:56:28<24:21:24,  1.93it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34288/203307 [4:56:28<24:21:25,  1.93it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34289/203307 [4:56:31<24:21:40,  1.93it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34289/203307 [4:56:31<24:21:40,  1.93it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34290/203307 [4:56:36<24:21:58,  1.93it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34290/203307 [4:56:36<24:21:58,  1.93it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34291/203307 [4:56:40<24:22:14,  1.93it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34291/203307 [4:56:40<24:22:14,  1.93it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34292/203307 [4:56:43<24:22:29,  1.93it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34292/203307 [4:56:43<24:22:29,  1.93it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34293/203307 [4:56:47<24:22:45,  1.93it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34293/203307 [4:56:47<24:22:45,  1.93it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34294/203307 [4:56:52<24:23:04,  1.93it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34294/203307 [4:56:52<24:23:04,  1.93it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34295/203307 [4:56:55<24:23:19,  1.92it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34295/203307 [4:56:55<24:23:19,  1.92it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34296/203307 [4:57:00<24:23:37,  1.92it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34296/203307 [4:57:00<24:23:37,  1.92it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34297/203307 [4:57:03<24:23:52,  1.92it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34297/203307 [4:57:03<24:23:52,  1.92it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34298/203307 [4:57:08<24:24:10,  1.92it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34298/203307 [4:57:08<24:24:10,  1.92it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34299/203307 [4:57:11<24:24:26,  1.92it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34299/203307 [4:57:11<24:24:26,  1.92it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34300/203307 [4:57:15<24:24:41,  1.92it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34300/203307 [4:57:15<24:24:41,  1.92it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34301/203307 [4:57:19<24:24:56,  1.92it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34301/203307 [4:57:19<24:24:56,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34302/203307 [4:57:22<24:25:11,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34302/203307 [4:57:23<24:25:11,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34303/203307 [4:57:27<24:25:31,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34303/203307 [4:57:27<24:25:31,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34304/203307 [4:57:31<24:25:49,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34304/203307 [4:57:31<24:25:49,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34305/203307 [4:57:36<24:26:07,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34305/203307 [4:57:36<24:26:07,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34306/203307 [4:57:39<24:26:22,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34306/203307 [4:57:39<24:26:22,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34307/203307 [4:57:44<24:26:40,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34307/203307 [4:57:44<24:26:40,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34308/203307 [4:57:47<24:26:55,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34308/203307 [4:57:47<24:26:55,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34309/203307 [4:57:51<24:27:11,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34309/203307 [4:57:51<24:27:11,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34310/203307 [4:57:55<24:27:26,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34310/203307 [4:57:55<24:27:26,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34311/203307 [4:57:59<24:27:45,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34311/203307 [4:57:59<24:27:45,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34312/203307 [4:58:03<24:28:00,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34312/203307 [4:58:03<24:28:00,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34313/203307 [4:58:07<24:28:18,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34313/203307 [4:58:07<24:28:18,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34314/203307 [4:58:12<24:28:36,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34314/203307 [4:58:12<24:28:36,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34315/203307 [4:58:16<24:28:54,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34315/203307 [4:58:16<24:28:54,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34316/203307 [4:58:20<24:29:09,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34316/203307 [4:58:20<24:29:09,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34317/203307 [4:58:23<24:29:25,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34317/203307 [4:58:23<24:29:25,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34318/203307 [4:58:27<24:29:40,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34318/203307 [4:58:27<24:29:40,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34319/203307 [4:58:31<24:29:55,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34319/203307 [4:58:31<24:29:55,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34320/203307 [4:58:35<24:30:15,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34320/203307 [4:58:35<24:30:15,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34321/203307 [4:58:40<24:30:33,  1.92it/s, v_num=line, training/loss=0.0755]Epoch 0:  17%|█▋        | 34321/203307 [4:58:40<24:30:33,  1.92it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34322/203307 [4:58:43<24:30:48,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34322/203307 [4:58:43<24:30:49,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34323/203307 [4:58:48<24:31:07,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34323/203307 [4:58:48<24:31:07,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34324/203307 [4:58:52<24:31:22,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34324/203307 [4:58:52<24:31:22,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34325/203307 [4:58:55<24:31:37,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34325/203307 [4:58:55<24:31:37,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34326/203307 [4:58:59<24:31:53,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34326/203307 [4:58:59<24:31:53,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34327/203307 [4:59:03<24:32:08,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34327/203307 [4:59:03<24:32:08,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34328/203307 [4:59:06<24:32:23,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34328/203307 [4:59:06<24:32:23,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34329/203307 [4:59:11<24:32:42,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34329/203307 [4:59:11<24:32:42,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34330/203307 [4:59:15<24:32:57,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34330/203307 [4:59:15<24:32:57,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34331/203307 [4:59:18<24:33:13,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34331/203307 [4:59:18<24:33:13,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34332/203307 [4:59:23<24:33:31,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34332/203307 [4:59:23<24:33:31,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34333/203307 [4:59:26<24:33:46,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34333/203307 [4:59:26<24:33:46,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34334/203307 [4:59:30<24:34:01,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34334/203307 [4:59:30<24:34:01,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34335/203307 [4:59:34<24:34:16,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34335/203307 [4:59:34<24:34:16,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34336/203307 [4:59:38<24:34:31,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34336/203307 [4:59:38<24:34:31,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34337/203307 [4:59:42<24:34:50,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34337/203307 [4:59:42<24:34:50,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34338/203307 [4:59:46<24:35:08,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34338/203307 [4:59:46<24:35:08,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34339/203307 [4:59:50<24:35:24,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34339/203307 [4:59:50<24:35:24,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34340/203307 [4:59:54<24:35:42,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34340/203307 [4:59:54<24:35:42,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34341/203307 [4:59:59<24:36:00,  1.91it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34341/203307 [4:59:59<24:36:00,  1.91it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34342/203307 [5:00:02<24:36:15,  1.91it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34342/203307 [5:00:02<24:36:15,  1.91it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34343/203307 [5:00:06<24:36:30,  1.91it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34343/203307 [5:00:06<24:36:30,  1.91it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34344/203307 [5:00:10<24:36:46,  1.91it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34344/203307 [5:00:10<24:36:46,  1.91it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34345/203307 [5:00:14<24:37:01,  1.91it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34345/203307 [5:00:14<24:37:01,  1.91it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34346/203307 [5:00:18<24:37:20,  1.91it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34346/203307 [5:00:18<24:37:20,  1.91it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34347/203307 [5:00:22<24:37:35,  1.91it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34347/203307 [5:00:22<24:37:35,  1.91it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34348/203307 [5:00:26<24:37:53,  1.91it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34348/203307 [5:00:26<24:37:53,  1.91it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34349/203307 [5:00:30<24:38:09,  1.91it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34349/203307 [5:00:30<24:38:09,  1.91it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34350/203307 [5:00:34<24:38:27,  1.90it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34350/203307 [5:00:34<24:38:27,  1.90it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34351/203307 [5:00:38<24:38:43,  1.90it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34351/203307 [5:00:38<24:38:43,  1.90it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34352/203307 [5:00:42<24:38:58,  1.90it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34352/203307 [5:00:42<24:38:58,  1.90it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34353/203307 [5:00:46<24:39:13,  1.90it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34353/203307 [5:00:46<24:39:13,  1.90it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34354/203307 [5:00:50<24:39:32,  1.90it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34354/203307 [5:00:50<24:39:32,  1.90it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34355/203307 [5:00:54<24:39:51,  1.90it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34355/203307 [5:00:54<24:39:51,  1.90it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34356/203307 [5:00:58<24:40:06,  1.90it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34356/203307 [5:00:58<24:40:06,  1.90it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34357/203307 [5:01:03<24:40:25,  1.90it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34357/203307 [5:01:03<24:40:25,  1.90it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34358/203307 [5:01:06<24:40:40,  1.90it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34358/203307 [5:01:06<24:40:40,  1.90it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34359/203307 [5:01:11<24:40:58,  1.90it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34359/203307 [5:01:11<24:40:58,  1.90it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34360/203307 [5:01:14<24:41:13,  1.90it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34360/203307 [5:01:14<24:41:14,  1.90it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34361/203307 [5:01:18<24:41:29,  1.90it/s, v_num=line, training/loss=0.0839]Epoch 0:  17%|█▋        | 34361/203307 [5:01:18<24:41:29,  1.90it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34362/203307 [5:01:22<24:41:44,  1.90it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34362/203307 [5:01:22<24:41:44,  1.90it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34363/203307 [5:01:26<24:42:03,  1.90it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34363/203307 [5:01:26<24:42:03,  1.90it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34364/203307 [5:01:30<24:42:18,  1.90it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34364/203307 [5:01:30<24:42:18,  1.90it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34365/203307 [5:01:34<24:42:35,  1.90it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34365/203307 [5:01:34<24:42:35,  1.90it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34366/203307 [5:01:38<24:42:51,  1.90it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34366/203307 [5:01:38<24:42:51,  1.90it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34367/203307 [5:01:42<24:43:06,  1.90it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34367/203307 [5:01:42<24:43:06,  1.90it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34368/203307 [5:01:46<24:43:24,  1.90it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34368/203307 [5:01:46<24:43:24,  1.90it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34369/203307 [5:01:50<24:43:39,  1.90it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34369/203307 [5:01:50<24:43:39,  1.90it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34370/203307 [5:01:54<24:43:55,  1.90it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34370/203307 [5:01:54<24:43:55,  1.90it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34371/203307 [5:01:58<24:44:13,  1.90it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34371/203307 [5:01:58<24:44:13,  1.90it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34372/203307 [5:02:02<24:44:32,  1.90it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34372/203307 [5:02:02<24:44:32,  1.90it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34373/203307 [5:02:07<24:44:50,  1.90it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34373/203307 [5:02:07<24:44:50,  1.90it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34374/203307 [5:02:10<24:45:05,  1.90it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34374/203307 [5:02:10<24:45:05,  1.90it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34375/203307 [5:02:14<24:45:20,  1.90it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34375/203307 [5:02:14<24:45:20,  1.90it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34376/203307 [5:02:18<24:45:35,  1.90it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34376/203307 [5:02:18<24:45:35,  1.90it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34377/203307 [5:02:22<24:45:53,  1.89it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34377/203307 [5:02:22<24:45:53,  1.89it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34378/203307 [5:02:26<24:46:08,  1.89it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34378/203307 [5:02:26<24:46:08,  1.89it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34379/203307 [5:02:30<24:46:26,  1.89it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34379/203307 [5:02:30<24:46:26,  1.89it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34380/203307 [5:02:34<24:46:41,  1.89it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34380/203307 [5:02:34<24:46:41,  1.89it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34381/203307 [5:02:38<24:47:00,  1.89it/s, v_num=line, training/loss=0.0873]Epoch 0:  17%|█▋        | 34381/203307 [5:02:38<24:47:01,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34382/203307 [5:02:43<24:47:19,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34382/203307 [5:02:43<24:47:19,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34383/203307 [5:02:46<24:47:34,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34383/203307 [5:02:46<24:47:34,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34384/203307 [5:02:50<24:47:49,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34384/203307 [5:02:50<24:47:49,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34385/203307 [5:02:54<24:48:04,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34385/203307 [5:02:54<24:48:04,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34386/203307 [5:02:58<24:48:22,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34386/203307 [5:02:58<24:48:22,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34387/203307 [5:03:02<24:48:37,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34387/203307 [5:03:02<24:48:37,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34388/203307 [5:03:06<24:48:55,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34388/203307 [5:03:06<24:48:55,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34389/203307 [5:03:11<24:49:14,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34389/203307 [5:03:11<24:49:14,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34390/203307 [5:03:15<24:49:32,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34390/203307 [5:03:15<24:49:32,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34391/203307 [5:03:19<24:49:47,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34391/203307 [5:03:19<24:49:47,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34392/203307 [5:03:22<24:50:02,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34392/203307 [5:03:22<24:50:02,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34393/203307 [5:03:26<24:50:18,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34393/203307 [5:03:26<24:50:18,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34394/203307 [5:03:30<24:50:33,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34394/203307 [5:03:30<24:50:33,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34395/203307 [5:03:34<24:50:51,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34395/203307 [5:03:34<24:50:51,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34396/203307 [5:03:39<24:51:09,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34396/203307 [5:03:39<24:51:09,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34397/203307 [5:03:42<24:51:24,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34397/203307 [5:03:42<24:51:24,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34398/203307 [5:03:47<24:51:43,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34398/203307 [5:03:47<24:51:43,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34399/203307 [5:03:50<24:51:58,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34399/203307 [5:03:50<24:51:58,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34400/203307 [5:03:54<24:52:13,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34400/203307 [5:03:54<24:52:13,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34401/203307 [5:03:58<24:52:28,  1.89it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34401/203307 [5:03:58<24:52:28,  1.89it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34402/203307 [5:04:02<24:52:43,  1.89it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34402/203307 [5:04:02<24:52:43,  1.89it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34403/203307 [5:04:05<24:52:59,  1.89it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34403/203307 [5:04:05<24:52:59,  1.89it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34404/203307 [5:04:10<24:53:17,  1.89it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34404/203307 [5:04:10<24:53:17,  1.89it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34405/203307 [5:04:14<24:53:33,  1.88it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34405/203307 [5:04:14<24:53:33,  1.88it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34406/203307 [5:04:17<24:53:48,  1.88it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34406/203307 [5:04:17<24:53:48,  1.88it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34407/203307 [5:04:22<24:54:07,  1.88it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34407/203307 [5:04:22<24:54:07,  1.88it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34408/203307 [5:04:25<24:54:22,  1.88it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34408/203307 [5:04:25<24:54:22,  1.88it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34409/203307 [5:04:29<24:54:37,  1.88it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34409/203307 [5:04:29<24:54:37,  1.88it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34410/203307 [5:04:33<24:54:52,  1.88it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34410/203307 [5:04:33<24:54:53,  1.88it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34411/203307 [5:04:37<24:55:08,  1.88it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34411/203307 [5:04:37<24:55:08,  1.88it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34412/203307 [5:04:40<24:55:23,  1.88it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34412/203307 [5:04:41<24:55:23,  1.88it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34413/203307 [5:04:45<24:55:42,  1.88it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34413/203307 [5:04:45<24:55:42,  1.88it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34414/203307 [5:04:49<24:55:57,  1.88it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34414/203307 [5:04:49<24:55:57,  1.88it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34415/203307 [5:04:53<24:56:16,  1.88it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34415/203307 [5:04:53<24:56:16,  1.88it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34416/203307 [5:04:57<24:56:32,  1.88it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34416/203307 [5:04:57<24:56:32,  1.88it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34417/203307 [5:05:01<24:56:47,  1.88it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34417/203307 [5:05:01<24:56:47,  1.88it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34418/203307 [5:05:05<24:57:03,  1.88it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34418/203307 [5:05:05<24:57:03,  1.88it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34419/203307 [5:05:09<24:57:19,  1.88it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34419/203307 [5:05:09<24:57:19,  1.88it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34420/203307 [5:05:12<24:57:34,  1.88it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34420/203307 [5:05:12<24:57:34,  1.88it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34421/203307 [5:05:17<24:57:52,  1.88it/s, v_num=line, training/loss=0.0846]Epoch 0:  17%|█▋        | 34421/203307 [5:05:17<24:57:52,  1.88it/s, v_num=line, training/loss=0.083] Epoch 0:  17%|█▋        | 34422/203307 [5:05:21<24:58:10,  1.88it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34422/203307 [5:05:21<24:58:10,  1.88it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34423/203307 [5:05:25<24:58:29,  1.88it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34423/203307 [5:05:25<24:58:29,  1.88it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34424/203307 [5:05:30<24:58:47,  1.88it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34424/203307 [5:05:30<24:58:47,  1.88it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34425/203307 [5:05:34<24:59:04,  1.88it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34425/203307 [5:05:34<24:59:04,  1.88it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34426/203307 [5:05:38<24:59:19,  1.88it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34426/203307 [5:05:38<24:59:19,  1.88it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34427/203307 [5:05:41<24:59:35,  1.88it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34427/203307 [5:05:41<24:59:35,  1.88it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34428/203307 [5:05:45<24:59:50,  1.88it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34428/203307 [5:05:45<24:59:50,  1.88it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34429/203307 [5:05:49<25:00:08,  1.88it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34429/203307 [5:05:49<25:00:08,  1.88it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34430/203307 [5:05:53<25:00:23,  1.88it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34430/203307 [5:05:53<25:00:23,  1.88it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34431/203307 [5:05:57<25:00:41,  1.88it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34431/203307 [5:05:58<25:00:41,  1.88it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34432/203307 [5:06:02<25:01:00,  1.88it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34432/203307 [5:06:02<25:01:00,  1.88it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34433/203307 [5:06:06<25:01:19,  1.87it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34433/203307 [5:06:06<25:01:19,  1.87it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34434/203307 [5:06:10<25:01:34,  1.87it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34434/203307 [5:06:10<25:01:34,  1.87it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34435/203307 [5:06:14<25:01:49,  1.87it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34435/203307 [5:06:14<25:01:49,  1.87it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34436/203307 [5:06:18<25:02:05,  1.87it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34436/203307 [5:06:18<25:02:05,  1.87it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34437/203307 [5:06:22<25:02:20,  1.87it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34437/203307 [5:06:22<25:02:20,  1.87it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34438/203307 [5:06:26<25:02:39,  1.87it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34438/203307 [5:06:26<25:02:39,  1.87it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34439/203307 [5:06:30<25:02:54,  1.87it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34439/203307 [5:06:30<25:02:54,  1.87it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34440/203307 [5:06:34<25:03:12,  1.87it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34440/203307 [5:06:34<25:03:12,  1.87it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34441/203307 [5:06:39<25:03:31,  1.87it/s, v_num=line, training/loss=0.083]Epoch 0:  17%|█▋        | 34441/203307 [5:06:39<25:03:31,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34442/203307 [5:06:42<25:03:47,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34442/203307 [5:06:42<25:03:47,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34443/203307 [5:06:46<25:04:02,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34443/203307 [5:06:46<25:04:02,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34444/203307 [5:06:50<25:04:17,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34444/203307 [5:06:50<25:04:17,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34445/203307 [5:06:54<25:04:33,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34445/203307 [5:06:54<25:04:33,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34446/203307 [5:06:58<25:04:52,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34446/203307 [5:06:58<25:04:52,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34447/203307 [5:07:02<25:05:07,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34447/203307 [5:07:02<25:05:07,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34448/203307 [5:07:06<25:05:25,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34448/203307 [5:07:06<25:05:25,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34449/203307 [5:07:11<25:05:43,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34449/203307 [5:07:11<25:05:43,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34450/203307 [5:07:15<25:06:01,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34450/203307 [5:07:15<25:06:01,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34451/203307 [5:07:19<25:06:16,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34451/203307 [5:07:19<25:06:16,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34452/203307 [5:07:22<25:06:31,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34452/203307 [5:07:22<25:06:31,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34453/203307 [5:07:26<25:06:46,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34453/203307 [5:07:26<25:06:46,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34454/203307 [5:07:30<25:07:04,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34454/203307 [5:07:30<25:07:04,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34455/203307 [5:07:34<25:07:19,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34455/203307 [5:07:34<25:07:19,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34456/203307 [5:07:38<25:07:35,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34456/203307 [5:07:38<25:07:35,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34457/203307 [5:07:42<25:07:53,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34457/203307 [5:07:42<25:07:53,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34458/203307 [5:07:47<25:08:11,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34458/203307 [5:07:47<25:08:11,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34459/203307 [5:07:51<25:08:30,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34459/203307 [5:07:51<25:08:30,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34460/203307 [5:07:55<25:08:45,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34460/203307 [5:07:55<25:08:45,  1.87it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34461/203307 [5:07:58<25:09:00,  1.86it/s, v_num=line, training/loss=0.0832]Epoch 0:  17%|█▋        | 34461/203307 [5:07:58<25:09:00,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34462/203307 [5:08:02<25:09:15,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34462/203307 [5:08:02<25:09:15,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34463/203307 [5:08:07<25:09:33,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34463/203307 [5:08:07<25:09:33,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34464/203307 [5:08:10<25:09:48,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34464/203307 [5:08:10<25:09:48,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34465/203307 [5:08:15<25:10:06,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34465/203307 [5:08:15<25:10:06,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34466/203307 [5:08:18<25:10:20,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34466/203307 [5:08:18<25:10:21,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34467/203307 [5:08:23<25:10:39,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34467/203307 [5:08:23<25:10:39,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34468/203307 [5:08:26<25:10:54,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34468/203307 [5:08:26<25:10:54,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34469/203307 [5:08:30<25:11:09,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34469/203307 [5:08:30<25:11:09,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34470/203307 [5:08:34<25:11:24,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34470/203307 [5:08:34<25:11:24,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34471/203307 [5:08:38<25:11:43,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34471/203307 [5:08:38<25:11:43,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34472/203307 [5:08:42<25:11:58,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34472/203307 [5:08:42<25:11:58,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34473/203307 [5:08:46<25:12:16,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34473/203307 [5:08:46<25:12:16,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34474/203307 [5:08:50<25:12:32,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34474/203307 [5:08:50<25:12:32,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34475/203307 [5:08:54<25:12:47,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34475/203307 [5:08:54<25:12:47,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34476/203307 [5:08:58<25:13:06,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34476/203307 [5:08:58<25:13:06,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34477/203307 [5:09:02<25:13:21,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34477/203307 [5:09:02<25:13:21,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34478/203307 [5:09:06<25:13:37,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34478/203307 [5:09:06<25:13:37,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34479/203307 [5:09:10<25:13:54,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34479/203307 [5:09:10<25:13:54,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34480/203307 [5:09:14<25:14:09,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34480/203307 [5:09:14<25:14:09,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34481/203307 [5:09:18<25:14:24,  1.86it/s, v_num=line, training/loss=0.0888]Epoch 0:  17%|█▋        | 34481/203307 [5:09:18<25:14:24,  1.86it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34482/203307 [5:09:22<25:14:43,  1.86it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34482/203307 [5:09:22<25:14:43,  1.86it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34483/203307 [5:09:26<25:14:58,  1.86it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34483/203307 [5:09:26<25:14:58,  1.86it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34484/203307 [5:09:30<25:15:13,  1.86it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34484/203307 [5:09:30<25:15:13,  1.86it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34485/203307 [5:09:34<25:15:32,  1.86it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34485/203307 [5:09:34<25:15:32,  1.86it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34486/203307 [5:09:38<25:15:47,  1.86it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34486/203307 [5:09:38<25:15:47,  1.86it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34487/203307 [5:09:42<25:16:03,  1.86it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34487/203307 [5:09:42<25:16:03,  1.86it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34488/203307 [5:09:46<25:16:21,  1.86it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34488/203307 [5:09:46<25:16:21,  1.86it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34489/203307 [5:09:50<25:16:36,  1.86it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34489/203307 [5:09:50<25:16:36,  1.86it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34490/203307 [5:09:54<25:16:55,  1.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34490/203307 [5:09:54<25:16:55,  1.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34491/203307 [5:09:58<25:17:10,  1.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34491/203307 [5:09:58<25:17:10,  1.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34492/203307 [5:10:02<25:17:25,  1.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34492/203307 [5:10:02<25:17:25,  1.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34493/203307 [5:10:06<25:17:45,  1.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34493/203307 [5:10:06<25:17:45,  1.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34494/203307 [5:10:11<25:18:03,  1.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34494/203307 [5:10:11<25:18:03,  1.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34495/203307 [5:10:15<25:18:18,  1.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34495/203307 [5:10:15<25:18:18,  1.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34496/203307 [5:10:19<25:18:36,  1.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34496/203307 [5:10:19<25:18:36,  1.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34497/203307 [5:10:23<25:18:51,  1.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34497/203307 [5:10:23<25:18:51,  1.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34498/203307 [5:10:27<25:19:09,  1.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34498/203307 [5:10:27<25:19:09,  1.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34499/203307 [5:10:31<25:19:25,  1.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34499/203307 [5:10:31<25:19:25,  1.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34500/203307 [5:10:35<25:19:40,  1.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34500/203307 [5:10:35<25:19:40,  1.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34501/203307 [5:10:38<25:19:55,  1.85it/s, v_num=line, training/loss=0.0852]Epoch 0:  17%|█▋        | 34501/203307 [5:10:38<25:19:55,  1.85it/s, v_num=line, training/loss=0.092] Epoch 0:  17%|█▋        | 34502/203307 [5:10:43<25:20:15,  1.85it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34502/203307 [5:10:43<25:20:15,  1.85it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34503/203307 [5:10:47<25:20:33,  1.85it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34503/203307 [5:10:47<25:20:33,  1.85it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34504/203307 [5:10:52<25:20:51,  1.85it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34504/203307 [5:10:52<25:20:51,  1.85it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34505/203307 [5:10:55<25:21:06,  1.85it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34505/203307 [5:10:55<25:21:06,  1.85it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34506/203307 [5:10:59<25:21:21,  1.85it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34506/203307 [5:10:59<25:21:21,  1.85it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34507/203307 [5:11:03<25:21:39,  1.85it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34507/203307 [5:11:03<25:21:39,  1.85it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34508/203307 [5:11:07<25:21:55,  1.85it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34508/203307 [5:11:07<25:21:55,  1.85it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34509/203307 [5:11:11<25:22:10,  1.85it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34509/203307 [5:11:11<25:22:10,  1.85it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34510/203307 [5:11:15<25:22:25,  1.85it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34510/203307 [5:11:15<25:22:25,  1.85it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34511/203307 [5:11:19<25:22:44,  1.85it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34511/203307 [5:11:19<25:22:44,  1.85it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34512/203307 [5:11:24<25:23:02,  1.85it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34512/203307 [5:11:24<25:23:02,  1.85it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34513/203307 [5:11:28<25:23:20,  1.85it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34513/203307 [5:11:28<25:23:20,  1.85it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34514/203307 [5:11:32<25:23:35,  1.85it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34514/203307 [5:11:32<25:23:35,  1.85it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34515/203307 [5:11:36<25:23:53,  1.85it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34515/203307 [5:11:36<25:23:54,  1.85it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34516/203307 [5:11:40<25:24:08,  1.85it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34516/203307 [5:11:40<25:24:08,  1.85it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34517/203307 [5:11:44<25:24:24,  1.85it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34517/203307 [5:11:44<25:24:24,  1.85it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34518/203307 [5:11:47<25:24:39,  1.85it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34518/203307 [5:11:47<25:24:39,  1.85it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34519/203307 [5:11:52<25:24:58,  1.84it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34519/203307 [5:11:52<25:24:58,  1.84it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34520/203307 [5:11:56<25:25:12,  1.84it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34520/203307 [5:11:56<25:25:13,  1.84it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34521/203307 [5:12:00<25:25:31,  1.84it/s, v_num=line, training/loss=0.092]Epoch 0:  17%|█▋        | 34521/203307 [5:12:00<25:25:31,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34522/203307 [5:12:04<25:25:46,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34522/203307 [5:12:04<25:25:46,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34523/203307 [5:12:08<25:26:04,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34523/203307 [5:12:08<25:26:04,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34524/203307 [5:12:12<25:26:20,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34524/203307 [5:12:12<25:26:20,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34525/203307 [5:12:16<25:26:35,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34525/203307 [5:12:16<25:26:35,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34526/203307 [5:12:19<25:26:50,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34526/203307 [5:12:19<25:26:50,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34527/203307 [5:12:23<25:27:05,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34527/203307 [5:12:23<25:27:05,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34528/203307 [5:12:28<25:27:24,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34528/203307 [5:12:28<25:27:24,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34529/203307 [5:12:32<25:27:43,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34529/203307 [5:12:32<25:27:43,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34530/203307 [5:12:36<25:28:00,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34530/203307 [5:12:36<25:28:01,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34531/203307 [5:12:40<25:28:15,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34531/203307 [5:12:40<25:28:16,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34532/203307 [5:12:45<25:28:33,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34532/203307 [5:12:45<25:28:34,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34533/203307 [5:12:48<25:28:49,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34533/203307 [5:12:48<25:28:49,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34534/203307 [5:12:52<25:29:04,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34534/203307 [5:12:52<25:29:04,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34535/203307 [5:12:56<25:29:19,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34535/203307 [5:12:56<25:29:19,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34536/203307 [5:13:00<25:29:35,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34536/203307 [5:13:00<25:29:35,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34537/203307 [5:13:04<25:29:54,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34537/203307 [5:13:04<25:29:54,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34538/203307 [5:13:09<25:30:12,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34538/203307 [5:13:09<25:30:12,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34539/203307 [5:13:13<25:30:29,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34539/203307 [5:13:13<25:30:29,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34540/203307 [5:13:17<25:30:47,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34540/203307 [5:13:17<25:30:47,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34541/203307 [5:13:21<25:31:02,  1.84it/s, v_num=line, training/loss=0.0762]Epoch 0:  17%|█▋        | 34541/203307 [5:13:21<25:31:03,  1.84it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34542/203307 [5:13:25<25:31:17,  1.84it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34542/203307 [5:13:25<25:31:17,  1.84it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34543/203307 [5:13:28<25:31:33,  1.84it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34543/203307 [5:13:28<25:31:33,  1.84it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34544/203307 [5:13:32<25:31:48,  1.84it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34544/203307 [5:13:32<25:31:48,  1.84it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34545/203307 [5:13:37<25:32:07,  1.84it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34545/203307 [5:13:37<25:32:07,  1.84it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34546/203307 [5:13:41<25:32:25,  1.84it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34546/203307 [5:13:41<25:32:25,  1.84it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34547/203307 [5:13:45<25:32:40,  1.84it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34547/203307 [5:13:45<25:32:40,  1.84it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34548/203307 [5:13:49<25:32:58,  1.83it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34548/203307 [5:13:49<25:32:58,  1.83it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34549/203307 [5:13:53<25:33:14,  1.83it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34549/203307 [5:13:53<25:33:14,  1.83it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34550/203307 [5:13:57<25:33:29,  1.83it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34550/203307 [5:13:57<25:33:29,  1.83it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34551/203307 [5:14:00<25:33:44,  1.83it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34551/203307 [5:14:00<25:33:44,  1.83it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34552/203307 [5:14:04<25:33:59,  1.83it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34552/203307 [5:14:04<25:33:59,  1.83it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34553/203307 [5:14:08<25:34:14,  1.83it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34553/203307 [5:14:08<25:34:14,  1.83it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34554/203307 [5:14:13<25:34:33,  1.83it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34554/203307 [5:14:13<25:34:33,  1.83it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34555/203307 [5:14:16<25:34:48,  1.83it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34555/203307 [5:14:16<25:34:48,  1.83it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34556/203307 [5:14:20<25:35:03,  1.83it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34556/203307 [5:14:20<25:35:03,  1.83it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34557/203307 [5:14:24<25:35:21,  1.83it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34557/203307 [5:14:24<25:35:21,  1.83it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34558/203307 [5:14:28<25:35:37,  1.83it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34558/203307 [5:14:28<25:35:37,  1.83it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34559/203307 [5:14:32<25:35:52,  1.83it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34559/203307 [5:14:32<25:35:52,  1.83it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34560/203307 [5:14:36<25:36:07,  1.83it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34560/203307 [5:14:36<25:36:07,  1.83it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34561/203307 [5:14:39<25:36:22,  1.83it/s, v_num=line, training/loss=0.0928]Epoch 0:  17%|█▋        | 34561/203307 [5:14:39<25:36:22,  1.83it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34562/203307 [5:14:43<25:36:38,  1.83it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34562/203307 [5:14:43<25:36:38,  1.83it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34563/203307 [5:14:48<25:36:56,  1.83it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34563/203307 [5:14:48<25:36:57,  1.83it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34564/203307 [5:14:52<25:37:12,  1.83it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34564/203307 [5:14:52<25:37:12,  1.83it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34565/203307 [5:14:56<25:37:30,  1.83it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34565/203307 [5:14:56<25:37:30,  1.83it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34566/203307 [5:15:00<25:37:48,  1.83it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34566/203307 [5:15:00<25:37:48,  1.83it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34567/203307 [5:15:04<25:38:04,  1.83it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34567/203307 [5:15:04<25:38:04,  1.83it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34568/203307 [5:15:08<25:38:19,  1.83it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34568/203307 [5:15:08<25:38:19,  1.83it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34569/203307 [5:15:12<25:38:34,  1.83it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34569/203307 [5:15:12<25:38:34,  1.83it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34570/203307 [5:15:16<25:38:50,  1.83it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34570/203307 [5:15:16<25:38:50,  1.83it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34571/203307 [5:15:20<25:39:09,  1.83it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34571/203307 [5:15:20<25:39:09,  1.83it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34572/203307 [5:15:24<25:39:24,  1.83it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34572/203307 [5:15:24<25:39:24,  1.83it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34573/203307 [5:15:28<25:39:42,  1.83it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34573/203307 [5:15:28<25:39:42,  1.83it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34574/203307 [5:15:32<25:39:57,  1.83it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34574/203307 [5:15:32<25:39:57,  1.83it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34575/203307 [5:15:36<25:40:15,  1.83it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34575/203307 [5:15:36<25:40:15,  1.83it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34576/203307 [5:15:40<25:40:30,  1.83it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34576/203307 [5:15:40<25:40:30,  1.83it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34577/203307 [5:15:44<25:40:45,  1.83it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34577/203307 [5:15:44<25:40:45,  1.83it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34578/203307 [5:15:48<25:41:00,  1.82it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34578/203307 [5:15:48<25:41:00,  1.82it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34579/203307 [5:15:52<25:41:18,  1.82it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34579/203307 [5:15:52<25:41:18,  1.82it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34580/203307 [5:15:56<25:41:37,  1.82it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34580/203307 [5:15:57<25:41:37,  1.82it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34581/203307 [5:16:00<25:41:52,  1.82it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 34581/203307 [5:16:00<25:41:52,  1.82it/s, v_num=line, training/loss=0.096] Epoch 0:  17%|█▋        | 34582/203307 [5:16:05<25:42:10,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34582/203307 [5:16:05<25:42:10,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34583/203307 [5:16:08<25:42:25,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34583/203307 [5:16:08<25:42:25,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34584/203307 [5:16:13<25:42:42,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34584/203307 [5:16:13<25:42:42,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34585/203307 [5:16:16<25:42:57,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34585/203307 [5:16:16<25:42:57,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34586/203307 [5:16:20<25:43:12,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34586/203307 [5:16:20<25:43:12,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34587/203307 [5:16:24<25:43:27,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34587/203307 [5:16:24<25:43:27,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34588/203307 [5:16:28<25:43:46,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34588/203307 [5:16:28<25:43:46,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34589/203307 [5:16:33<25:44:04,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34589/203307 [5:16:33<25:44:04,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34590/203307 [5:16:37<25:44:22,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34590/203307 [5:16:37<25:44:22,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34591/203307 [5:16:41<25:44:38,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34591/203307 [5:16:41<25:44:38,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34592/203307 [5:16:45<25:44:53,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34592/203307 [5:16:45<25:44:53,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34593/203307 [5:16:49<25:45:11,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34593/203307 [5:16:49<25:45:11,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34594/203307 [5:16:53<25:45:27,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34594/203307 [5:16:53<25:45:27,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34595/203307 [5:16:57<25:45:42,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34595/203307 [5:16:57<25:45:42,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34596/203307 [5:17:01<25:46:00,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34596/203307 [5:17:01<25:46:00,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34597/203307 [5:17:06<25:46:19,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34597/203307 [5:17:06<25:46:19,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34598/203307 [5:17:10<25:46:37,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34598/203307 [5:17:10<25:46:37,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34599/203307 [5:17:14<25:46:52,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34599/203307 [5:17:14<25:46:52,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34600/203307 [5:17:18<25:47:07,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34600/203307 [5:17:18<25:47:07,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34601/203307 [5:17:21<25:47:23,  1.82it/s, v_num=line, training/loss=0.096]Epoch 0:  17%|█▋        | 34601/203307 [5:17:21<25:47:23,  1.82it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34602/203307 [5:17:26<25:47:41,  1.82it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34602/203307 [5:17:26<25:47:41,  1.82it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34603/203307 [5:17:29<25:47:56,  1.82it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34603/203307 [5:17:29<25:47:56,  1.82it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34604/203307 [5:17:34<25:48:14,  1.82it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34604/203307 [5:17:34<25:48:14,  1.82it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34605/203307 [5:17:38<25:48:29,  1.82it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34605/203307 [5:17:38<25:48:29,  1.82it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34606/203307 [5:17:42<25:48:48,  1.82it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34606/203307 [5:17:42<25:48:48,  1.82it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34607/203307 [5:17:46<25:49:05,  1.82it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34607/203307 [5:17:46<25:49:05,  1.82it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34608/203307 [5:17:50<25:49:20,  1.81it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34608/203307 [5:17:50<25:49:20,  1.81it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34609/203307 [5:17:54<25:49:35,  1.81it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34609/203307 [5:17:54<25:49:35,  1.81it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34610/203307 [5:17:57<25:49:50,  1.81it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34610/203307 [5:17:57<25:49:50,  1.81it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34611/203307 [5:18:02<25:50:08,  1.81it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34611/203307 [5:18:02<25:50:08,  1.81it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34612/203307 [5:18:06<25:50:23,  1.81it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34612/203307 [5:18:06<25:50:23,  1.81it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34613/203307 [5:18:10<25:50:41,  1.81it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34613/203307 [5:18:10<25:50:41,  1.81it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34614/203307 [5:18:14<25:50:56,  1.81it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34614/203307 [5:18:14<25:50:56,  1.81it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34615/203307 [5:18:18<25:51:14,  1.81it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34615/203307 [5:18:18<25:51:14,  1.81it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34616/203307 [5:18:22<25:51:29,  1.81it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34616/203307 [5:18:22<25:51:29,  1.81it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34617/203307 [5:18:26<25:51:44,  1.81it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34617/203307 [5:18:26<25:51:44,  1.81it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34618/203307 [5:18:29<25:51:59,  1.81it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34618/203307 [5:18:29<25:51:59,  1.81it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34619/203307 [5:18:33<25:52:14,  1.81it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34619/203307 [5:18:33<25:52:14,  1.81it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34620/203307 [5:18:37<25:52:32,  1.81it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34620/203307 [5:18:37<25:52:32,  1.81it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34621/203307 [5:18:42<25:52:50,  1.81it/s, v_num=line, training/loss=0.0779]Epoch 0:  17%|█▋        | 34621/203307 [5:18:42<25:52:50,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34622/203307 [5:18:46<25:53:05,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34622/203307 [5:18:46<25:53:05,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34623/203307 [5:18:50<25:53:24,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34623/203307 [5:18:50<25:53:24,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34624/203307 [5:18:54<25:53:39,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34624/203307 [5:18:54<25:53:39,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34625/203307 [5:18:58<25:53:54,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34625/203307 [5:18:58<25:53:54,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34626/203307 [5:19:01<25:54:09,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34626/203307 [5:19:01<25:54:09,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34627/203307 [5:19:05<25:54:25,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34627/203307 [5:19:05<25:54:25,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34628/203307 [5:19:09<25:54:40,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34628/203307 [5:19:09<25:54:40,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34629/203307 [5:19:13<25:54:59,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34629/203307 [5:19:13<25:54:59,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34630/203307 [5:19:17<25:55:14,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34630/203307 [5:19:17<25:55:14,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34631/203307 [5:19:21<25:55:29,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34631/203307 [5:19:21<25:55:29,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34632/203307 [5:19:26<25:55:48,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34632/203307 [5:19:26<25:55:48,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34633/203307 [5:19:29<25:56:03,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34633/203307 [5:19:29<25:56:03,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34634/203307 [5:19:33<25:56:18,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34634/203307 [5:19:33<25:56:18,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34635/203307 [5:19:37<25:56:34,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34635/203307 [5:19:37<25:56:34,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34636/203307 [5:19:41<25:56:50,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34636/203307 [5:19:41<25:56:50,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34637/203307 [5:19:45<25:57:05,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34637/203307 [5:19:45<25:57:05,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34638/203307 [5:19:49<25:57:23,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34638/203307 [5:19:49<25:57:23,  1.81it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34639/203307 [5:19:53<25:57:38,  1.80it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34639/203307 [5:19:53<25:57:39,  1.80it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34640/203307 [5:19:57<25:57:56,  1.80it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34640/203307 [5:19:57<25:57:56,  1.80it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34641/203307 [5:20:02<25:58:15,  1.80it/s, v_num=line, training/loss=0.0883]Epoch 0:  17%|█▋        | 34641/203307 [5:20:02<25:58:15,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34642/203307 [5:20:06<25:58:30,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34642/203307 [5:20:06<25:58:30,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34643/203307 [5:20:09<25:58:45,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34643/203307 [5:20:09<25:58:45,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34644/203307 [5:20:13<25:59:00,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34644/203307 [5:20:13<25:59:00,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34645/203307 [5:20:17<25:59:15,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34645/203307 [5:20:17<25:59:15,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34646/203307 [5:20:21<25:59:34,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34646/203307 [5:20:21<25:59:34,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34647/203307 [5:20:26<25:59:52,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34647/203307 [5:20:26<25:59:52,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34648/203307 [5:20:30<26:00:10,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34648/203307 [5:20:30<26:00:10,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34649/203307 [5:20:35<26:00:28,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34649/203307 [5:20:35<26:00:28,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34650/203307 [5:20:38<26:00:43,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34650/203307 [5:20:38<26:00:43,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34651/203307 [5:20:42<26:00:59,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34651/203307 [5:20:42<26:00:59,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34652/203307 [5:20:46<26:01:13,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34652/203307 [5:20:46<26:01:14,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34653/203307 [5:20:50<26:01:29,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34653/203307 [5:20:50<26:01:29,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34654/203307 [5:20:54<26:01:47,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34654/203307 [5:20:54<26:01:47,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34655/203307 [5:20:58<26:02:02,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34655/203307 [5:20:58<26:02:02,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34656/203307 [5:21:02<26:02:20,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34656/203307 [5:21:02<26:02:20,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34657/203307 [5:21:06<26:02:38,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34657/203307 [5:21:07<26:02:38,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34658/203307 [5:21:11<26:02:56,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34658/203307 [5:21:11<26:02:56,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34659/203307 [5:21:15<26:03:11,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34659/203307 [5:21:15<26:03:11,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34660/203307 [5:21:18<26:03:25,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34660/203307 [5:21:18<26:03:25,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34661/203307 [5:21:22<26:03:41,  1.80it/s, v_num=line, training/loss=0.0831]Epoch 0:  17%|█▋        | 34661/203307 [5:21:22<26:03:41,  1.80it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34662/203307 [5:21:26<26:03:56,  1.80it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34662/203307 [5:21:26<26:03:56,  1.80it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34663/203307 [5:21:30<26:04:14,  1.80it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34663/203307 [5:21:30<26:04:14,  1.80it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34664/203307 [5:21:34<26:04:29,  1.80it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34664/203307 [5:21:34<26:04:29,  1.80it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34665/203307 [5:21:38<26:04:47,  1.80it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34665/203307 [5:21:38<26:04:47,  1.80it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34666/203307 [5:21:42<26:05:02,  1.80it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34666/203307 [5:21:42<26:05:02,  1.80it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34667/203307 [5:21:47<26:05:20,  1.80it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34667/203307 [5:21:47<26:05:20,  1.80it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34668/203307 [5:21:50<26:05:35,  1.80it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34668/203307 [5:21:50<26:05:35,  1.80it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34669/203307 [5:21:54<26:05:50,  1.79it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34669/203307 [5:21:54<26:05:50,  1.79it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34670/203307 [5:21:58<26:06:05,  1.79it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34670/203307 [5:21:58<26:06:05,  1.79it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34671/203307 [5:22:02<26:06:23,  1.79it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34671/203307 [5:22:02<26:06:23,  1.79it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34672/203307 [5:22:06<26:06:37,  1.79it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34672/203307 [5:22:06<26:06:37,  1.79it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34673/203307 [5:22:10<26:06:55,  1.79it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34673/203307 [5:22:10<26:06:55,  1.79it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34674/203307 [5:22:14<26:07:12,  1.79it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34674/203307 [5:22:14<26:07:12,  1.79it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34675/203307 [5:22:19<26:07:30,  1.79it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34675/203307 [5:22:19<26:07:30,  1.79it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34676/203307 [5:22:22<26:07:45,  1.79it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34676/203307 [5:22:22<26:07:45,  1.79it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34677/203307 [5:22:26<26:08:00,  1.79it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34677/203307 [5:22:26<26:08:00,  1.79it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34678/203307 [5:22:30<26:08:15,  1.79it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34678/203307 [5:22:30<26:08:15,  1.79it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34679/203307 [5:22:34<26:08:33,  1.79it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34679/203307 [5:22:34<26:08:33,  1.79it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34680/203307 [5:22:38<26:08:48,  1.79it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34680/203307 [5:22:38<26:08:48,  1.79it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34681/203307 [5:22:42<26:09:02,  1.79it/s, v_num=line, training/loss=0.0847]Epoch 0:  17%|█▋        | 34681/203307 [5:22:42<26:09:02,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34682/203307 [5:22:46<26:09:20,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34682/203307 [5:22:46<26:09:20,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34683/203307 [5:22:50<26:09:38,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34683/203307 [5:22:50<26:09:38,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34684/203307 [5:22:55<26:09:56,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34684/203307 [5:22:55<26:09:56,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34685/203307 [5:22:58<26:10:11,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34685/203307 [5:22:58<26:10:11,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34686/203307 [5:23:02<26:10:25,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34686/203307 [5:23:02<26:10:25,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34687/203307 [5:23:06<26:10:40,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34687/203307 [5:23:06<26:10:40,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34688/203307 [5:23:10<26:10:58,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34688/203307 [5:23:10<26:10:58,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34689/203307 [5:23:14<26:11:12,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34689/203307 [5:23:14<26:11:12,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34690/203307 [5:23:18<26:11:30,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34690/203307 [5:23:18<26:11:30,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34691/203307 [5:23:22<26:11:45,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34691/203307 [5:23:22<26:11:45,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34692/203307 [5:23:26<26:12:02,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34692/203307 [5:23:26<26:12:02,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34693/203307 [5:23:31<26:12:20,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34693/203307 [5:23:31<26:12:21,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34694/203307 [5:23:34<26:12:35,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34694/203307 [5:23:34<26:12:35,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34695/203307 [5:23:38<26:12:50,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34695/203307 [5:23:38<26:12:50,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34696/203307 [5:23:42<26:13:08,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34696/203307 [5:23:42<26:13:08,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34697/203307 [5:23:46<26:13:22,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34697/203307 [5:23:46<26:13:22,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34698/203307 [5:23:50<26:13:40,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34698/203307 [5:23:50<26:13:40,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34699/203307 [5:23:54<26:13:55,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34699/203307 [5:23:54<26:13:55,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34700/203307 [5:23:58<26:14:09,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34700/203307 [5:23:58<26:14:10,  1.79it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34701/203307 [5:24:02<26:14:28,  1.78it/s, v_num=line, training/loss=0.0768]Epoch 0:  17%|█▋        | 34701/203307 [5:24:02<26:14:28,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34702/203307 [5:24:06<26:14:43,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34702/203307 [5:24:06<26:14:43,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34703/203307 [5:24:10<26:14:58,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34703/203307 [5:24:10<26:14:58,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34704/203307 [5:24:14<26:15:16,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34704/203307 [5:24:14<26:15:16,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34705/203307 [5:24:18<26:15:30,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34705/203307 [5:24:18<26:15:30,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34706/203307 [5:24:21<26:15:45,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34706/203307 [5:24:21<26:15:45,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34707/203307 [5:24:26<26:16:03,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34707/203307 [5:24:26<26:16:03,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34708/203307 [5:24:29<26:16:18,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34708/203307 [5:24:29<26:16:18,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34709/203307 [5:24:33<26:16:32,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34709/203307 [5:24:33<26:16:32,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34710/203307 [5:24:38<26:16:51,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34710/203307 [5:24:38<26:16:51,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34711/203307 [5:24:41<26:17:06,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34711/203307 [5:24:41<26:17:06,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34712/203307 [5:24:45<26:17:20,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34712/203307 [5:24:45<26:17:20,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34713/203307 [5:24:49<26:17:38,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34713/203307 [5:24:49<26:17:38,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34714/203307 [5:24:53<26:17:53,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34714/203307 [5:24:53<26:17:53,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34715/203307 [5:24:57<26:18:10,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34715/203307 [5:24:57<26:18:10,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34716/203307 [5:25:01<26:18:25,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34716/203307 [5:25:01<26:18:25,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34717/203307 [5:25:05<26:18:40,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34717/203307 [5:25:05<26:18:40,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34718/203307 [5:25:09<26:18:54,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34718/203307 [5:25:09<26:18:54,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34719/203307 [5:25:13<26:19:13,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34719/203307 [5:25:13<26:19:13,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34720/203307 [5:25:17<26:19:27,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34720/203307 [5:25:17<26:19:27,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34721/203307 [5:25:21<26:19:45,  1.78it/s, v_num=line, training/loss=0.0718]Epoch 0:  17%|█▋        | 34721/203307 [5:25:21<26:19:45,  1.78it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34722/203307 [5:25:25<26:20:00,  1.78it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34722/203307 [5:25:25<26:20:00,  1.78it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34723/203307 [5:25:29<26:20:18,  1.78it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34723/203307 [5:25:29<26:20:18,  1.78it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34724/203307 [5:25:33<26:20:33,  1.78it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34724/203307 [5:25:33<26:20:33,  1.78it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34725/203307 [5:25:37<26:20:48,  1.78it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34725/203307 [5:25:37<26:20:48,  1.78it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34726/203307 [5:25:40<26:21:03,  1.78it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34726/203307 [5:25:40<26:21:03,  1.78it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34727/203307 [5:25:45<26:21:22,  1.78it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34727/203307 [5:25:45<26:21:22,  1.78it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34728/203307 [5:25:49<26:21:39,  1.78it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34728/203307 [5:25:49<26:21:39,  1.78it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34729/203307 [5:25:54<26:21:57,  1.78it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34729/203307 [5:25:54<26:21:57,  1.78it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34730/203307 [5:25:57<26:22:12,  1.78it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34730/203307 [5:25:57<26:22:12,  1.78it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34731/203307 [5:26:01<26:22:26,  1.78it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34731/203307 [5:26:01<26:22:27,  1.78it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34732/203307 [5:26:05<26:22:45,  1.78it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34732/203307 [5:26:05<26:22:45,  1.78it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34733/203307 [5:26:09<26:22:59,  1.77it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34733/203307 [5:26:09<26:22:59,  1.77it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34734/203307 [5:26:13<26:23:14,  1.77it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34734/203307 [5:26:13<26:23:14,  1.77it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34735/203307 [5:26:17<26:23:29,  1.77it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34735/203307 [5:26:17<26:23:29,  1.77it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34736/203307 [5:26:21<26:23:48,  1.77it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34736/203307 [5:26:21<26:23:48,  1.77it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34737/203307 [5:26:25<26:24:05,  1.77it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34737/203307 [5:26:25<26:24:05,  1.77it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34738/203307 [5:26:30<26:24:23,  1.77it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34738/203307 [5:26:30<26:24:23,  1.77it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34739/203307 [5:26:34<26:24:39,  1.77it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34739/203307 [5:26:34<26:24:39,  1.77it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34740/203307 [5:26:38<26:24:57,  1.77it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34740/203307 [5:26:38<26:24:57,  1.77it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34741/203307 [5:26:42<26:25:11,  1.77it/s, v_num=line, training/loss=0.0704]Epoch 0:  17%|█▋        | 34741/203307 [5:26:42<26:25:11,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34742/203307 [5:26:46<26:25:26,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34742/203307 [5:26:46<26:25:26,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34743/203307 [5:26:49<26:25:41,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34743/203307 [5:26:49<26:25:41,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34744/203307 [5:26:53<26:25:56,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34744/203307 [5:26:53<26:25:56,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34745/203307 [5:26:58<26:26:15,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34745/203307 [5:26:58<26:26:15,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34746/203307 [5:27:02<26:26:32,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34746/203307 [5:27:02<26:26:33,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34747/203307 [5:27:06<26:26:47,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34747/203307 [5:27:06<26:26:47,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34748/203307 [5:27:10<26:27:05,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34748/203307 [5:27:10<26:27:05,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34749/203307 [5:27:14<26:27:20,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34749/203307 [5:27:14<26:27:20,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34750/203307 [5:27:18<26:27:35,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34750/203307 [5:27:18<26:27:35,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34751/203307 [5:27:21<26:27:50,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34751/203307 [5:27:21<26:27:50,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34752/203307 [5:27:25<26:28:05,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34752/203307 [5:27:25<26:28:05,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34753/203307 [5:27:30<26:28:24,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34753/203307 [5:27:30<26:28:24,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34754/203307 [5:27:34<26:28:42,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34754/203307 [5:27:34<26:28:42,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34755/203307 [5:27:38<26:29:00,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34755/203307 [5:27:38<26:29:00,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34756/203307 [5:27:42<26:29:14,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34756/203307 [5:27:42<26:29:14,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34757/203307 [5:27:46<26:29:32,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34757/203307 [5:27:46<26:29:32,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34758/203307 [5:27:50<26:29:47,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34758/203307 [5:27:50<26:29:47,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34759/203307 [5:27:54<26:30:02,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34759/203307 [5:27:54<26:30:02,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34760/203307 [5:27:58<26:30:17,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34760/203307 [5:27:58<26:30:17,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34761/203307 [5:28:02<26:30:32,  1.77it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 34761/203307 [5:28:02<26:30:32,  1.77it/s, v_num=line, training/loss=0.074] Epoch 0:  17%|█▋        | 34762/203307 [5:28:06<26:30:50,  1.77it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34762/203307 [5:28:06<26:30:50,  1.77it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34763/203307 [5:28:10<26:31:08,  1.77it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34763/203307 [5:28:10<26:31:08,  1.77it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34764/203307 [5:28:15<26:31:25,  1.77it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34764/203307 [5:28:15<26:31:25,  1.77it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34765/203307 [5:28:19<26:31:42,  1.76it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34765/203307 [5:28:19<26:31:42,  1.76it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34766/203307 [5:28:22<26:31:57,  1.76it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34766/203307 [5:28:22<26:31:57,  1.76it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34767/203307 [5:28:26<26:32:11,  1.76it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34767/203307 [5:28:26<26:32:11,  1.76it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34768/203307 [5:28:30<26:32:26,  1.76it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34768/203307 [5:28:30<26:32:26,  1.76it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34769/203307 [5:28:34<26:32:41,  1.76it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34769/203307 [5:28:34<26:32:41,  1.76it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34770/203307 [5:28:37<26:32:55,  1.76it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34770/203307 [5:28:37<26:32:55,  1.76it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34771/203307 [5:28:42<26:33:14,  1.76it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34771/203307 [5:28:42<26:33:14,  1.76it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34772/203307 [5:28:45<26:33:28,  1.76it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34772/203307 [5:28:45<26:33:28,  1.76it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34773/203307 [5:28:50<26:33:46,  1.76it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34773/203307 [5:28:50<26:33:46,  1.76it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34774/203307 [5:28:53<26:34:01,  1.76it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34774/203307 [5:28:54<26:34:01,  1.76it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34775/203307 [5:28:57<26:34:16,  1.76it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34775/203307 [5:28:57<26:34:16,  1.76it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34776/203307 [5:29:01<26:34:30,  1.76it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34776/203307 [5:29:01<26:34:30,  1.76it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34777/203307 [5:29:05<26:34:46,  1.76it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34777/203307 [5:29:05<26:34:46,  1.76it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34778/203307 [5:29:09<26:35:01,  1.76it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34778/203307 [5:29:09<26:35:01,  1.76it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34779/203307 [5:29:13<26:35:19,  1.76it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34779/203307 [5:29:13<26:35:19,  1.76it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34780/203307 [5:29:17<26:35:34,  1.76it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34780/203307 [5:29:17<26:35:34,  1.76it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34781/203307 [5:29:21<26:35:49,  1.76it/s, v_num=line, training/loss=0.074]Epoch 0:  17%|█▋        | 34781/203307 [5:29:21<26:35:49,  1.76it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34782/203307 [5:29:25<26:36:07,  1.76it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34782/203307 [5:29:25<26:36:07,  1.76it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34783/203307 [5:29:29<26:36:21,  1.76it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34783/203307 [5:29:29<26:36:21,  1.76it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34784/203307 [5:29:32<26:36:36,  1.76it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34784/203307 [5:29:32<26:36:36,  1.76it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34785/203307 [5:29:36<26:36:51,  1.76it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34785/203307 [5:29:36<26:36:51,  1.76it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34786/203307 [5:29:40<26:37:06,  1.76it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34786/203307 [5:29:40<26:37:06,  1.76it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34787/203307 [5:29:44<26:37:21,  1.76it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34787/203307 [5:29:44<26:37:21,  1.76it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34788/203307 [5:29:48<26:37:40,  1.76it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34788/203307 [5:29:48<26:37:40,  1.76it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34789/203307 [5:29:52<26:37:55,  1.76it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34789/203307 [5:29:52<26:37:55,  1.76it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34790/203307 [5:29:56<26:38:12,  1.76it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34790/203307 [5:29:56<26:38:12,  1.76it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34791/203307 [5:30:01<26:38:30,  1.76it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34791/203307 [5:30:01<26:38:30,  1.76it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34792/203307 [5:30:04<26:38:44,  1.76it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34792/203307 [5:30:04<26:38:44,  1.76it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34793/203307 [5:30:08<26:38:59,  1.76it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34793/203307 [5:30:08<26:38:59,  1.76it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34794/203307 [5:30:12<26:39:14,  1.76it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34794/203307 [5:30:12<26:39:14,  1.76it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34795/203307 [5:30:16<26:39:28,  1.76it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34795/203307 [5:30:16<26:39:29,  1.76it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34796/203307 [5:30:20<26:39:47,  1.76it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34796/203307 [5:30:20<26:39:47,  1.76it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34797/203307 [5:30:24<26:40:05,  1.76it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34797/203307 [5:30:24<26:40:05,  1.76it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34798/203307 [5:30:29<26:40:22,  1.75it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34798/203307 [5:30:29<26:40:22,  1.75it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34799/203307 [5:30:32<26:40:36,  1.75it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34799/203307 [5:30:32<26:40:36,  1.75it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34800/203307 [5:30:37<26:40:54,  1.75it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34800/203307 [5:30:37<26:40:54,  1.75it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34801/203307 [5:30:40<26:41:09,  1.75it/s, v_num=line, training/loss=0.0798]Epoch 0:  17%|█▋        | 34801/203307 [5:30:40<26:41:09,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34802/203307 [5:30:44<26:41:23,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34802/203307 [5:30:44<26:41:23,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34803/203307 [5:30:48<26:41:38,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34803/203307 [5:30:48<26:41:38,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34804/203307 [5:30:52<26:41:57,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34804/203307 [5:30:52<26:41:57,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34805/203307 [5:30:57<26:42:15,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34805/203307 [5:30:57<26:42:15,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34806/203307 [5:31:01<26:42:30,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34806/203307 [5:31:01<26:42:30,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34807/203307 [5:31:05<26:42:47,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34807/203307 [5:31:05<26:42:47,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34808/203307 [5:31:09<26:43:02,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34808/203307 [5:31:09<26:43:02,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34809/203307 [5:31:13<26:43:20,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34809/203307 [5:31:13<26:43:20,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34810/203307 [5:31:17<26:43:35,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34810/203307 [5:31:17<26:43:35,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34811/203307 [5:31:21<26:43:50,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34811/203307 [5:31:21<26:43:50,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34812/203307 [5:31:24<26:44:05,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34812/203307 [5:31:24<26:44:05,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34813/203307 [5:31:29<26:44:23,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34813/203307 [5:31:29<26:44:23,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34814/203307 [5:31:33<26:44:42,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34814/203307 [5:31:33<26:44:42,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34815/203307 [5:31:38<26:44:59,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34815/203307 [5:31:38<26:44:59,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34816/203307 [5:31:41<26:45:14,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34816/203307 [5:31:41<26:45:14,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34817/203307 [5:31:45<26:45:28,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34817/203307 [5:31:45<26:45:28,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34818/203307 [5:31:49<26:45:46,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34818/203307 [5:31:49<26:45:46,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34819/203307 [5:31:53<26:46:01,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34819/203307 [5:31:53<26:46:01,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34820/203307 [5:31:57<26:46:16,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34820/203307 [5:31:57<26:46:16,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34821/203307 [5:32:01<26:46:34,  1.75it/s, v_num=line, training/loss=0.0845]Epoch 0:  17%|█▋        | 34821/203307 [5:32:01<26:46:34,  1.75it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34822/203307 [5:32:05<26:46:49,  1.75it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34822/203307 [5:32:05<26:46:49,  1.75it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34823/203307 [5:32:10<26:47:07,  1.75it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34823/203307 [5:32:10<26:47:07,  1.75it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34824/203307 [5:32:13<26:47:21,  1.75it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34824/203307 [5:32:13<26:47:21,  1.75it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34825/203307 [5:32:17<26:47:36,  1.75it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34825/203307 [5:32:17<26:47:36,  1.75it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34826/203307 [5:32:21<26:47:50,  1.75it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34826/203307 [5:32:21<26:47:50,  1.75it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34827/203307 [5:32:25<26:48:08,  1.75it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34827/203307 [5:32:25<26:48:08,  1.75it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34828/203307 [5:32:29<26:48:22,  1.75it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34828/203307 [5:32:29<26:48:22,  1.75it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34829/203307 [5:32:33<26:48:40,  1.75it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34829/203307 [5:32:33<26:48:40,  1.75it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34830/203307 [5:32:37<26:48:54,  1.75it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34830/203307 [5:32:37<26:48:54,  1.75it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34831/203307 [5:32:41<26:49:12,  1.74it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34831/203307 [5:32:41<26:49:12,  1.74it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34832/203307 [5:32:45<26:49:30,  1.74it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34832/203307 [5:32:45<26:49:30,  1.74it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34833/203307 [5:32:49<26:49:44,  1.74it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34833/203307 [5:32:49<26:49:45,  1.74it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34834/203307 [5:32:53<26:49:59,  1.74it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34834/203307 [5:32:53<26:49:59,  1.74it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34835/203307 [5:32:57<26:50:14,  1.74it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34835/203307 [5:32:57<26:50:14,  1.74it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34836/203307 [5:33:01<26:50:32,  1.74it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34836/203307 [5:33:01<26:50:32,  1.74it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34837/203307 [5:33:05<26:50:47,  1.74it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34837/203307 [5:33:05<26:50:47,  1.74it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34838/203307 [5:33:09<26:51:05,  1.74it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34838/203307 [5:33:09<26:51:05,  1.74it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34839/203307 [5:33:13<26:51:19,  1.74it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34839/203307 [5:33:13<26:51:19,  1.74it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34840/203307 [5:33:17<26:51:38,  1.74it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34840/203307 [5:33:17<26:51:38,  1.74it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34841/203307 [5:33:21<26:51:53,  1.74it/s, v_num=line, training/loss=0.0875]Epoch 0:  17%|█▋        | 34841/203307 [5:33:21<26:51:53,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34842/203307 [5:33:25<26:52:07,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34842/203307 [5:33:25<26:52:08,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34843/203307 [5:33:29<26:52:22,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34843/203307 [5:33:29<26:52:22,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34844/203307 [5:33:32<26:52:38,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34844/203307 [5:33:32<26:52:38,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34845/203307 [5:33:37<26:52:55,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34845/203307 [5:33:37<26:52:55,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34846/203307 [5:33:41<26:53:13,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34846/203307 [5:33:41<26:53:13,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34847/203307 [5:33:45<26:53:28,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34847/203307 [5:33:45<26:53:28,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34848/203307 [5:33:49<26:53:46,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34848/203307 [5:33:49<26:53:46,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34849/203307 [5:33:54<26:54:05,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34849/203307 [5:33:54<26:54:05,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34850/203307 [5:33:58<26:54:20,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34850/203307 [5:33:58<26:54:20,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34851/203307 [5:34:02<26:54:35,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34851/203307 [5:34:02<26:54:35,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34852/203307 [5:34:05<26:54:50,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34852/203307 [5:34:05<26:54:50,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34853/203307 [5:34:09<26:55:05,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34853/203307 [5:34:09<26:55:05,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34854/203307 [5:34:14<26:55:23,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34854/203307 [5:34:14<26:55:23,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34855/203307 [5:34:17<26:55:38,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34855/203307 [5:34:17<26:55:38,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34856/203307 [5:34:21<26:55:53,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34856/203307 [5:34:21<26:55:53,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34857/203307 [5:34:26<26:56:12,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34857/203307 [5:34:26<26:56:12,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34858/203307 [5:34:30<26:56:27,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34858/203307 [5:34:30<26:56:27,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34859/203307 [5:34:33<26:56:42,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34859/203307 [5:34:33<26:56:42,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34860/203307 [5:34:37<26:56:57,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34860/203307 [5:34:37<26:56:57,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34861/203307 [5:34:41<26:57:12,  1.74it/s, v_num=line, training/loss=0.0803]Epoch 0:  17%|█▋        | 34861/203307 [5:34:41<26:57:12,  1.74it/s, v_num=line, training/loss=0.088] Epoch 0:  17%|█▋        | 34862/203307 [5:34:45<26:57:27,  1.74it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34862/203307 [5:34:45<26:57:27,  1.74it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34863/203307 [5:34:49<26:57:45,  1.74it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34863/203307 [5:34:49<26:57:45,  1.74it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34864/203307 [5:34:53<26:58:01,  1.74it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34864/203307 [5:34:53<26:58:01,  1.74it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34865/203307 [5:34:58<26:58:18,  1.73it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34865/203307 [5:34:58<26:58:18,  1.73it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34866/203307 [5:35:02<26:58:36,  1.73it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34866/203307 [5:35:02<26:58:36,  1.73it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34867/203307 [5:35:06<26:58:51,  1.73it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34867/203307 [5:35:06<26:58:51,  1.73it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34868/203307 [5:35:09<26:59:05,  1.73it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34868/203307 [5:35:09<26:59:06,  1.73it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34869/203307 [5:35:13<26:59:20,  1.73it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34869/203307 [5:35:13<26:59:20,  1.73it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34870/203307 [5:35:17<26:59:35,  1.73it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34870/203307 [5:35:17<26:59:35,  1.73it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34871/203307 [5:35:21<26:59:53,  1.73it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34871/203307 [5:35:21<26:59:53,  1.73it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34872/203307 [5:35:26<27:00:10,  1.73it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34872/203307 [5:35:26<27:00:10,  1.73it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34873/203307 [5:35:30<27:00:27,  1.73it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34873/203307 [5:35:30<27:00:27,  1.73it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34874/203307 [5:35:34<27:00:42,  1.73it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34874/203307 [5:35:34<27:00:42,  1.73it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34875/203307 [5:35:38<27:01:01,  1.73it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34875/203307 [5:35:38<27:01:01,  1.73it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34876/203307 [5:35:42<27:01:16,  1.73it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34876/203307 [5:35:42<27:01:16,  1.73it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34877/203307 [5:35:46<27:01:31,  1.73it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34877/203307 [5:35:46<27:01:31,  1.73it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34878/203307 [5:35:49<27:01:45,  1.73it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34878/203307 [5:35:49<27:01:45,  1.73it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34879/203307 [5:35:54<27:02:03,  1.73it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34879/203307 [5:35:54<27:02:03,  1.73it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34880/203307 [5:35:57<27:02:17,  1.73it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34880/203307 [5:35:57<27:02:17,  1.73it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34881/203307 [5:36:02<27:02:35,  1.73it/s, v_num=line, training/loss=0.088]Epoch 0:  17%|█▋        | 34881/203307 [5:36:02<27:02:35,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34882/203307 [5:36:06<27:02:53,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34882/203307 [5:36:06<27:02:53,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34883/203307 [5:36:11<27:03:11,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34883/203307 [5:36:11<27:03:11,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34884/203307 [5:36:14<27:03:25,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34884/203307 [5:36:14<27:03:25,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34885/203307 [5:36:18<27:03:40,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34885/203307 [5:36:18<27:03:40,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34886/203307 [5:36:22<27:03:55,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34886/203307 [5:36:22<27:03:55,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34887/203307 [5:36:26<27:04:10,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34887/203307 [5:36:26<27:04:10,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34888/203307 [5:36:30<27:04:28,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34888/203307 [5:36:30<27:04:28,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34889/203307 [5:36:34<27:04:42,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34889/203307 [5:36:34<27:04:42,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34890/203307 [5:36:38<27:05:00,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34890/203307 [5:36:38<27:05:00,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34891/203307 [5:36:42<27:05:14,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34891/203307 [5:36:42<27:05:14,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34892/203307 [5:36:46<27:05:33,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34892/203307 [5:36:46<27:05:33,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34893/203307 [5:36:50<27:05:47,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34893/203307 [5:36:50<27:05:47,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34894/203307 [5:36:54<27:06:02,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34894/203307 [5:36:54<27:06:02,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34895/203307 [5:36:58<27:06:17,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34895/203307 [5:36:58<27:06:17,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34896/203307 [5:37:02<27:06:34,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34896/203307 [5:37:02<27:06:34,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34897/203307 [5:37:06<27:06:49,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34897/203307 [5:37:06<27:06:49,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34898/203307 [5:37:10<27:07:06,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34898/203307 [5:37:10<27:07:06,  1.73it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34899/203307 [5:37:14<27:07:23,  1.72it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34899/203307 [5:37:14<27:07:23,  1.72it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34900/203307 [5:37:18<27:07:38,  1.72it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34900/203307 [5:37:18<27:07:38,  1.72it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34901/203307 [5:37:22<27:07:56,  1.72it/s, v_num=line, training/loss=0.0834]Epoch 0:  17%|█▋        | 34901/203307 [5:37:22<27:07:56,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34902/203307 [5:37:26<27:08:11,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34902/203307 [5:37:26<27:08:11,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34903/203307 [5:37:30<27:08:25,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34903/203307 [5:37:30<27:08:25,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34904/203307 [5:37:34<27:08:43,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34904/203307 [5:37:34<27:08:43,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34905/203307 [5:37:38<27:08:57,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34905/203307 [5:37:38<27:08:57,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34906/203307 [5:37:42<27:09:12,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34906/203307 [5:37:42<27:09:12,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34907/203307 [5:37:46<27:09:30,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34907/203307 [5:37:46<27:09:30,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34908/203307 [5:37:50<27:09:47,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34908/203307 [5:37:50<27:09:47,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34909/203307 [5:37:55<27:10:05,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34909/203307 [5:37:55<27:10:05,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34910/203307 [5:37:58<27:10:20,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34910/203307 [5:37:58<27:10:20,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34911/203307 [5:38:02<27:10:34,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34911/203307 [5:38:02<27:10:34,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34912/203307 [5:38:06<27:10:50,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34912/203307 [5:38:06<27:10:50,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34913/203307 [5:38:10<27:11:07,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34913/203307 [5:38:10<27:11:07,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34914/203307 [5:38:14<27:11:22,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34914/203307 [5:38:14<27:11:22,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34915/203307 [5:38:18<27:11:39,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34915/203307 [5:38:18<27:11:39,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34916/203307 [5:38:22<27:11:54,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34916/203307 [5:38:22<27:11:54,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34917/203307 [5:38:27<27:12:12,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34917/203307 [5:38:27<27:12:12,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34918/203307 [5:38:31<27:12:30,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34918/203307 [5:38:31<27:12:30,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34919/203307 [5:38:35<27:12:45,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34919/203307 [5:38:35<27:12:45,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34920/203307 [5:38:39<27:13:00,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34920/203307 [5:38:39<27:13:00,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34921/203307 [5:38:43<27:13:18,  1.72it/s, v_num=line, training/loss=0.0826]Epoch 0:  17%|█▋        | 34921/203307 [5:38:43<27:13:18,  1.72it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34922/203307 [5:38:47<27:13:33,  1.72it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34922/203307 [5:38:47<27:13:33,  1.72it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34923/203307 [5:38:51<27:13:50,  1.72it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34923/203307 [5:38:51<27:13:50,  1.72it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34924/203307 [5:38:55<27:14:05,  1.72it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34924/203307 [5:38:55<27:14:06,  1.72it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34925/203307 [5:38:59<27:14:20,  1.72it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34925/203307 [5:38:59<27:14:20,  1.72it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34926/203307 [5:39:03<27:14:38,  1.72it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34926/203307 [5:39:03<27:14:38,  1.72it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34927/203307 [5:39:08<27:14:56,  1.72it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34927/203307 [5:39:08<27:14:56,  1.72it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34928/203307 [5:39:11<27:15:11,  1.72it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34928/203307 [5:39:11<27:15:11,  1.72it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34929/203307 [5:39:16<27:15:28,  1.72it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34929/203307 [5:39:16<27:15:28,  1.72it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34930/203307 [5:39:20<27:15:43,  1.72it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34930/203307 [5:39:20<27:15:43,  1.72it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34931/203307 [5:39:23<27:15:58,  1.72it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34931/203307 [5:39:23<27:15:58,  1.72it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34932/203307 [5:39:28<27:16:17,  1.72it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34932/203307 [5:39:28<27:16:17,  1.72it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34933/203307 [5:39:32<27:16:31,  1.71it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34933/203307 [5:39:32<27:16:31,  1.71it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34934/203307 [5:39:35<27:16:46,  1.71it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34934/203307 [5:39:35<27:16:46,  1.71it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34935/203307 [5:39:40<27:17:05,  1.71it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34935/203307 [5:39:40<27:17:05,  1.71it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34936/203307 [5:39:44<27:17:20,  1.71it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34936/203307 [5:39:44<27:17:20,  1.71it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34937/203307 [5:39:47<27:17:34,  1.71it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34937/203307 [5:39:47<27:17:34,  1.71it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34938/203307 [5:39:52<27:17:52,  1.71it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34938/203307 [5:39:52<27:17:52,  1.71it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34939/203307 [5:39:56<27:18:07,  1.71it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34939/203307 [5:39:56<27:18:07,  1.71it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34940/203307 [5:40:00<27:18:25,  1.71it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34940/203307 [5:40:00<27:18:25,  1.71it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34941/203307 [5:40:04<27:18:40,  1.71it/s, v_num=line, training/loss=0.0848]Epoch 0:  17%|█▋        | 34941/203307 [5:40:04<27:18:40,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34942/203307 [5:40:08<27:18:54,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34942/203307 [5:40:08<27:18:54,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34943/203307 [5:40:11<27:19:09,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34943/203307 [5:40:11<27:19:09,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34944/203307 [5:40:16<27:19:28,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34944/203307 [5:40:16<27:19:28,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34945/203307 [5:40:20<27:19:43,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34945/203307 [5:40:20<27:19:43,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34946/203307 [5:40:24<27:20:01,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34946/203307 [5:40:24<27:20:01,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34947/203307 [5:40:28<27:20:16,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34947/203307 [5:40:28<27:20:16,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34948/203307 [5:40:32<27:20:34,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34948/203307 [5:40:32<27:20:34,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34949/203307 [5:40:36<27:20:48,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34949/203307 [5:40:36<27:20:49,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34950/203307 [5:40:40<27:21:04,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34950/203307 [5:40:40<27:21:04,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34951/203307 [5:40:44<27:21:19,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34951/203307 [5:40:44<27:21:19,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34952/203307 [5:40:48<27:21:34,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34952/203307 [5:40:48<27:21:34,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34953/203307 [5:40:53<27:21:53,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34953/203307 [5:40:53<27:21:53,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34954/203307 [5:40:57<27:22:11,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34954/203307 [5:40:57<27:22:11,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34955/203307 [5:41:01<27:22:26,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34955/203307 [5:41:01<27:22:26,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34956/203307 [5:41:05<27:22:42,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34956/203307 [5:41:05<27:22:42,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34957/203307 [5:41:09<27:23:00,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34957/203307 [5:41:09<27:23:00,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34958/203307 [5:41:13<27:23:15,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34958/203307 [5:41:13<27:23:15,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34959/203307 [5:41:17<27:23:30,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34959/203307 [5:41:17<27:23:30,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34960/203307 [5:41:21<27:23:45,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34960/203307 [5:41:21<27:23:45,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34961/203307 [5:41:25<27:24:02,  1.71it/s, v_num=line, training/loss=0.0959]Epoch 0:  17%|█▋        | 34961/203307 [5:41:25<27:24:03,  1.71it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34962/203307 [5:41:29<27:24:20,  1.71it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34962/203307 [5:41:29<27:24:20,  1.71it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34963/203307 [5:41:34<27:24:38,  1.71it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34963/203307 [5:41:34<27:24:38,  1.71it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34964/203307 [5:41:38<27:24:53,  1.71it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34964/203307 [5:41:38<27:24:53,  1.71it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34965/203307 [5:41:42<27:25:11,  1.71it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34965/203307 [5:41:42<27:25:11,  1.71it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34966/203307 [5:41:46<27:25:25,  1.71it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34966/203307 [5:41:46<27:25:25,  1.71it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34967/203307 [5:41:49<27:25:39,  1.70it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34967/203307 [5:41:49<27:25:39,  1.70it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34968/203307 [5:41:53<27:25:54,  1.70it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34968/203307 [5:41:53<27:25:54,  1.70it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34969/203307 [5:41:57<27:26:09,  1.70it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34969/203307 [5:41:57<27:26:09,  1.70it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34970/203307 [5:42:02<27:26:28,  1.70it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34970/203307 [5:42:02<27:26:28,  1.70it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34971/203307 [5:42:06<27:26:45,  1.70it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34971/203307 [5:42:06<27:26:45,  1.70it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34972/203307 [5:42:10<27:27:00,  1.70it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34972/203307 [5:42:10<27:27:00,  1.70it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34973/203307 [5:42:14<27:27:17,  1.70it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34973/203307 [5:42:14<27:27:17,  1.70it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34974/203307 [5:42:18<27:27:32,  1.70it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34974/203307 [5:42:18<27:27:32,  1.70it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34975/203307 [5:42:21<27:27:46,  1.70it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34975/203307 [5:42:21<27:27:47,  1.70it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34976/203307 [5:42:25<27:28:01,  1.70it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34976/203307 [5:42:25<27:28:01,  1.70it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34977/203307 [5:42:29<27:28:16,  1.70it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34977/203307 [5:42:29<27:28:16,  1.70it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34978/203307 [5:42:33<27:28:31,  1.70it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34978/203307 [5:42:33<27:28:31,  1.70it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34979/203307 [5:42:37<27:28:49,  1.70it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34979/203307 [5:42:37<27:28:49,  1.70it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34980/203307 [5:42:42<27:29:06,  1.70it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34980/203307 [5:42:42<27:29:07,  1.70it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34981/203307 [5:42:45<27:29:21,  1.70it/s, v_num=line, training/loss=0.0715]Epoch 0:  17%|█▋        | 34981/203307 [5:42:45<27:29:21,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34982/203307 [5:42:50<27:29:39,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34982/203307 [5:42:50<27:29:39,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34983/203307 [5:42:53<27:29:53,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34983/203307 [5:42:53<27:29:53,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34984/203307 [5:42:57<27:30:08,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34984/203307 [5:42:57<27:30:08,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34985/203307 [5:43:01<27:30:23,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34985/203307 [5:43:01<27:30:23,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34986/203307 [5:43:05<27:30:37,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34986/203307 [5:43:05<27:30:37,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34987/203307 [5:43:09<27:30:55,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34987/203307 [5:43:09<27:30:55,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34988/203307 [5:43:14<27:31:13,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34988/203307 [5:43:14<27:31:13,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34989/203307 [5:43:18<27:31:30,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34989/203307 [5:43:18<27:31:30,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34990/203307 [5:43:22<27:31:47,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34990/203307 [5:43:22<27:31:47,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34991/203307 [5:43:26<27:32:02,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34991/203307 [5:43:26<27:32:02,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34992/203307 [5:43:30<27:32:16,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34992/203307 [5:43:30<27:32:16,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34993/203307 [5:43:33<27:32:31,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34993/203307 [5:43:33<27:32:31,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34994/203307 [5:43:37<27:32:45,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34994/203307 [5:43:37<27:32:45,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34995/203307 [5:43:41<27:33:00,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34995/203307 [5:43:41<27:33:00,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34996/203307 [5:43:46<27:33:19,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34996/203307 [5:43:46<27:33:19,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34997/203307 [5:43:49<27:33:34,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34997/203307 [5:43:49<27:33:34,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34998/203307 [5:43:54<27:33:52,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34998/203307 [5:43:54<27:33:52,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34999/203307 [5:43:58<27:34:07,  1.70it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 34999/203307 [5:43:58<27:34:07,  1.70it/s, v_num=line, training/loss=0.0876]
Validation: |          | 0/? [00:00<?, ?it/s][A
Validation:   0%|          | 0/1 [00:00<?, ?it/s][A


Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s][A[A

Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:28,  1.12it/s][A[A

Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:27,  1.11it/s][A[A

Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:26,  1.12it/s][A[A

Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:25,  1.12it/s][A[A

Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:24,  1.12it/s][A[A

Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:23,  1.12it/s][A[A

Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:23,  1.12it/s][A[A

Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:22,  1.12it/s][A[A

Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:21,  1.11it/s][A[A

Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:24,  1.17it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:23,  1.18it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:22,  1.18it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:20,  1.19it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:19,  1.19it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:18,  1.19it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:05<01:18,  1.19it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:06<01:17,  1.19it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:16,  1.18it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:16,  1.18it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:15,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:24,  1.18it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:22,  1.19it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:21,  1.19it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:20,  1.19it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:19,  1.19it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:19,  1.19it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:05<01:18,  1.19it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:06<01:18,  1.18it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:17,  1.17it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:17,  1.16it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:16,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:25,  1.16it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:24,  1.16it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:22,  1.17it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:21,  1.18it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:20,  1.18it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:19,  1.18it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:05<01:19,  1.17it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:06<01:18,  1.17it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:18,  1.16it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:17,  1.16it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:16,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:25,  1.15it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:24,  1.16it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:23,  1.16it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:22,  1.17it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:21,  1.17it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:20,  1.17it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:19,  1.16it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:06<01:19,  1.16it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:18,  1.16it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:17,  1.16it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:16,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:28,  1.12it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:26,  1.13it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:25,  1.13it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:24,  1.13it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:23,  1.13it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:22,  1.13it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:22,  1.13it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:21,  1.13it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:07<01:20,  1.12it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:20,  1.12it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:18,  1.1Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:20,  1.12it/s][A[A

Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:30,  1.09it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:28,  1.10it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:27,  1.11it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:25,  1.12it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:24,  1.12it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:23,  1.12it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:23,  1.12it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:22,  1.12it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:21,  1.12it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:08<01:20,  1.11it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:19,  1.1Sampling (mamba memory):  50%|█████     | 100/200 [00:00<?, ?it/s]Sampling (mamba memory):  50%|█████     | 101/200 [00:00<01:30,  1.10it/s]Sampling (mamba memory):  51%|█████     | 102/200 [00:01<01:28,  1.11it/s]Sampling (mamba memory):  52%|█████▏    | 103/200 [00:02<01:27,  1.11it/s]Sampling (mamba memory):  52%|█████▏    | 104/200 [00:03<01:26,  1.11it/s]Sampling (mamba memory):  52%|█████▎    | 105/200 [00:04<01:25,  1.11it/s]Sampling (mamba memory):  53%|█████▎    | 106/200 [00:05<01:24,  1.11it/s]Sampling (mamba memory):  54%|█████▎    | 107/200 [00:06<01:23,  1.12it/s]Sampling (mamba memory):  54%|█████▍    | 108/200 [00:07<01:22,  1.11it/s]Sampling (mamba memory):  55%|█████▍    | 109/200 [00:08<01:21,  1.11it/s]Sampling (mamba memory):  55%|█████▌    | 110/200 [00:09<01:21,  1.11it/s]Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:20,  1.1Sampling (mamba memory):  56%|█████▌    | 111/200 [00:09<01:18,  1.13it/s][A[A

Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:17,  1.13it/s][A[A

Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:16,  1.13it/s][A[A

Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:15,  1.13it/s][A[A

Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:15,  1.13it/s][A[A

Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:14,  1.12it/s][A[A

Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:14,  1.12it/s][A[A

Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:13,  1.11it/s][A[A

Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:12,  1.11it/s][A[A

Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:12,  1.11it/s][A[A

8it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:14,  1.18it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:10<01:13,  1.18it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:11<01:12,  1.18it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:12<01:12,  1.18it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:13<01:11,  1.17it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:10,  1.17it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:10,  1.17it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:09,  1.16it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:09,  1.16it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:17<01:08,  1.16it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:18<01:07,  1.15it/s]Sampling (mamba memory):  62%|██████▏   | 123/Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:11,  1.11it/s][A[A

6it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:15,  1.16it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:14,  1.16it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:11<01:14,  1.16it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:12<01:13,  1.16it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:13<01:12,  1.15it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:12,  1.15it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:11,  1.14it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:10,  1.14it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:09,  1.15it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:08,  1.15it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:18<01:07,  1.15it/s]Sampling (mamba memory):  62%|██████▏   | 123/6it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:15,  1.17it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:14,  1.17it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:11<01:13,  1.17it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:12<01:12,  1.17it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:13<01:12,  1.16it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:11,  1.15it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:11,  1.15it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:10,  1.15it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:09,  1.15it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:08,  1.15it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:18<01:07,  1.15it/s]Sampling (mamba memory):  62%|██████▏   | 123/6it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:15,  1.16it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:14,  1.16it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:14,  1.16it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:12<01:13,  1.16it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:13<01:13,  1.15it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:14<01:12,  1.15it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:15<01:11,  1.15it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:10,  1.14it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:10,  1.14it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:09,  1.14it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:08,  1.14it/s]Sampling (mamba memory):  62%|██████▏   | 123/3it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:18,  1.13it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:17,  1.13it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:16,  1.13it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:15,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:15,  1.12it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:14,  1.11it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:13,  1.12it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:16<01:12,  1.12it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:17<01:11,  1.11it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:10,  1.11it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:10,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 123/Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:10,  1.10it/s][A[A

2it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:18,  1.12it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:18,  1.11it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:17,  1.11it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:17,  1.10it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:16,  1.10it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:15,  1.10it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:14,  1.10it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:13,  1.09it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:13,  1.10it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:18<01:12,  1.09it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:19<01:11,  1.09it/s]Sampling (mamba memory):  62%|██████▏   | 123/1it/s]Sampling (mamba memory):  56%|█████▌    | 112/200 [00:10<01:19,  1.11it/s]Sampling (mamba memory):  56%|█████▋    | 113/200 [00:11<01:18,  1.10it/s]Sampling (mamba memory):  57%|█████▋    | 114/200 [00:12<01:18,  1.10it/s]Sampling (mamba memory):  57%|█████▊    | 115/200 [00:13<01:17,  1.09it/s]Sampling (mamba memory):  58%|█████▊    | 116/200 [00:14<01:17,  1.09it/s]Sampling (mamba memory):  58%|█████▊    | 117/200 [00:15<01:16,  1.09it/s]Sampling (mamba memory):  59%|█████▉    | 118/200 [00:16<01:15,  1.08it/s]Sampling (mamba memory):  60%|█████▉    | 119/200 [00:17<01:14,  1.09it/s]Sampling (mamba memory):  60%|██████    | 120/200 [00:18<01:13,  1.09it/s]Sampling (mamba memory):  60%|██████    | 121/200 [00:19<01:12,  1.08it/s]Sampling (mamba memory):  61%|██████    | 122/200 [00:20<01:12,  1.08it/s]Sampling (mamba memory):  62%|██████▏   | 123/Sampling (mamba memory):  62%|██████▏   | 123/200 [00:20<01:09,  1.10it/s][A[A

Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:09,  1.10it/s][A[A

Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:08,  1.09it/s][A[A

Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:07,  1.09it/s][A[A

Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:07,  1.09it/s][A[A

Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:06,  1.08it/s][A[A

Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:05,  1.08it/s][A[A

Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:04,  1.08it/s][A[A

Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:03,  1.08it/s][A[A

Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:02,  1.08it/s][A[A

200 [00:19<01:07,  1.15it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:20<01:06,  1.14it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:21<01:05,  1.14it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:22<01:04,  1.14it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:04,  1.14it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:03,  1.14it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:24<01:02,  1.14it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:25<01:01,  1.14it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:26<01:00,  1.13it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:27<01:00,  1.13it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:28<00:59,  1.13it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:29<00:58,  1.13it/s]Sampling (mamba 200 [00:19<01:07,  1.15it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:20<01:06,  1.15it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:21<01:05,  1.15it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:22<01:04,  1.14it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:04,  1.14it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:03,  1.13it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:02,  1.13it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:25<01:01,  1.13it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:26<01:01,  1.13it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:27<01:00,  1.13it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:28<00:59,  1.12it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:29<00:58,  1.12it/s]Sampling (mamba 200 [00:19<01:07,  1.15it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:20<01:06,  1.14it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:21<01:05,  1.14it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:22<01:05,  1.14it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:04,  1.13it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:03,  1.13it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:03,  1.13it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:02,  1.12it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:26<01:01,  1.12it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:27<01:00,  1.12it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:28<00:59,  1.12it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:29<00:58,  1.13it/s]Sampling (mamba 200 [00:19<01:07,  1.13it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:20<01:07,  1.13it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:21<01:05,  1.14it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:22<01:04,  1.14it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:23<01:04,  1.14it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:24<01:03,  1.14it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:02,  1.14it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:01,  1.14it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:26<01:00,  1.14it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:27<00:59,  1.13it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:28<00:59,  1.13it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:29<00:58,  1.14it/s]Sampling (mamba Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:01,  1.08it/s][A[A

200 [00:20<01:09,  1.11it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:08,  1.11it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:07,  1.11it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:06,  1.11it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:06,  1.10it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:05,  1.10it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:25<01:04,  1.09it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:26<01:04,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:27<01:03,  1.09it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:28<01:02,  1.09it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:29<01:01,  1.09it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:00,  1.09it/s]Sampling (mamba Sampling (mamba memory):  67%|██████▋   | 134/200 [00:30<01:00,  1.09it/s][A[A

200 [00:20<01:11,  1.08it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:10,  1.08it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:09,  1.08it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:08,  1.08it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:07,  1.07it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:07,  1.07it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:06,  1.07it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:05,  1.07it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:04,  1.07it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:03,  1.07it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:02,  1.07it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<01:01,  1.06it/s]Sampling (mamba 200 [00:20<01:11,  1.08it/s]Sampling (mamba memory):  62%|██████▏   | 124/200 [00:21<01:10,  1.08it/s]Sampling (mamba memory):  62%|██████▎   | 125/200 [00:22<01:09,  1.08it/s]Sampling (mamba memory):  63%|██████▎   | 126/200 [00:23<01:08,  1.08it/s]Sampling (mamba memory):  64%|██████▎   | 127/200 [00:24<01:08,  1.07it/s]Sampling (mamba memory):  64%|██████▍   | 128/200 [00:25<01:07,  1.07it/s]Sampling (mamba memory):  64%|██████▍   | 129/200 [00:26<01:06,  1.06it/s]Sampling (mamba memory):  65%|██████▌   | 130/200 [00:27<01:06,  1.06it/s]Sampling (mamba memory):  66%|██████▌   | 131/200 [00:28<01:05,  1.06it/s]Sampling (mamba memory):  66%|██████▌   | 132/200 [00:29<01:04,  1.06it/s]Sampling (mamba memory):  66%|██████▋   | 133/200 [00:30<01:03,  1.06it/s]Sampling (mamba memory):  67%|██████▋   | 134/200 [00:31<01:02,  1.06it/s]Sampling (mamba Sampling (mamba memory):  68%|██████▊   | 135/200 [00:31<00:59,  1.09it/s][A[A

Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:58,  1.09it/s][A[A

Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:57,  1.09it/s][A[A

Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:56,  1.09it/s][A[A

Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:55,  1.09it/s][A[A

Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:55,  1.09it/s][A[A

Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:54,  1.09it/s][A[A

Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:53,  1.08it/s][A[A

Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:52,  1.08it/s][A[A

memory):  68%|██████▊   | 135/200 [00:30<00:57,  1.13it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:31<00:56,  1.13it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:31<00:55,  1.13it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:32<00:55,  1.12it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:33<00:54,  1.12it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:34<00:53,  1.12it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:35<00:52,  1.12it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:36<00:51,  1.12it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:37<00:51,  1.11it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:38<00:50,  1.11it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:39<00:49,  1.10it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:30<00:57,  1.13it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:31<00:56,  1.13it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:32<00:55,  1.13it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:33<00:54,  1.13it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:34<00:54,  1.13it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:34<00:53,  1.13it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:35<00:52,  1.13it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:36<00:51,  1.13it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:37<00:50,  1.13it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:38<00:49,  1.12it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:39<00:49,  1.12it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:30<00:57,  1.14it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:31<00:56,  1.13it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:32<00:55,  1.13it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:33<00:55,  1.13it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:34<00:54,  1.12it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:34<00:53,  1.12it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:35<00:52,  1.12it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:36<00:51,  1.12it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:37<00:51,  1.12it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:38<00:50,  1.11it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:39<00:49,  1.11it/s]Sampling (mamba memory):  73%|███████▎ memory):  68%|██████▊   | 135/200 [00:30<00:57,  1.12it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:31<00:57,  1.12it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:32<00:56,  1.12it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:33<00:55,  1.11it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:34<00:54,  1.11it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:34<00:54,  1.11it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:35<00:53,  1.11it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:36<00:52,  1.10it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:37<00:51,  1.10it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:38<00:50,  1.10it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:39<00:50,  1.10it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:51,  1.08it/s][A[A

memory):  68%|██████▊   | 135/200 [00:31<00:59,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:32<00:59,  1.08it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:58,  1.08it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:57,  1.08it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:56,  1.08it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:55,  1.08it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:54,  1.08it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:53,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:38<00:53,  1.07it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:39<00:52,  1.07it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:51,  1.07it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  72%|███████▎  | 145/200 [00:40<00:51,  1.08it/s][A[A

memory):  68%|██████▊   | 135/200 [00:32<01:01,  1.06it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:33<01:00,  1.06it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:33<00:59,  1.06it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:34<00:58,  1.06it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:35<00:57,  1.06it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:36<00:56,  1.06it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:37<00:55,  1.06it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:38<00:54,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:39<00:53,  1.06it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:40<00:52,  1.06it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:41<00:52,  1.06it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  73%|███████▎  | 146/200 [00:41<00:50,  1.07it/s][A[A

memory):  68%|██████▊   | 135/200 [00:32<01:01,  1.05it/s]Sampling (mamba memory):  68%|██████▊   | 136/200 [00:33<01:00,  1.05it/s]Sampling (mamba memory):  68%|██████▊   | 137/200 [00:34<01:00,  1.05it/s]Sampling (mamba memory):  69%|██████▉   | 138/200 [00:35<00:59,  1.04it/s]Sampling (mamba memory):  70%|██████▉   | 139/200 [00:36<00:58,  1.04it/s]Sampling (mamba memory):  70%|███████   | 140/200 [00:37<00:58,  1.03it/s]Sampling (mamba memory):  70%|███████   | 141/200 [00:38<00:57,  1.03it/s]Sampling (mamba memory):  71%|███████   | 142/200 [00:39<00:56,  1.02it/s]Sampling (mamba memory):  72%|███████▏  | 143/200 [00:40<00:55,  1.02it/s]Sampling (mamba memory):  72%|███████▏  | 144/200 [00:41<00:54,  1.02it/s]Sampling (mamba memory):  72%|███████▎  | 145/200 [00:42<00:53,  1.02it/s]Sampling (mamba memory):  73%|███████▎ Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:49,  1.07it/s][A[A

Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:48,  1.07it/s][A[A

Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:47,  1.07it/s][A[A

Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:46,  1.07it/s][A[A

Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:46,  1.06it/s][A[A

Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:45,  1.05it/s][A[A

Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:44,  1.05it/s][A[A

 | 146/200 [00:40<00:49,  1.10it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:41<00:48,  1.10it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:41<00:47,  1.09it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:42<00:46,  1.09it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:43<00:45,  1.09it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:44<00:44,  1.09it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:45<00:44,  1.09it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:46<00:43,  1.08it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:47<00:42,  1.08it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:48<00:41,  1.08it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:49<00:40,  1.08it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:50<00:39 | 146/200 [00:40<00:48,  1.12it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:41<00:47,  1.12it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:42<00:46,  1.12it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:42<00:45,  1.12it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:43<00:44,  1.12it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:44<00:44,  1.11it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:45<00:43,  1.11it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:46<00:42,  1.10it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:47<00:41,  1.10it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:48<00:41,  1.09it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:49<00:40,  1.09it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:50<00:39Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:44,  1.04it/s][A[A

 | 146/200 [00:40<00:48,  1.11it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:41<00:47,  1.11it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:42<00:47,  1.10it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:43<00:46,  1.10it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:44<00:45,  1.10it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:44<00:44,  1.10it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:45<00:43,  1.09it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:46<00:42,  1.09it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:47<00:42,  1.09it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:48<00:41,  1.09it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:49<00:40,  1.09it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:50<00:39 | 146/200 [00:40<00:49,  1.09it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:41<00:48,  1.09it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:42<00:47,  1.09it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:43<00:46,  1.09it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:44<00:45,  1.09it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:45<00:45,  1.08it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:45<00:44,  1.09it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:46<00:43,  1.08it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:47<00:42,  1.08it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:48<00:41,  1.08it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:49<00:40,  1.08it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:50<00:39Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:43,  1.04it/s][A[A

 | 146/200 [00:41<00:50,  1.07it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:42<00:49,  1.07it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:43<00:48,  1.07it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:44<00:47,  1.07it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:45<00:47,  1.06it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:46<00:46,  1.06it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:47<00:45,  1.06it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:48<00:44,  1.05it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:49<00:43,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:50<00:42,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:41,  1.05it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:41Sampling (mamba memory):  78%|███████▊  | 156/200 [00:51<00:42,  1.04it/s][A[A

 | 146/200 [00:42<00:51,  1.05it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:43<00:50,  1.05it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:49,  1.04it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:49,  1.03it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:48,  1.03it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:47,  1.03it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:48<00:46,  1.03it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:49<00:45,  1.03it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:50<00:44,  1.02it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:51<00:44,  1.02it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:52<00:43,  1.02it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:53<00:42Sampling (mamba memory):  78%|███████▊  | 157/200 [00:52<00:41,  1.04it/s][A[A

 | 146/200 [00:43<00:52,  1.02it/s]Sampling (mamba memory):  74%|███████▎  | 147/200 [00:44<00:51,  1.02it/s]Sampling (mamba memory):  74%|███████▍  | 148/200 [00:44<00:51,  1.02it/s]Sampling (mamba memory):  74%|███████▍  | 149/200 [00:45<00:50,  1.02it/s]Sampling (mamba memory):  75%|███████▌  | 150/200 [00:46<00:49,  1.01it/s]Sampling (mamba memory):  76%|███████▌  | 151/200 [00:47<00:48,  1.01it/s]Sampling (mamba memory):  76%|███████▌  | 152/200 [00:48<00:47,  1.01it/s]Sampling (mamba memory):  76%|███████▋  | 153/200 [00:49<00:46,  1.01it/s]Sampling (mamba memory):  77%|███████▋  | 154/200 [00:50<00:45,  1.01it/s]Sampling (mamba memory):  78%|███████▊  | 155/200 [00:51<00:44,  1.01it/s]Sampling (mamba memory):  78%|███████▊  | 156/200 [00:52<00:43,  1.01it/s]Sampling (mamba memory):  78%|███████▊  | 157/200 [00:53<00:42Sampling (mamba memory):  79%|███████▉  | 158/200 [00:53<00:40,  1.03it/s][A[A

Sampling (mamba memory):  80%|███████▉  | 159/200 [00:54<00:39,  1.03it/s][A[A

Sampling (mamba memory):  80%|████████  | 160/200 [00:55<00:38,  1.03it/s][A[A

Sampling (mamba memory):  80%|████████  | 161/200 [00:56<00:37,  1.03it/s][A[A

Sampling (mamba memory):  81%|████████  | 162/200 [00:57<00:36,  1.03it/s][A[A

Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:35,  1.03it/s][A[A

Sampling (mamba memory):  82%|████████▏ | 164/200 [00:59<00:34,  1.03it/s][A[A

,  1.08it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:51<00:38,  1.08it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:52<00:37,  1.08it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:53<00:36,  1.08it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:53<00:36,  1.08it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:54<00:35,  1.08it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:55<00:34,  1.08it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:56<00:33,  1.08it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [00:57<00:32,  1.08it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [00:58<00:31,  1.07it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [00:59<00:30,  1.07it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:00<00:29,  1.07it/s,  1.08it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:51<00:38,  1.08it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:52<00:38,  1.08it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:53<00:37,  1.08it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:54<00:36,  1.07it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:54<00:35,  1.07it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:55<00:34,  1.07it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:56<00:33,  1.07it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [00:57<00:32,  1.07it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [00:58<00:31,  1.07it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [00:59<00:31,  1.06it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:00<00:30,  1.06it/s,  1.09it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:51<00:38,  1.08it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:52<00:37,  1.08it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:53<00:36,  1.08it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:54<00:36,  1.08it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:55<00:35,  1.08it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:56<00:34,  1.08it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:56<00:33,  1.07it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [00:57<00:32,  1.07it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [00:58<00:31,  1.07it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [00:59<00:30,  1.07it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:00<00:29,  1.07it/s,  1.08it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:51<00:39,  1.07it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:52<00:38,  1.07it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:53<00:37,  1.07it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:54<00:36,  1.07it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:55<00:35,  1.07it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:56<00:34,  1.07it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:57<00:33,  1.07it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [00:58<00:32,  1.07it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [00:59<00:32,  1.06it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [00:59<00:31,  1.06it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:00<00:30,  1.06it/sSampling (mamba memory):  82%|████████▎ | 165/200 [01:00<00:34,  1.03it/s][A[A

Sampling (mamba memory):  83%|████████▎ | 166/200 [01:01<00:33,  1.02it/s][A[A

,  1.05it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:53<00:40,  1.04it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:54<00:39,  1.04it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:55<00:38,  1.04it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:56<00:37,  1.04it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:57<00:36,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:58<00:35,  1.04it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [00:58<00:34,  1.04it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [00:59<00:33,  1.03it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:00<00:32,  1.03it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:01<00:32,  1.03it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:02<00:31,  1.03it/sSampling (mamba memory):  84%|████████▎ | 167/200 [01:02<00:32,  1.02it/s][A[A

Sampling (mamba memory):  84%|████████▍ | 168/200 [01:03<00:31,  1.02it/s][A[A

,  1.02it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:54<00:41,  1.02it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:55<00:40,  1.02it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:56<00:39,  1.01it/s]Sampling (mamba memory):  80%|████████  | 161/200 [00:57<00:38,  1.01it/s]Sampling (mamba memory):  81%|████████  | 162/200 [00:58<00:37,  1.01it/s]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:59<00:36,  1.01it/s]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:00<00:35,  1.01it/s]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:01<00:34,  1.01it/s]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:02<00:33,  1.01it/s]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:03<00:32,  1.00it/s]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:04<00:31,  1.00it/s,  1.00it/s]Sampling (mamba memory):  79%|███████▉  | 158/200 [00:54<00:41,  1.00it/s]Sampling (mamba memory):  80%|███████▉  | 159/200 [00:55<00:40,  1.00it/s]Sampling (mamba memory):  80%|████████  | 160/200 [00:56<00:40,  1.00s/it]Sampling (mamba memory):  80%|████████  | 161/200 [00:57<00:39,  1.00s/it]Sampling (mamba memory):  81%|████████  | 162/200 [00:58<00:38,  1.00s/it]Sampling (mamba memory):  82%|████████▏ | 163/200 [00:59<00:37,  1.00s/it]Sampling (mamba memory):  82%|████████▏ | 164/200 [01:00<00:36,  1.00s/it]Sampling (mamba memory):  82%|████████▎ | 165/200 [01:01<00:35,  1.01s/it]Sampling (mamba memory):  83%|████████▎ | 166/200 [01:02<00:34,  1.01s/it]Sampling (mamba memory):  84%|████████▎ | 167/200 [01:04<00:33,  1.01s/it]Sampling (mamba memory):  84%|████████▍ | 168/200 [01:05<00:32,  1.01s/itSampling (mamba memory):  84%|████████▍ | 169/200 [01:04<00:30,  1.02it/s][A[A

Sampling (mamba memory):  85%|████████▌ | 170/200 [01:05<00:29,  1.01it/s][A[A

Sampling (mamba memory):  86%|████████▌ | 171/200 [01:06<00:28,  1.02it/s][A[A

Sampling (mamba memory):  86%|████████▌ | 172/200 [01:07<00:27,  1.01it/s][A[A

Sampling (mamba memory):  86%|████████▋ | 173/200 [01:08<00:26,  1.02it/s][A[A

Sampling (mamba memory):  87%|████████▋ | 174/200 [01:09<00:25,  1.01it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:01<00:28,  1.07it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:02<00:28,  1.07it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:03<00:27,  1.07it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:04<00:26,  1.07it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:05<00:25,  1.06it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:06<00:24,  1.06it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:07<00:23,  1.06it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:08<00:22,  1.06it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:08<00:21,  1.06it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:09<00:20,  1.06it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:10<00:19,  1.05it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:10<00:24,  1.01it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:01<00:29,  1.06it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:02<00:28,  1.06it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:03<00:27,  1.05it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:04<00:26,  1.05it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:05<00:25,  1.05it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:06<00:24,  1.05it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:07<00:23,  1.05it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:08<00:22,  1.05it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:09<00:21,  1.05it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:10<00:20,  1.05it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:11<00:20,  1.05it/s]]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:01<00:29,  1.07it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:02<00:28,  1.07it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:03<00:27,  1.07it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:04<00:26,  1.06it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:05<00:25,  1.06it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:06<00:24,  1.06it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:07<00:23,  1.06it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:08<00:22,  1.06it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:09<00:21,  1.05it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:10<00:21,  1.05it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:11<00:20,  1.04it/s]]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:01<00:29,  1.06it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:02<00:28,  1.06it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:03<00:27,  1.06it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:04<00:26,  1.05it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:05<00:25,  1.06it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:06<00:24,  1.06it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:07<00:23,  1.06it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:08<00:22,  1.05it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:09<00:21,  1.05it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:10<00:21,  1.04it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:11<00:20,  1.04it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:11<00:23,  1.01it/s][A[A

Sampling (mamba memory):  88%|████████▊ | 177/200 [01:12<00:22,  1.00it/s][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:03<00:30,  1.02it/s]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:04<00:29,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:05<00:28,  1.02it/s]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:06<00:27,  1.02it/s]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:07<00:26,  1.03it/s]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:08<00:25,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:09<00:24,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:10<00:23,  1.02it/s]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:11<00:22,  1.02it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:12<00:21,  1.02it/s]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:13<00:20,  1.01it/s]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:13<00:21,  1.00it/s][A[A

Sampling (mamba memory):  90%|████████▉ | 179/200 [01:14<00:21,  1.00s/it][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:05<00:31,  1.00s/it]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:06<00:30,  1.00s/it]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:07<00:29,  1.00s/it]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:08<00:28,  1.01s/it]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:09<00:27,  1.01s/it]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:10<00:26,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:11<00:25,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:12<00:24,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:13<00:23,  1.01s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:14<00:22,  1.02s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:15<00:21,  1.02s/it]Sampling (mamba memory):  90%|█████████ | 180/200 [01:15<00:20,  1.00s/it][A[A

]Sampling (mamba memory):  84%|████████▍ | 169/200 [01:06<00:31,  1.01s/it]Sampling (mamba memory):  85%|████████▌ | 170/200 [01:07<00:30,  1.01s/it]Sampling (mamba memory):  86%|████████▌ | 171/200 [01:08<00:29,  1.01s/it]Sampling (mamba memory):  86%|████████▌ | 172/200 [01:09<00:28,  1.01s/it]Sampling (mamba memory):  86%|████████▋ | 173/200 [01:10<00:27,  1.01s/it]Sampling (mamba memory):  87%|████████▋ | 174/200 [01:11<00:26,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 175/200 [01:12<00:25,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 176/200 [01:13<00:24,  1.01s/it]Sampling (mamba memory):  88%|████████▊ | 177/200 [01:14<00:23,  1.02s/it]Sampling (mamba memory):  89%|████████▉ | 178/200 [01:15<00:22,  1.02s/it]Sampling (mamba memory):  90%|████████▉ | 179/200 [01:16<00:21,  1.02s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:16<00:19,  1.01s/it][A[A

Sampling (mamba memory):  91%|█████████ | 182/200 [01:17<00:18,  1.01s/it][A[A

Sampling (mamba memory):  92%|█████████▏| 183/200 [01:18<00:17,  1.01s/it][A[A

Sampling (mamba memory):  92%|█████████▏| 184/200 [01:19<00:16,  1.01s/it][A[A

Sampling (mamba memory):  92%|█████████▎| 185/200 [01:20<00:15,  1.01s/it][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:11<00:19,  1.05it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:12<00:18,  1.05it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:13<00:17,  1.05it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:14<00:16,  1.05it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:15<00:15,  1.04it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:16<00:14,  1.04it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:17<00:13,  1.04it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:18<00:12,  1.04it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:19<00:11,  1.03it/s]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:20<00:10,  1.03it/s]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:21<00Sampling (mamba memory):  90%|█████████ | 180/200 [01:12<00:19,  1.04it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:13<00:18,  1.04it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:13<00:17,  1.04it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:14<00:16,  1.03it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:15<00:15,  1.03it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:16<00:14,  1.03it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:17<00:13,  1.03it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:18<00:12,  1.02it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:19<00:11,  1.02it/s]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:20<00:10,  1.02it/s]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:21<00Sampling (mamba memory):  90%|█████████ | 180/200 [01:12<00:19,  1.04it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:13<00:18,  1.04it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:14<00:17,  1.04it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:15<00:16,  1.04it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:16<00:15,  1.04it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:16<00:14,  1.03it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:17<00:13,  1.03it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:18<00:12,  1.03it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:19<00:11,  1.03it/s]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:20<00:10,  1.03it/s]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:21<00Sampling (mamba memory):  93%|█████████▎| 186/200 [01:21<00:14,  1.01s/it][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:12<00:19,  1.04it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:13<00:18,  1.03it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:14<00:17,  1.03it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:15<00:16,  1.03it/s]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:16<00:15,  1.03it/s]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:17<00:14,  1.02it/s]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:18<00:13,  1.02it/s]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:19<00:12,  1.03it/s]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:20<00:11,  1.03it/s]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:21<00:10,  1.02it/s]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:22<00Sampling (mamba memory):  94%|█████████▎| 187/200 [01:22<00:13,  1.01s/it][A[A

Sampling (mamba memory):  94%|█████████▍| 188/200 [01:23<00:12,  1.01s/it][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:14<00:19,  1.01it/s]Sampling (mamba memory):  90%|█████████ | 181/200 [01:15<00:18,  1.00it/s]Sampling (mamba memory):  91%|█████████ | 182/200 [01:16<00:17,  1.00it/s]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:17<00:17,  1.00s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:18<00:16,  1.00s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:19<00:15,  1.00s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:20<00:14,  1.00s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:21<00:13,  1.01s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:22<00:12,  1.00s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:23<00:11,  1.01s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:24<00Sampling (mamba memory):  94%|█████████▍| 189/200 [01:24<00:11,  1.02s/it][A[A

Sampling (mamba memory):  95%|█████████▌| 190/200 [01:25<00:10,  1.02s/it][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:16<00:20,  1.01s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:17<00:19,  1.01s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:18<00:18,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:19<00:17,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:20<00:16,  1.02s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:21<00:15,  1.02s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:22<00:14,  1.02s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:23<00:13,  1.02s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:24<00:12,  1.02s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:25<00:11,  1.02s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:26<00Sampling (mamba memory):  96%|█████████▌| 191/200 [01:26<00:09,  1.02s/it][A[A

Sampling (mamba memory):  90%|█████████ | 180/200 [01:17<00:20,  1.02s/it]Sampling (mamba memory):  90%|█████████ | 181/200 [01:18<00:19,  1.02s/it]Sampling (mamba memory):  91%|█████████ | 182/200 [01:19<00:18,  1.02s/it]Sampling (mamba memory):  92%|█████████▏| 183/200 [01:20<00:17,  1.01s/it]Sampling (mamba memory):  92%|█████████▏| 184/200 [01:21<00:16,  1.01s/it]Sampling (mamba memory):  92%|█████████▎| 185/200 [01:22<00:15,  1.01s/it]Sampling (mamba memory):  93%|█████████▎| 186/200 [01:23<00:14,  1.02s/it]Sampling (mamba memory):  94%|█████████▎| 187/200 [01:24<00:13,  1.03s/it]Sampling (mamba memory):  94%|█████████▍| 188/200 [01:25<00:12,  1.03s/it]Sampling (mamba memory):  94%|█████████▍| 189/200 [01:26<00:11,  1.03s/it]Sampling (mamba memory):  95%|█████████▌| 190/200 [01:27<00Sampling (mamba memory):  96%|█████████▌| 192/200 [01:27<00:08,  1.02s/it][A[A

Sampling (mamba memory):  96%|█████████▋| 193/200 [01:28<00:07,  1.02s/it][A[A

Sampling (mamba memory):  97%|█████████▋| 194/200 [01:29<00:06,  1.02s/it][A[A

Sampling (mamba memory):  98%|█████████▊| 195/200 [01:30<00:05,  1.02s/it][A[A

Sampling (mamba memory):  98%|█████████▊| 196/200 [01:31<00:04,  1.02s/it][A[A

Sampling (mamba memory):  98%|█████████▊| 197/200 [01:32<00:03,  1.02s/it][A[A

Sampling (mamba memory):  99%|█████████▉| 198/200 [01:33<00:02,  1.01s/it][A[A

Sampling (mamba memory): 100%|█████████▉| 199/200 [01:34<00:01,  1.01s/it][A[A

:09,  1.03it/s]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:22<00:08,  1.03it/s]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:23<00:07,  1.03it/s]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:24<00:06,  1.03it/s]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:25<00:05,  1.03it/s]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:26<00:04,  1.02it/s]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:27<00:03,  1.03it/s]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:28<00:02,  1.03it/s]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:29<00:01,  1.02it/s]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:30<00:00,  1.02it/s]Sampling (mamba memory): 100%|██████████| 200/200 [01:31<00:00,  1.02it/s]Sampling (mamba memory): 100%|██████████| 200/200 [01:36<00:00,  1.04it/s]
:09,  1.02it/s]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:22<00:08,  1.02it/s]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:23<00:07,  1.02it/s]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:24<00:06,  1.01it/s]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:25<00:05,  1.01it/s]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:26<00:04,  1.01it/s]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:27<00:03,  1.01it/s]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:28<00:02,  1.01it/s]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:29<00:01,  1.01it/s]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:30<00:00,  1.01it/s]Sampling (mamba memory): 100%|██████████| 200/200 [01:31<00:00,  1.01it/s]Sampling (mamba memory): 100%|██████████| 200/200 [01:36<00:00,  1.04it/s]
:09,  1.03it/s]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:22<00:08,  1.03it/s]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:23<00:07,  1.03it/s]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:24<00:06,  1.03it/s]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:25<00:05,  1.02it/s]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:26<00:04,  1.02it/s]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:27<00:03,  1.01it/s]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:28<00:02,  1.01it/s]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:29<00:01,  1.01it/s]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:30<00:00,  1.01it/s]Sampling (mamba memory): 100%|██████████| 200/200 [01:31<00:00,  1.01it/s]Sampling (mamba memory): 100%|██████████| 200/200 [01:36<00:00,  1.03it/s]
:09,  1.02it/s]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:23<00:08,  1.02it/s]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:24<00:07,  1.02it/s]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:25<00:06,  1.02it/s]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:26<00:05,  1.02it/s]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:27<00:04,  1.01it/s]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:28<00:03,  1.02it/s]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:29<00:02,  1.02it/s]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:30<00:01,  1.02it/s]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:31<00:00,  1.02it/s]Sampling (mamba memory): 100%|██████████| 200/200 [01:32<00:00,  1.02it/s]Sampling (mamba memory): 100%|██████████| 200/200 [01:36<00:00,  1.03it/s]
:10,  1.01s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:25<00:09,  1.01s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:26<00:08,  1.01s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:27<00:07,  1.01s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:28<00:06,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:29<00:05,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:30<00:04,  1.01s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:31<00:03,  1.02s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:32<00:02,  1.01s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:33<00:01,  1.00s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:34<00:00,  1.00s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:39<00:00,  1.00it/s]
Sampling (mamba memory): 100%|██████████| 200/200 [01:35<00:00,  1.02s/it][A[ASampling (mamba memory): 100%|██████████| 200/200 [01:40<00:00,  1.00s/it]
Validation DataLoader 0:   0%|          | 0/1 [00:00<?, ?it/s][A
:10,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:27<00:09,  1.02s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:28<00:08,  1.02s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:29<00:07,  1.02s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:30<00:06,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:31<00:05,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:32<00:04,  1.02s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:33<00:03,  1.02s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:34<00:02,  1.02s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:35<00:01,  1.04s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:36<00:00,  1.04s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:41<00:00,  1.02s/it]
:10,  1.03s/it]Sampling (mamba memory):  96%|█████████▌| 191/200 [01:28<00:09,  1.04s/it]Sampling (mamba memory):  96%|█████████▌| 192/200 [01:29<00:08,  1.03s/it]Sampling (mamba memory):  96%|█████████▋| 193/200 [01:30<00:07,  1.03s/it]Sampling (mamba memory):  97%|█████████▋| 194/200 [01:31<00:06,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 195/200 [01:32<00:05,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 196/200 [01:33<00:04,  1.03s/it]Sampling (mamba memory):  98%|█████████▊| 197/200 [01:34<00:03,  1.03s/it]Sampling (mamba memory):  99%|█████████▉| 198/200 [01:35<00:02,  1.04s/it]Sampling (mamba memory): 100%|█████████▉| 199/200 [01:36<00:01,  1.05s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:37<00:00,  1.04s/it]Sampling (mamba memory): 100%|██████████| 200/200 [01:42<00:00,  1.03s/it]
Validation DataLoader 0: 100%|██████████| 1/1 [01:40<00:00,  0.01it/s][A
                                                                      [AEpoch 0:  17%|█▋        | 34999/203307 [5:45:52<27:43:19,  1.69it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 35000/203307 [5:45:57<27:43:37,  1.69it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 35000/203307 [5:45:57<27:43:37,  1.69it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 35001/203307 [5:46:00<27:43:51,  1.69it/s, v_num=line, training/loss=0.0876]Epoch 0:  17%|█▋        | 35001/203307 [5:46:00<27:43:51,  1.69it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35002/203307 [5:46:04<27:44:06,  1.69it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35002/203307 [5:46:04<27:44:06,  1.69it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35003/203307 [5:46:08<27:44:21,  1.69it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35003/203307 [5:46:08<27:44:21,  1.69it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35004/203307 [5:46:13<27:44:39,  1.69it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35004/203307 [5:46:13<27:44:39,  1.69it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35005/203307 [5:46:17<27:44:57,  1.68it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35005/203307 [5:46:17<27:44:57,  1.68it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35006/203307 [5:46:21<27:45:11,  1.68it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35006/203307 [5:46:21<27:45:11,  1.68it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35007/203307 [5:46:25<27:45:27,  1.68it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35007/203307 [5:46:25<27:45:27,  1.68it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35008/203307 [5:46:29<27:45:42,  1.68it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35008/203307 [5:46:29<27:45:43,  1.68it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35009/203307 [5:46:33<27:45:57,  1.68it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35009/203307 [5:46:33<27:45:57,  1.68it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35010/203307 [5:46:36<27:46:12,  1.68it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35010/203307 [5:46:36<27:46:12,  1.68it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35011/203307 [5:46:40<27:46:27,  1.68it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35011/203307 [5:46:40<27:46:27,  1.68it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35012/203307 [5:46:44<27:46:44,  1.68it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35012/203307 [5:46:44<27:46:44,  1.68it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35013/203307 [5:46:49<27:47:02,  1.68it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35013/203307 [5:46:49<27:47:02,  1.68it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35014/203307 [5:46:53<27:47:17,  1.68it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35014/203307 [5:46:53<27:47:17,  1.68it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35015/203307 [5:46:57<27:47:35,  1.68it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35015/203307 [5:46:57<27:47:35,  1.68it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35016/203307 [5:47:01<27:47:49,  1.68it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35016/203307 [5:47:01<27:47:49,  1.68it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35017/203307 [5:47:05<27:48:04,  1.68it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35017/203307 [5:47:05<27:48:04,  1.68it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35018/203307 [5:47:08<27:48:19,  1.68it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35018/203307 [5:47:08<27:48:19,  1.68it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35019/203307 [5:47:12<27:48:33,  1.68it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35019/203307 [5:47:12<27:48:33,  1.68it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35020/203307 [5:47:16<27:48:48,  1.68it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35020/203307 [5:47:16<27:48:48,  1.68it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35021/203307 [5:47:21<27:49:07,  1.68it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35021/203307 [5:47:21<27:49:07,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35022/203307 [5:47:24<27:49:22,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35022/203307 [5:47:24<27:49:22,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35023/203307 [5:47:28<27:49:36,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35023/203307 [5:47:28<27:49:36,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35024/203307 [5:47:33<27:49:54,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35024/203307 [5:47:33<27:49:54,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35025/203307 [5:47:37<27:50:11,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35025/203307 [5:47:37<27:50:11,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35026/203307 [5:47:41<27:50:26,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35026/203307 [5:47:41<27:50:26,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35027/203307 [5:47:44<27:50:41,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35027/203307 [5:47:44<27:50:41,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35028/203307 [5:47:48<27:50:56,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35028/203307 [5:47:48<27:50:56,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35029/203307 [5:47:53<27:51:14,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35029/203307 [5:47:53<27:51:14,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35030/203307 [5:47:57<27:51:32,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35030/203307 [5:47:57<27:51:32,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35031/203307 [5:48:01<27:51:47,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35031/203307 [5:48:01<27:51:47,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35032/203307 [5:48:05<27:52:01,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35032/203307 [5:48:05<27:52:01,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35033/203307 [5:48:09<27:52:19,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35033/203307 [5:48:09<27:52:19,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35034/203307 [5:48:14<27:52:37,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35034/203307 [5:48:14<27:52:37,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35035/203307 [5:48:17<27:52:52,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35035/203307 [5:48:17<27:52:52,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35036/203307 [5:48:21<27:53:06,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35036/203307 [5:48:21<27:53:06,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35037/203307 [5:48:25<27:53:23,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35037/203307 [5:48:26<27:53:23,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35038/203307 [5:48:29<27:53:39,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35038/203307 [5:48:29<27:53:39,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35039/203307 [5:48:34<27:53:57,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35039/203307 [5:48:34<27:53:57,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35040/203307 [5:48:38<27:54:11,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35040/203307 [5:48:38<27:54:11,  1.68it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35041/203307 [5:48:42<27:54:29,  1.67it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35041/203307 [5:48:42<27:54:29,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35042/203307 [5:48:46<27:54:46,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35042/203307 [5:48:46<27:54:46,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35043/203307 [5:48:50<27:55:00,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35043/203307 [5:48:50<27:55:01,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35044/203307 [5:48:54<27:55:15,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35044/203307 [5:48:54<27:55:15,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35045/203307 [5:48:58<27:55:30,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35045/203307 [5:48:58<27:55:30,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35046/203307 [5:49:02<27:55:48,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35046/203307 [5:49:02<27:55:48,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35047/203307 [5:49:07<27:56:06,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35047/203307 [5:49:07<27:56:06,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35048/203307 [5:49:10<27:56:20,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35048/203307 [5:49:10<27:56:20,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35049/203307 [5:49:14<27:56:35,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35049/203307 [5:49:14<27:56:35,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35050/203307 [5:49:18<27:56:52,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35050/203307 [5:49:18<27:56:52,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35051/203307 [5:49:22<27:57:07,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35051/203307 [5:49:22<27:57:07,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35052/203307 [5:49:27<27:57:25,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35052/203307 [5:49:27<27:57:25,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35053/203307 [5:49:30<27:57:39,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35053/203307 [5:49:30<27:57:39,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35054/203307 [5:49:35<27:57:56,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35054/203307 [5:49:35<27:57:56,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35055/203307 [5:49:38<27:58:11,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35055/203307 [5:49:38<27:58:11,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35056/203307 [5:49:43<27:58:29,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35056/203307 [5:49:43<27:58:29,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35057/203307 [5:49:47<27:58:43,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35057/203307 [5:49:47<27:58:43,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35058/203307 [5:49:50<27:58:58,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35058/203307 [5:49:50<27:58:58,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35059/203307 [5:49:55<27:59:15,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35059/203307 [5:49:55<27:59:15,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35060/203307 [5:49:58<27:59:30,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35060/203307 [5:49:58<27:59:30,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35061/203307 [5:50:03<27:59:47,  1.67it/s, v_num=line, training/loss=0.0882]Epoch 0:  17%|█▋        | 35061/203307 [5:50:03<27:59:47,  1.67it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35062/203307 [5:50:07<28:00:05,  1.67it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35062/203307 [5:50:07<28:00:05,  1.67it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35063/203307 [5:50:11<28:00:19,  1.67it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35063/203307 [5:50:11<28:00:19,  1.67it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35064/203307 [5:50:15<28:00:34,  1.67it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35064/203307 [5:50:15<28:00:34,  1.67it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35065/203307 [5:50:19<28:00:53,  1.67it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35065/203307 [5:50:19<28:00:53,  1.67it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35066/203307 [5:50:23<28:01:07,  1.67it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35066/203307 [5:50:23<28:01:07,  1.67it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35067/203307 [5:50:27<28:01:25,  1.67it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35067/203307 [5:50:27<28:01:25,  1.67it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35068/203307 [5:50:31<28:01:39,  1.67it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35068/203307 [5:50:31<28:01:39,  1.67it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35069/203307 [5:50:35<28:01:56,  1.67it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35069/203307 [5:50:35<28:01:56,  1.67it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35070/203307 [5:50:39<28:02:11,  1.67it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35070/203307 [5:50:39<28:02:11,  1.67it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35071/203307 [5:50:44<28:02:29,  1.67it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35071/203307 [5:50:44<28:02:29,  1.67it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35072/203307 [5:50:48<28:02:44,  1.67it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35072/203307 [5:50:48<28:02:44,  1.67it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35073/203307 [5:50:52<28:03:02,  1.67it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35073/203307 [5:50:52<28:03:02,  1.67it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35074/203307 [5:50:56<28:03:16,  1.67it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35074/203307 [5:50:56<28:03:16,  1.67it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35075/203307 [5:51:00<28:03:31,  1.67it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35075/203307 [5:51:00<28:03:31,  1.67it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35076/203307 [5:51:04<28:03:49,  1.67it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35076/203307 [5:51:04<28:03:49,  1.67it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35077/203307 [5:51:08<28:04:03,  1.66it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35077/203307 [5:51:08<28:04:03,  1.66it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35078/203307 [5:51:12<28:04:18,  1.66it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35078/203307 [5:51:12<28:04:18,  1.66it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35079/203307 [5:51:16<28:04:36,  1.66it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35079/203307 [5:51:16<28:04:36,  1.66it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35080/203307 [5:51:20<28:04:51,  1.66it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35080/203307 [5:51:20<28:04:51,  1.66it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35081/203307 [5:51:24<28:05:06,  1.66it/s, v_num=line, training/loss=0.0747]Epoch 0:  17%|█▋        | 35081/203307 [5:51:24<28:05:06,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35082/203307 [5:51:28<28:05:24,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35082/203307 [5:51:28<28:05:24,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35083/203307 [5:51:32<28:05:38,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35083/203307 [5:51:32<28:05:38,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35084/203307 [5:51:36<28:05:53,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35084/203307 [5:51:36<28:05:53,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35085/203307 [5:51:40<28:06:11,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35085/203307 [5:51:40<28:06:11,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35086/203307 [5:51:44<28:06:25,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35086/203307 [5:51:44<28:06:25,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35087/203307 [5:51:48<28:06:43,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35087/203307 [5:51:48<28:06:43,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35088/203307 [5:51:53<28:07:00,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35088/203307 [5:51:53<28:07:00,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35089/203307 [5:51:56<28:07:14,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35089/203307 [5:51:56<28:07:14,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35090/203307 [5:52:00<28:07:29,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35090/203307 [5:52:00<28:07:29,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35091/203307 [5:52:05<28:07:47,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35091/203307 [5:52:05<28:07:47,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35092/203307 [5:52:08<28:08:02,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35092/203307 [5:52:08<28:08:02,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35093/203307 [5:52:13<28:08:19,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35093/203307 [5:52:13<28:08:19,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35094/203307 [5:52:16<28:08:34,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35094/203307 [5:52:16<28:08:34,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35095/203307 [5:52:20<28:08:48,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35095/203307 [5:52:20<28:08:48,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35096/203307 [5:52:25<28:09:06,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35096/203307 [5:52:25<28:09:06,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35097/203307 [5:52:28<28:09:20,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35097/203307 [5:52:28<28:09:20,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35098/203307 [5:52:32<28:09:35,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35098/203307 [5:52:32<28:09:35,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35099/203307 [5:52:37<28:09:53,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35099/203307 [5:52:37<28:09:53,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35100/203307 [5:52:40<28:10:08,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35100/203307 [5:52:40<28:10:08,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35101/203307 [5:52:44<28:10:22,  1.66it/s, v_num=line, training/loss=0.0792]Epoch 0:  17%|█▋        | 35101/203307 [5:52:44<28:10:22,  1.66it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35102/203307 [5:52:49<28:10:39,  1.66it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35102/203307 [5:52:49<28:10:39,  1.66it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35103/203307 [5:52:52<28:10:54,  1.66it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35103/203307 [5:52:52<28:10:54,  1.66it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35104/203307 [5:52:57<28:11:11,  1.66it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35104/203307 [5:52:57<28:11:11,  1.66it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35105/203307 [5:53:00<28:11:25,  1.66it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35105/203307 [5:53:00<28:11:25,  1.66it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35106/203307 [5:53:05<28:11:43,  1.66it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35106/203307 [5:53:05<28:11:43,  1.66it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35107/203307 [5:53:08<28:11:57,  1.66it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35107/203307 [5:53:08<28:11:57,  1.66it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35108/203307 [5:53:13<28:12:15,  1.66it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35108/203307 [5:53:13<28:12:15,  1.66it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35109/203307 [5:53:17<28:12:29,  1.66it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35109/203307 [5:53:17<28:12:29,  1.66it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35110/203307 [5:53:20<28:12:43,  1.66it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35110/203307 [5:53:20<28:12:43,  1.66it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35111/203307 [5:53:25<28:13:00,  1.66it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35111/203307 [5:53:25<28:13:00,  1.66it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35112/203307 [5:53:29<28:13:18,  1.66it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35112/203307 [5:53:29<28:13:18,  1.66it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35113/203307 [5:53:33<28:13:32,  1.66it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35113/203307 [5:53:33<28:13:32,  1.66it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35114/203307 [5:53:36<28:13:46,  1.66it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35114/203307 [5:53:36<28:13:46,  1.66it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35115/203307 [5:53:41<28:14:03,  1.65it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35115/203307 [5:53:41<28:14:03,  1.65it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35116/203307 [5:53:44<28:14:18,  1.65it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35116/203307 [5:53:44<28:14:18,  1.65it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35117/203307 [5:53:49<28:14:36,  1.65it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35117/203307 [5:53:49<28:14:36,  1.65it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35118/203307 [5:53:53<28:14:51,  1.65it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35118/203307 [5:53:53<28:14:51,  1.65it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35119/203307 [5:53:57<28:15:08,  1.65it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35119/203307 [5:53:57<28:15:08,  1.65it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35120/203307 [5:54:01<28:15:23,  1.65it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35120/203307 [5:54:01<28:15:23,  1.65it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35121/203307 [5:54:05<28:15:40,  1.65it/s, v_num=line, training/loss=0.0833]Epoch 0:  17%|█▋        | 35121/203307 [5:54:05<28:15:40,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35122/203307 [5:54:09<28:15:54,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35122/203307 [5:54:09<28:15:54,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35123/203307 [5:54:13<28:16:11,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35123/203307 [5:54:13<28:16:11,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35124/203307 [5:54:17<28:16:26,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35124/203307 [5:54:17<28:16:26,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35125/203307 [5:54:22<28:16:44,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35125/203307 [5:54:22<28:16:44,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35126/203307 [5:54:25<28:16:59,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35126/203307 [5:54:25<28:16:59,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35127/203307 [5:54:29<28:17:14,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35127/203307 [5:54:29<28:17:14,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35128/203307 [5:54:34<28:17:31,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35128/203307 [5:54:34<28:17:31,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35129/203307 [5:54:38<28:17:49,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35129/203307 [5:54:38<28:17:49,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35130/203307 [5:54:42<28:18:03,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35130/203307 [5:54:42<28:18:04,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35131/203307 [5:54:46<28:18:18,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35131/203307 [5:54:46<28:18:18,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35132/203307 [5:54:49<28:18:33,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35132/203307 [5:54:49<28:18:33,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35133/203307 [5:54:54<28:18:50,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35133/203307 [5:54:54<28:18:50,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35134/203307 [5:54:58<28:19:09,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35134/203307 [5:54:58<28:19:09,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35135/203307 [5:55:02<28:19:23,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35135/203307 [5:55:02<28:19:23,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35136/203307 [5:55:06<28:19:38,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35136/203307 [5:55:06<28:19:38,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35137/203307 [5:55:10<28:19:56,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35137/203307 [5:55:10<28:19:56,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35138/203307 [5:55:14<28:20:11,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35138/203307 [5:55:14<28:20:11,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35139/203307 [5:55:18<28:20:25,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35139/203307 [5:55:18<28:20:25,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35140/203307 [5:55:22<28:20:40,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35140/203307 [5:55:22<28:20:40,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35141/203307 [5:55:26<28:20:55,  1.65it/s, v_num=line, training/loss=0.0857]Epoch 0:  17%|█▋        | 35141/203307 [5:55:26<28:20:55,  1.65it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35142/203307 [5:55:30<28:21:13,  1.65it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35142/203307 [5:55:30<28:21:13,  1.65it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35143/203307 [5:55:35<28:21:31,  1.65it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35143/203307 [5:55:35<28:21:31,  1.65it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35144/203307 [5:55:38<28:21:45,  1.65it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35144/203307 [5:55:38<28:21:45,  1.65it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35145/203307 [5:55:43<28:22:03,  1.65it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35145/203307 [5:55:43<28:22:03,  1.65it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35146/203307 [5:55:47<28:22:20,  1.65it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35146/203307 [5:55:47<28:22:20,  1.65it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35147/203307 [5:55:51<28:22:35,  1.65it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35147/203307 [5:55:51<28:22:35,  1.65it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35148/203307 [5:55:55<28:22:49,  1.65it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35148/203307 [5:55:55<28:22:49,  1.65it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35149/203307 [5:55:58<28:23:04,  1.65it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35149/203307 [5:55:58<28:23:04,  1.65it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35150/203307 [5:56:03<28:23:22,  1.65it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35150/203307 [5:56:03<28:23:22,  1.65it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35151/203307 [5:56:07<28:23:40,  1.65it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35151/203307 [5:56:07<28:23:40,  1.65it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35152/203307 [5:56:11<28:23:54,  1.64it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35152/203307 [5:56:11<28:23:54,  1.64it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35153/203307 [5:56:15<28:24:09,  1.64it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35153/203307 [5:56:15<28:24:09,  1.64it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35154/203307 [5:56:19<28:24:26,  1.64it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35154/203307 [5:56:19<28:24:27,  1.64it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35155/203307 [5:56:23<28:24:41,  1.64it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35155/203307 [5:56:23<28:24:41,  1.64it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35156/203307 [5:56:27<28:24:56,  1.64it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35156/203307 [5:56:27<28:24:56,  1.64it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35157/203307 [5:56:31<28:25:10,  1.64it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35157/203307 [5:56:31<28:25:10,  1.64it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35158/203307 [5:56:34<28:25:24,  1.64it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35158/203307 [5:56:34<28:25:24,  1.64it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35159/203307 [5:56:38<28:25:39,  1.64it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35159/203307 [5:56:38<28:25:39,  1.64it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35160/203307 [5:56:43<28:25:57,  1.64it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35160/203307 [5:56:43<28:25:57,  1.64it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35161/203307 [5:56:47<28:26:12,  1.64it/s, v_num=line, training/loss=0.0813]Epoch 0:  17%|█▋        | 35161/203307 [5:56:47<28:26:12,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35162/203307 [5:56:51<28:26:29,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35162/203307 [5:56:51<28:26:29,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35163/203307 [5:56:55<28:26:47,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35163/203307 [5:56:55<28:26:47,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35164/203307 [5:56:59<28:27:02,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35164/203307 [5:56:59<28:27:02,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35165/203307 [5:57:03<28:27:16,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35165/203307 [5:57:03<28:27:16,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35166/203307 [5:57:07<28:27:31,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35166/203307 [5:57:07<28:27:31,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35167/203307 [5:57:11<28:27:46,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35167/203307 [5:57:11<28:27:46,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35168/203307 [5:57:14<28:28:01,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35168/203307 [5:57:15<28:28:01,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35169/203307 [5:57:19<28:28:19,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35169/203307 [5:57:19<28:28:19,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35170/203307 [5:57:23<28:28:33,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35170/203307 [5:57:23<28:28:33,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35171/203307 [5:57:27<28:28:51,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35171/203307 [5:57:27<28:28:51,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35172/203307 [5:57:31<28:29:05,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35172/203307 [5:57:31<28:29:06,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35173/203307 [5:57:35<28:29:20,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35173/203307 [5:57:35<28:29:20,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35174/203307 [5:57:39<28:29:35,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35174/203307 [5:57:39<28:29:35,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35175/203307 [5:57:42<28:29:50,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35175/203307 [5:57:42<28:29:50,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35176/203307 [5:57:46<28:30:04,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35176/203307 [5:57:46<28:30:04,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35177/203307 [5:57:51<28:30:22,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35177/203307 [5:57:51<28:30:22,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35178/203307 [5:57:54<28:30:36,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35178/203307 [5:57:54<28:30:36,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35179/203307 [5:57:59<28:30:53,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35179/203307 [5:57:59<28:30:54,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35180/203307 [5:58:03<28:31:11,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35180/203307 [5:58:03<28:31:11,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35181/203307 [5:58:07<28:31:25,  1.64it/s, v_num=line, training/loss=0.0766]Epoch 0:  17%|█▋        | 35181/203307 [5:58:07<28:31:25,  1.64it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35182/203307 [5:58:11<28:31:40,  1.64it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35182/203307 [5:58:11<28:31:40,  1.64it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35183/203307 [5:58:14<28:31:54,  1.64it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35183/203307 [5:58:14<28:31:54,  1.64it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35184/203307 [5:58:18<28:32:09,  1.64it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35184/203307 [5:58:18<28:32:09,  1.64it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35185/203307 [5:58:22<28:32:23,  1.64it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35185/203307 [5:58:22<28:32:23,  1.64it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35186/203307 [5:58:27<28:32:42,  1.64it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35186/203307 [5:58:27<28:32:42,  1.64it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35187/203307 [5:58:31<28:32:58,  1.64it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35187/203307 [5:58:31<28:32:59,  1.64it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35188/203307 [5:58:35<28:33:13,  1.64it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35188/203307 [5:58:35<28:33:13,  1.64it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35189/203307 [5:58:39<28:33:31,  1.64it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35189/203307 [5:58:39<28:33:31,  1.64it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35190/203307 [5:58:43<28:33:45,  1.63it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35190/203307 [5:58:43<28:33:45,  1.63it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35191/203307 [5:58:46<28:33:59,  1.63it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35191/203307 [5:58:46<28:33:59,  1.63it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35192/203307 [5:58:50<28:34:13,  1.63it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35192/203307 [5:58:50<28:34:13,  1.63it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35193/203307 [5:58:54<28:34:27,  1.63it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35193/203307 [5:58:54<28:34:27,  1.63it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35194/203307 [5:58:58<28:34:42,  1.63it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35194/203307 [5:58:58<28:34:42,  1.63it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35195/203307 [5:59:02<28:35:00,  1.63it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35195/203307 [5:59:02<28:35:00,  1.63it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35196/203307 [5:59:07<28:35:18,  1.63it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35196/203307 [5:59:07<28:35:18,  1.63it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35197/203307 [5:59:11<28:35:35,  1.63it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35197/203307 [5:59:11<28:35:35,  1.63it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35198/203307 [5:59:15<28:35:49,  1.63it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35198/203307 [5:59:15<28:35:49,  1.63it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35199/203307 [5:59:18<28:36:03,  1.63it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35199/203307 [5:59:18<28:36:03,  1.63it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35200/203307 [5:59:22<28:36:18,  1.63it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35200/203307 [5:59:22<28:36:18,  1.63it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35201/203307 [5:59:26<28:36:32,  1.63it/s, v_num=line, training/loss=0.0772]Epoch 0:  17%|█▋        | 35201/203307 [5:59:26<28:36:32,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35202/203307 [5:59:30<28:36:47,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35202/203307 [5:59:30<28:36:47,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35203/203307 [5:59:34<28:37:06,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35203/203307 [5:59:35<28:37:06,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35204/203307 [5:59:39<28:37:24,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35204/203307 [5:59:39<28:37:24,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35205/203307 [5:59:43<28:37:38,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35205/203307 [5:59:43<28:37:38,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35206/203307 [5:59:47<28:37:55,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35206/203307 [5:59:47<28:37:55,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35207/203307 [5:59:51<28:38:09,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35207/203307 [5:59:51<28:38:09,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35208/203307 [5:59:54<28:38:24,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35208/203307 [5:59:54<28:38:24,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35209/203307 [5:59:58<28:38:38,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35209/203307 [5:59:58<28:38:38,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35210/203307 [6:00:02<28:38:52,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35210/203307 [6:00:02<28:38:52,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35211/203307 [6:00:06<28:39:06,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35211/203307 [6:00:06<28:39:07,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35212/203307 [6:00:10<28:39:25,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35212/203307 [6:00:10<28:39:25,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35213/203307 [6:00:14<28:39:39,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35213/203307 [6:00:14<28:39:39,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35214/203307 [6:00:18<28:39:56,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35214/203307 [6:00:18<28:39:57,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35215/203307 [6:00:23<28:40:14,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35215/203307 [6:00:23<28:40:14,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35216/203307 [6:00:26<28:40:28,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35216/203307 [6:00:26<28:40:28,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35217/203307 [6:00:30<28:40:42,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35217/203307 [6:00:30<28:40:42,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35218/203307 [6:00:34<28:40:57,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35218/203307 [6:00:34<28:40:57,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35219/203307 [6:00:38<28:41:12,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35219/203307 [6:00:38<28:41:12,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35220/203307 [6:00:42<28:41:27,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35220/203307 [6:00:42<28:41:27,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35221/203307 [6:00:46<28:41:46,  1.63it/s, v_num=line, training/loss=0.0801]Epoch 0:  17%|█▋        | 35221/203307 [6:00:46<28:41:46,  1.63it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35222/203307 [6:00:50<28:42:00,  1.63it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35222/203307 [6:00:50<28:42:00,  1.63it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35223/203307 [6:00:55<28:42:18,  1.63it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35223/203307 [6:00:55<28:42:18,  1.63it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35224/203307 [6:00:59<28:42:33,  1.63it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35224/203307 [6:00:59<28:42:33,  1.63it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35225/203307 [6:01:02<28:42:48,  1.63it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35225/203307 [6:01:02<28:42:48,  1.63it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35226/203307 [6:01:06<28:43:03,  1.63it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35226/203307 [6:01:06<28:43:03,  1.63it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35227/203307 [6:01:10<28:43:17,  1.63it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35227/203307 [6:01:10<28:43:17,  1.63it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35228/203307 [6:01:14<28:43:32,  1.63it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35228/203307 [6:01:14<28:43:32,  1.63it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35229/203307 [6:01:19<28:43:50,  1.63it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35229/203307 [6:01:19<28:43:50,  1.63it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35230/203307 [6:01:22<28:44:05,  1.62it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35230/203307 [6:01:22<28:44:05,  1.62it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35231/203307 [6:01:27<28:44:22,  1.62it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35231/203307 [6:01:27<28:44:22,  1.62it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35232/203307 [6:01:31<28:44:39,  1.62it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35232/203307 [6:01:31<28:44:39,  1.62it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35233/203307 [6:01:35<28:44:54,  1.62it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35233/203307 [6:01:35<28:44:54,  1.62it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35234/203307 [6:01:39<28:45:08,  1.62it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35234/203307 [6:01:39<28:45:09,  1.62it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35235/203307 [6:01:42<28:45:23,  1.62it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35235/203307 [6:01:42<28:45:23,  1.62it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35236/203307 [6:01:46<28:45:37,  1.62it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35236/203307 [6:01:46<28:45:37,  1.62it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35237/203307 [6:01:50<28:45:52,  1.62it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35237/203307 [6:01:50<28:45:52,  1.62it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35238/203307 [6:01:55<28:46:10,  1.62it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35238/203307 [6:01:55<28:46:10,  1.62it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35239/203307 [6:01:58<28:46:24,  1.62it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35239/203307 [6:01:58<28:46:24,  1.62it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35240/203307 [6:02:02<28:46:39,  1.62it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35240/203307 [6:02:02<28:46:39,  1.62it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35241/203307 [6:02:07<28:46:57,  1.62it/s, v_num=line, training/loss=0.0802]Epoch 0:  17%|█▋        | 35241/203307 [6:02:07<28:46:57,  1.62it/s, v_num=line, training/loss=0.080] Epoch 0:  17%|█▋        | 35242/203307 [6:02:10<28:47:12,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35242/203307 [6:02:10<28:47:12,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35243/203307 [6:02:14<28:47:26,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35243/203307 [6:02:14<28:47:26,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35244/203307 [6:02:18<28:47:41,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35244/203307 [6:02:18<28:47:41,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35245/203307 [6:02:22<28:47:56,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35245/203307 [6:02:22<28:47:56,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35246/203307 [6:02:26<28:48:13,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35246/203307 [6:02:26<28:48:13,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35247/203307 [6:02:31<28:48:31,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35247/203307 [6:02:31<28:48:31,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35248/203307 [6:02:35<28:48:45,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35248/203307 [6:02:35<28:48:45,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35249/203307 [6:02:39<28:49:03,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35249/203307 [6:02:39<28:49:03,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35250/203307 [6:02:43<28:49:20,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35250/203307 [6:02:43<28:49:20,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35251/203307 [6:02:47<28:49:34,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35251/203307 [6:02:47<28:49:34,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35252/203307 [6:02:51<28:49:49,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35252/203307 [6:02:51<28:49:49,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35253/203307 [6:02:55<28:50:03,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35253/203307 [6:02:55<28:50:03,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35254/203307 [6:02:59<28:50:20,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35254/203307 [6:02:59<28:50:20,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35255/203307 [6:03:03<28:50:38,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35255/203307 [6:03:03<28:50:38,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35256/203307 [6:03:07<28:50:52,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35256/203307 [6:03:07<28:50:52,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35257/203307 [6:03:11<28:51:06,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35257/203307 [6:03:11<28:51:06,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35258/203307 [6:03:15<28:51:23,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35258/203307 [6:03:15<28:51:23,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35259/203307 [6:03:19<28:51:38,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35259/203307 [6:03:19<28:51:38,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35260/203307 [6:03:23<28:51:52,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35260/203307 [6:03:23<28:51:52,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35261/203307 [6:03:26<28:52:06,  1.62it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35261/203307 [6:03:26<28:52:06,  1.62it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35262/203307 [6:03:30<28:52:20,  1.62it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35262/203307 [6:03:30<28:52:20,  1.62it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35263/203307 [6:03:35<28:52:38,  1.62it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35263/203307 [6:03:35<28:52:38,  1.62it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35264/203307 [6:03:39<28:52:56,  1.62it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35264/203307 [6:03:39<28:52:56,  1.62it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35265/203307 [6:03:43<28:53:10,  1.62it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35265/203307 [6:03:43<28:53:10,  1.62it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35266/203307 [6:03:47<28:53:24,  1.62it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35266/203307 [6:03:47<28:53:24,  1.62it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35267/203307 [6:03:51<28:53:42,  1.62it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35267/203307 [6:03:51<28:53:42,  1.62it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35268/203307 [6:03:55<28:53:59,  1.62it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35268/203307 [6:03:55<28:53:59,  1.62it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35269/203307 [6:03:59<28:54:13,  1.61it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35269/203307 [6:03:59<28:54:13,  1.61it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35270/203307 [6:04:03<28:54:27,  1.61it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35270/203307 [6:04:03<28:54:27,  1.61it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35271/203307 [6:04:07<28:54:44,  1.61it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35271/203307 [6:04:07<28:54:44,  1.61it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35272/203307 [6:04:11<28:54:59,  1.61it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35272/203307 [6:04:11<28:54:59,  1.61it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35273/203307 [6:04:15<28:55:16,  1.61it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35273/203307 [6:04:15<28:55:17,  1.61it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35274/203307 [6:04:19<28:55:30,  1.61it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35274/203307 [6:04:19<28:55:30,  1.61it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35275/203307 [6:04:23<28:55:47,  1.61it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35275/203307 [6:04:23<28:55:47,  1.61it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35276/203307 [6:04:27<28:56:01,  1.61it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35276/203307 [6:04:27<28:56:01,  1.61it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35277/203307 [6:04:31<28:56:18,  1.61it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35277/203307 [6:04:31<28:56:18,  1.61it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35278/203307 [6:04:35<28:56:32,  1.61it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35278/203307 [6:04:35<28:56:32,  1.61it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35279/203307 [6:04:39<28:56:49,  1.61it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35279/203307 [6:04:39<28:56:49,  1.61it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35280/203307 [6:04:43<28:57:03,  1.61it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35280/203307 [6:04:43<28:57:04,  1.61it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35281/203307 [6:04:47<28:57:21,  1.61it/s, v_num=line, training/loss=0.0754]Epoch 0:  17%|█▋        | 35281/203307 [6:04:47<28:57:21,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35282/203307 [6:04:51<28:57:35,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35282/203307 [6:04:51<28:57:35,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35283/203307 [6:04:55<28:57:49,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35283/203307 [6:04:55<28:57:49,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35284/203307 [6:04:59<28:58:07,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35284/203307 [6:04:59<28:58:07,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35285/203307 [6:05:04<28:58:24,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35285/203307 [6:05:04<28:58:24,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35286/203307 [6:05:07<28:58:38,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35286/203307 [6:05:07<28:58:38,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35287/203307 [6:05:11<28:58:52,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35287/203307 [6:05:11<28:58:53,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35288/203307 [6:05:16<28:59:10,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35288/203307 [6:05:16<28:59:10,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35289/203307 [6:05:19<28:59:24,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35289/203307 [6:05:19<28:59:24,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35290/203307 [6:05:24<28:59:41,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35290/203307 [6:05:24<28:59:41,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35291/203307 [6:05:27<28:59:55,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35291/203307 [6:05:27<28:59:55,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35292/203307 [6:05:31<29:00:09,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35292/203307 [6:05:31<29:00:09,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35293/203307 [6:05:35<29:00:27,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35293/203307 [6:05:35<29:00:27,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35294/203307 [6:05:39<29:00:41,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35294/203307 [6:05:39<29:00:41,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35295/203307 [6:05:43<29:00:58,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35295/203307 [6:05:44<29:00:58,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35296/203307 [6:05:48<29:01:15,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35296/203307 [6:05:48<29:01:15,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35297/203307 [6:05:52<29:01:29,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35297/203307 [6:05:52<29:01:29,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35298/203307 [6:05:55<29:01:43,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35298/203307 [6:05:55<29:01:43,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35299/203307 [6:06:00<29:02:01,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35299/203307 [6:06:00<29:02:01,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35300/203307 [6:06:04<29:02:16,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35300/203307 [6:06:04<29:02:16,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35301/203307 [6:06:08<29:02:33,  1.61it/s, v_num=line, training/loss=0.0929]Epoch 0:  17%|█▋        | 35301/203307 [6:06:08<29:02:33,  1.61it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35302/203307 [6:06:12<29:02:47,  1.61it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35302/203307 [6:06:12<29:02:48,  1.61it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35303/203307 [6:06:16<29:03:01,  1.61it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35303/203307 [6:06:16<29:03:01,  1.61it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35304/203307 [6:06:20<29:03:19,  1.61it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35304/203307 [6:06:20<29:03:19,  1.61it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35305/203307 [6:06:24<29:03:33,  1.61it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35305/203307 [6:06:24<29:03:33,  1.61it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35306/203307 [6:06:27<29:03:47,  1.61it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35306/203307 [6:06:27<29:03:47,  1.61it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35307/203307 [6:06:32<29:04:05,  1.61it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35307/203307 [6:06:32<29:04:05,  1.61it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35308/203307 [6:06:36<29:04:19,  1.61it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35308/203307 [6:06:36<29:04:19,  1.61it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35309/203307 [6:06:39<29:04:33,  1.60it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35309/203307 [6:06:39<29:04:33,  1.60it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35310/203307 [6:06:44<29:04:51,  1.60it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35310/203307 [6:06:44<29:04:51,  1.60it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35311/203307 [6:06:47<29:05:05,  1.60it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35311/203307 [6:06:47<29:05:05,  1.60it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35312/203307 [6:06:52<29:05:21,  1.60it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35312/203307 [6:06:52<29:05:21,  1.60it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35313/203307 [6:06:56<29:05:38,  1.60it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35313/203307 [6:06:56<29:05:38,  1.60it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35314/203307 [6:07:00<29:05:52,  1.60it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35314/203307 [6:07:00<29:05:52,  1.60it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35315/203307 [6:07:03<29:06:06,  1.60it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35315/203307 [6:07:03<29:06:06,  1.60it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35316/203307 [6:07:08<29:06:24,  1.60it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35316/203307 [6:07:08<29:06:24,  1.60it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35317/203307 [6:07:12<29:06:38,  1.60it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35317/203307 [6:07:12<29:06:38,  1.60it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35318/203307 [6:07:15<29:06:53,  1.60it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35318/203307 [6:07:15<29:06:53,  1.60it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35319/203307 [6:07:20<29:07:10,  1.60it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35319/203307 [6:07:20<29:07:10,  1.60it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35320/203307 [6:07:23<29:07:24,  1.60it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35320/203307 [6:07:23<29:07:24,  1.60it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35321/203307 [6:07:28<29:07:41,  1.60it/s, v_num=line, training/loss=0.0865]Epoch 0:  17%|█▋        | 35321/203307 [6:07:28<29:07:41,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35322/203307 [6:07:32<29:07:58,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35322/203307 [6:07:32<29:07:58,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35323/203307 [6:07:36<29:08:12,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35323/203307 [6:07:36<29:08:12,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35324/203307 [6:07:40<29:08:26,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35324/203307 [6:07:40<29:08:26,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35325/203307 [6:07:44<29:08:44,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35325/203307 [6:07:44<29:08:44,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35326/203307 [6:07:48<29:08:58,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35326/203307 [6:07:48<29:08:58,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35327/203307 [6:07:52<29:09:15,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35327/203307 [6:07:52<29:09:15,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35328/203307 [6:07:56<29:09:29,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35328/203307 [6:07:56<29:09:29,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35329/203307 [6:08:00<29:09:46,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35329/203307 [6:08:00<29:09:46,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35330/203307 [6:08:04<29:10:01,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35330/203307 [6:08:04<29:10:01,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35331/203307 [6:08:08<29:10:18,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35331/203307 [6:08:08<29:10:18,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35332/203307 [6:08:12<29:10:32,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35332/203307 [6:08:12<29:10:32,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35333/203307 [6:08:17<29:10:50,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35333/203307 [6:08:17<29:10:50,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35334/203307 [6:08:20<29:11:04,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35334/203307 [6:08:20<29:11:04,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35335/203307 [6:08:24<29:11:19,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35335/203307 [6:08:24<29:11:19,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35336/203307 [6:08:29<29:11:36,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35336/203307 [6:08:29<29:11:37,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35337/203307 [6:08:32<29:11:51,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35337/203307 [6:08:32<29:11:51,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35338/203307 [6:08:37<29:12:08,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35338/203307 [6:08:37<29:12:09,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35339/203307 [6:08:41<29:12:25,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35339/203307 [6:08:41<29:12:25,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35340/203307 [6:08:45<29:12:39,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35340/203307 [6:08:45<29:12:40,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35341/203307 [6:08:49<29:12:54,  1.60it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35341/203307 [6:08:49<29:12:54,  1.60it/s, v_num=line, training/loss=0.086] Epoch 0:  17%|█▋        | 35342/203307 [6:08:53<29:13:12,  1.60it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35342/203307 [6:08:53<29:13:12,  1.60it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35343/203307 [6:08:57<29:13:26,  1.60it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35343/203307 [6:08:57<29:13:26,  1.60it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35344/203307 [6:09:01<29:13:40,  1.60it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35344/203307 [6:09:01<29:13:40,  1.60it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35345/203307 [6:09:05<29:13:58,  1.60it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35345/203307 [6:09:05<29:13:58,  1.60it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35346/203307 [6:09:10<29:14:14,  1.60it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35346/203307 [6:09:10<29:14:14,  1.60it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35347/203307 [6:09:13<29:14:29,  1.60it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35347/203307 [6:09:13<29:14:29,  1.60it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35348/203307 [6:09:17<29:14:43,  1.60it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35348/203307 [6:09:17<29:14:43,  1.60it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35349/203307 [6:09:21<29:15:00,  1.60it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35349/203307 [6:09:21<29:15:00,  1.60it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35350/203307 [6:09:25<29:15:14,  1.59it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35350/203307 [6:09:25<29:15:14,  1.59it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35351/203307 [6:09:29<29:15:31,  1.59it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35351/203307 [6:09:29<29:15:31,  1.59it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35352/203307 [6:09:33<29:15:45,  1.59it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35352/203307 [6:09:33<29:15:45,  1.59it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35353/203307 [6:09:37<29:16:02,  1.59it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35353/203307 [6:09:37<29:16:02,  1.59it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35354/203307 [6:09:42<29:16:19,  1.59it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35354/203307 [6:09:42<29:16:19,  1.59it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35355/203307 [6:09:46<29:16:34,  1.59it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35355/203307 [6:09:46<29:16:34,  1.59it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35356/203307 [6:09:50<29:16:49,  1.59it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35356/203307 [6:09:50<29:16:49,  1.59it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35357/203307 [6:09:53<29:17:03,  1.59it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35357/203307 [6:09:53<29:17:03,  1.59it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35358/203307 [6:09:58<29:17:21,  1.59it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35358/203307 [6:09:58<29:17:21,  1.59it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35359/203307 [6:10:02<29:17:38,  1.59it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35359/203307 [6:10:02<29:17:38,  1.59it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35360/203307 [6:10:06<29:17:53,  1.59it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35360/203307 [6:10:06<29:17:53,  1.59it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35361/203307 [6:10:10<29:18:07,  1.59it/s, v_num=line, training/loss=0.086]Epoch 0:  17%|█▋        | 35361/203307 [6:10:10<29:18:07,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35362/203307 [6:10:14<29:18:25,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35362/203307 [6:10:14<29:18:25,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35363/203307 [6:10:19<29:18:42,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35363/203307 [6:10:19<29:18:42,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35364/203307 [6:10:23<29:18:57,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35364/203307 [6:10:23<29:18:57,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35365/203307 [6:10:26<29:19:11,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35365/203307 [6:10:26<29:19:11,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35366/203307 [6:10:31<29:19:28,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35366/203307 [6:10:31<29:19:28,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35367/203307 [6:10:34<29:19:42,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35367/203307 [6:10:34<29:19:42,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35368/203307 [6:10:39<29:20:00,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35368/203307 [6:10:39<29:20:00,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35369/203307 [6:10:43<29:20:14,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35369/203307 [6:10:43<29:20:14,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35370/203307 [6:10:47<29:20:28,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35370/203307 [6:10:47<29:20:29,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35371/203307 [6:10:51<29:20:46,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35371/203307 [6:10:51<29:20:46,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35372/203307 [6:10:55<29:21:00,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35372/203307 [6:10:55<29:21:00,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35373/203307 [6:10:58<29:21:14,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35373/203307 [6:10:58<29:21:15,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35374/203307 [6:11:02<29:21:29,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35374/203307 [6:11:02<29:21:29,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35375/203307 [6:11:06<29:21:43,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35375/203307 [6:11:06<29:21:43,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35376/203307 [6:11:10<29:22:00,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35376/203307 [6:11:10<29:22:00,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35377/203307 [6:11:15<29:22:18,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35377/203307 [6:11:15<29:22:18,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35378/203307 [6:11:19<29:22:32,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35378/203307 [6:11:19<29:22:32,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35379/203307 [6:11:23<29:22:49,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35379/203307 [6:11:23<29:22:49,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35380/203307 [6:11:27<29:23:04,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35380/203307 [6:11:27<29:23:04,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35381/203307 [6:11:31<29:23:18,  1.59it/s, v_num=line, training/loss=0.0828]Epoch 0:  17%|█▋        | 35381/203307 [6:11:31<29:23:18,  1.59it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35382/203307 [6:11:34<29:23:32,  1.59it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35382/203307 [6:11:34<29:23:32,  1.59it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35383/203307 [6:11:38<29:23:46,  1.59it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35383/203307 [6:11:38<29:23:46,  1.59it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35384/203307 [6:11:42<29:24:01,  1.59it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35384/203307 [6:11:42<29:24:01,  1.59it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35385/203307 [6:11:46<29:24:18,  1.59it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35385/203307 [6:11:46<29:24:18,  1.59it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35386/203307 [6:11:50<29:24:33,  1.59it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35386/203307 [6:11:50<29:24:33,  1.59it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35387/203307 [6:11:54<29:24:47,  1.59it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35387/203307 [6:11:54<29:24:47,  1.59it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35388/203307 [6:11:59<29:25:05,  1.59it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35388/203307 [6:11:59<29:25:05,  1.59it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35389/203307 [6:12:02<29:25:19,  1.59it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35389/203307 [6:12:02<29:25:19,  1.59it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35390/203307 [6:12:06<29:25:34,  1.59it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35390/203307 [6:12:06<29:25:34,  1.59it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35391/203307 [6:12:10<29:25:48,  1.58it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35391/203307 [6:12:10<29:25:48,  1.58it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35392/203307 [6:12:14<29:26:02,  1.58it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35392/203307 [6:12:14<29:26:02,  1.58it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35393/203307 [6:12:18<29:26:19,  1.58it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35393/203307 [6:12:18<29:26:19,  1.58it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35394/203307 [6:12:22<29:26:37,  1.58it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35394/203307 [6:12:22<29:26:37,  1.58it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35395/203307 [6:12:26<29:26:51,  1.58it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35395/203307 [6:12:26<29:26:51,  1.58it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35396/203307 [6:12:31<29:27:08,  1.58it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35396/203307 [6:12:31<29:27:08,  1.58it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35397/203307 [6:12:35<29:27:25,  1.58it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35397/203307 [6:12:35<29:27:25,  1.58it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35398/203307 [6:12:39<29:27:40,  1.58it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35398/203307 [6:12:39<29:27:40,  1.58it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35399/203307 [6:12:43<29:27:54,  1.58it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35399/203307 [6:12:43<29:27:54,  1.58it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35400/203307 [6:12:46<29:28:08,  1.58it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35400/203307 [6:12:46<29:28:08,  1.58it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35401/203307 [6:12:50<29:28:22,  1.58it/s, v_num=line, training/loss=0.0867]Epoch 0:  17%|█▋        | 35401/203307 [6:12:50<29:28:22,  1.58it/s, v_num=line, training/loss=0.080] Epoch 0:  17%|█▋        | 35402/203307 [6:12:54<29:28:37,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35402/203307 [6:12:54<29:28:37,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35403/203307 [6:12:58<29:28:55,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35403/203307 [6:12:58<29:28:55,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35404/203307 [6:13:03<29:29:12,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35404/203307 [6:13:03<29:29:12,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35405/203307 [6:13:07<29:29:29,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35405/203307 [6:13:07<29:29:29,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35406/203307 [6:13:11<29:29:43,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35406/203307 [6:13:11<29:29:43,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35407/203307 [6:13:15<29:29:57,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35407/203307 [6:13:15<29:29:57,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35408/203307 [6:13:18<29:30:11,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35408/203307 [6:13:18<29:30:11,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35409/203307 [6:13:22<29:30:26,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35409/203307 [6:13:22<29:30:26,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35410/203307 [6:13:26<29:30:40,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35410/203307 [6:13:26<29:30:40,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35411/203307 [6:13:31<29:30:58,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35411/203307 [6:13:31<29:30:58,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35412/203307 [6:13:35<29:31:15,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35412/203307 [6:13:35<29:31:15,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35413/203307 [6:13:39<29:31:32,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35413/203307 [6:13:39<29:31:32,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35414/203307 [6:13:44<29:31:49,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35414/203307 [6:13:44<29:31:49,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35415/203307 [6:13:47<29:32:03,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35415/203307 [6:13:47<29:32:03,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35416/203307 [6:13:51<29:32:17,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35416/203307 [6:13:51<29:32:17,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35417/203307 [6:13:55<29:32:32,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35417/203307 [6:13:55<29:32:32,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35418/203307 [6:13:59<29:32:46,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35418/203307 [6:13:59<29:32:46,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35419/203307 [6:14:03<29:33:01,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35419/203307 [6:14:03<29:33:01,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35420/203307 [6:14:07<29:33:18,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35420/203307 [6:14:07<29:33:18,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35421/203307 [6:14:11<29:33:35,  1.58it/s, v_num=line, training/loss=0.080]Epoch 0:  17%|█▋        | 35421/203307 [6:14:11<29:33:35,  1.58it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35422/203307 [6:14:15<29:33:49,  1.58it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35422/203307 [6:14:15<29:33:49,  1.58it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35423/203307 [6:14:19<29:34:06,  1.58it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35423/203307 [6:14:19<29:34:06,  1.58it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35424/203307 [6:14:23<29:34:20,  1.58it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35424/203307 [6:14:23<29:34:20,  1.58it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35425/203307 [6:14:27<29:34:34,  1.58it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35425/203307 [6:14:27<29:34:34,  1.58it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35426/203307 [6:14:31<29:34:49,  1.58it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35426/203307 [6:14:31<29:34:49,  1.58it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35427/203307 [6:14:35<29:35:03,  1.58it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35427/203307 [6:14:35<29:35:03,  1.58it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35428/203307 [6:14:38<29:35:17,  1.58it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35428/203307 [6:14:38<29:35:17,  1.58it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35429/203307 [6:14:43<29:35:35,  1.58it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35429/203307 [6:14:43<29:35:35,  1.58it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35430/203307 [6:14:47<29:35:52,  1.58it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35430/203307 [6:14:47<29:35:52,  1.58it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35431/203307 [6:14:52<29:36:10,  1.58it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35431/203307 [6:14:52<29:36:10,  1.58it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35432/203307 [6:14:55<29:36:24,  1.58it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35432/203307 [6:14:55<29:36:24,  1.58it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35433/203307 [6:14:59<29:36:38,  1.57it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35433/203307 [6:14:59<29:36:38,  1.57it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35434/203307 [6:15:03<29:36:53,  1.57it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35434/203307 [6:15:03<29:36:53,  1.57it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35435/203307 [6:15:07<29:37:07,  1.57it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35435/203307 [6:15:07<29:37:07,  1.57it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35436/203307 [6:15:11<29:37:21,  1.57it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35436/203307 [6:15:11<29:37:21,  1.57it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35437/203307 [6:15:15<29:37:39,  1.57it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35437/203307 [6:15:15<29:37:39,  1.57it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35438/203307 [6:15:19<29:37:56,  1.57it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35438/203307 [6:15:19<29:37:56,  1.57it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35439/203307 [6:15:24<29:38:12,  1.57it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35439/203307 [6:15:24<29:38:12,  1.57it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35440/203307 [6:15:28<29:38:29,  1.57it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35440/203307 [6:15:28<29:38:29,  1.57it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35441/203307 [6:15:32<29:38:43,  1.57it/s, v_num=line, training/loss=0.076]Epoch 0:  17%|█▋        | 35441/203307 [6:15:32<29:38:43,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35442/203307 [6:15:36<29:38:57,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35442/203307 [6:15:36<29:38:57,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35443/203307 [6:15:39<29:39:12,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35443/203307 [6:15:39<29:39:12,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35444/203307 [6:15:43<29:39:26,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35444/203307 [6:15:43<29:39:26,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35445/203307 [6:15:47<29:39:40,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35445/203307 [6:15:47<29:39:40,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35446/203307 [6:15:51<29:39:58,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35446/203307 [6:15:51<29:39:58,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35447/203307 [6:15:56<29:40:14,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35447/203307 [6:15:56<29:40:14,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35448/203307 [6:15:59<29:40:29,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35448/203307 [6:15:59<29:40:29,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35449/203307 [6:16:04<29:40:46,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35449/203307 [6:16:04<29:40:46,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35450/203307 [6:16:08<29:41:01,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35450/203307 [6:16:08<29:41:01,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35451/203307 [6:16:11<29:41:15,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35451/203307 [6:16:11<29:41:15,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35452/203307 [6:16:15<29:41:30,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35452/203307 [6:16:15<29:41:30,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35453/203307 [6:16:19<29:41:44,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35453/203307 [6:16:19<29:41:44,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35454/203307 [6:16:23<29:42:01,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35454/203307 [6:16:23<29:42:01,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35455/203307 [6:16:28<29:42:18,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35455/203307 [6:16:28<29:42:18,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35456/203307 [6:16:32<29:42:32,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35456/203307 [6:16:32<29:42:32,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35457/203307 [6:16:36<29:42:49,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35457/203307 [6:16:36<29:42:49,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35458/203307 [6:16:40<29:43:04,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35458/203307 [6:16:40<29:43:04,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35459/203307 [6:16:44<29:43:18,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35459/203307 [6:16:44<29:43:18,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35460/203307 [6:16:47<29:43:32,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35460/203307 [6:16:47<29:43:32,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35461/203307 [6:16:51<29:43:46,  1.57it/s, v_num=line, training/loss=0.0861]Epoch 0:  17%|█▋        | 35461/203307 [6:16:51<29:43:46,  1.57it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35462/203307 [6:16:55<29:44:01,  1.57it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35462/203307 [6:16:55<29:44:01,  1.57it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35463/203307 [6:17:00<29:44:19,  1.57it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35463/203307 [6:17:00<29:44:19,  1.57it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35464/203307 [6:17:03<29:44:34,  1.57it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35464/203307 [6:17:03<29:44:34,  1.57it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35465/203307 [6:17:07<29:44:48,  1.57it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35465/203307 [6:17:07<29:44:48,  1.57it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35466/203307 [6:17:12<29:45:06,  1.57it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35466/203307 [6:17:12<29:45:06,  1.57it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35467/203307 [6:17:16<29:45:20,  1.57it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35467/203307 [6:17:16<29:45:20,  1.57it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35468/203307 [6:17:20<29:45:35,  1.57it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35468/203307 [6:17:20<29:45:36,  1.57it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35469/203307 [6:17:24<29:45:50,  1.57it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35469/203307 [6:17:24<29:45:50,  1.57it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35470/203307 [6:17:27<29:46:05,  1.57it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35470/203307 [6:17:27<29:46:05,  1.57it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35471/203307 [6:17:32<29:46:22,  1.57it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35471/203307 [6:17:32<29:46:22,  1.57it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35472/203307 [6:17:36<29:46:39,  1.57it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35472/203307 [6:17:36<29:46:39,  1.57it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35473/203307 [6:17:40<29:46:54,  1.57it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35473/203307 [6:17:40<29:46:54,  1.57it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35474/203307 [6:17:44<29:47:10,  1.57it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35474/203307 [6:17:44<29:47:11,  1.57it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35475/203307 [6:17:49<29:47:28,  1.56it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35475/203307 [6:17:49<29:47:28,  1.56it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35476/203307 [6:17:53<29:47:42,  1.56it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35476/203307 [6:17:53<29:47:42,  1.56it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35477/203307 [6:17:56<29:47:57,  1.56it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35477/203307 [6:17:56<29:47:57,  1.56it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35478/203307 [6:18:00<29:48:11,  1.56it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35478/203307 [6:18:00<29:48:11,  1.56it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35479/203307 [6:18:05<29:48:28,  1.56it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35479/203307 [6:18:05<29:48:28,  1.56it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35480/203307 [6:18:08<29:48:43,  1.56it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35480/203307 [6:18:08<29:48:43,  1.56it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35481/203307 [6:18:13<29:49:00,  1.56it/s, v_num=line, training/loss=0.0829]Epoch 0:  17%|█▋        | 35481/203307 [6:18:13<29:49:00,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35482/203307 [6:18:17<29:49:15,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35482/203307 [6:18:17<29:49:15,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35483/203307 [6:18:21<29:49:32,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35483/203307 [6:18:21<29:49:32,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35484/203307 [6:18:26<29:49:49,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35484/203307 [6:18:26<29:49:49,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35485/203307 [6:18:29<29:50:03,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35485/203307 [6:18:29<29:50:03,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35486/203307 [6:18:33<29:50:18,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35486/203307 [6:18:33<29:50:18,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35487/203307 [6:18:37<29:50:32,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35487/203307 [6:18:37<29:50:32,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35488/203307 [6:18:41<29:50:49,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35488/203307 [6:18:41<29:50:49,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35489/203307 [6:18:46<29:51:06,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35489/203307 [6:18:46<29:51:06,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35490/203307 [6:18:50<29:51:20,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35490/203307 [6:18:50<29:51:20,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35491/203307 [6:18:53<29:51:34,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35491/203307 [6:18:53<29:51:34,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35492/203307 [6:18:58<29:51:51,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35492/203307 [6:18:58<29:51:51,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35493/203307 [6:19:02<29:52:08,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35493/203307 [6:19:02<29:52:08,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35494/203307 [6:19:06<29:52:23,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35494/203307 [6:19:06<29:52:23,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35495/203307 [6:19:10<29:52:37,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35495/203307 [6:19:10<29:52:37,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35496/203307 [6:19:14<29:52:54,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35496/203307 [6:19:14<29:52:54,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35497/203307 [6:19:18<29:53:08,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35497/203307 [6:19:18<29:53:08,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35498/203307 [6:19:22<29:53:26,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35498/203307 [6:19:22<29:53:26,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35499/203307 [6:19:26<29:53:40,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35499/203307 [6:19:26<29:53:40,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35500/203307 [6:19:30<29:53:54,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35500/203307 [6:19:30<29:53:54,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35501/203307 [6:19:34<29:54:12,  1.56it/s, v_num=line, training/loss=0.0938]Epoch 0:  17%|█▋        | 35501/203307 [6:19:34<29:54:12,  1.56it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35502/203307 [6:19:38<29:54:25,  1.56it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35502/203307 [6:19:38<29:54:25,  1.56it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35503/203307 [6:19:42<29:54:39,  1.56it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35503/203307 [6:19:42<29:54:39,  1.56it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35504/203307 [6:19:46<29:54:57,  1.56it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35504/203307 [6:19:46<29:54:57,  1.56it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35505/203307 [6:19:50<29:55:11,  1.56it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35505/203307 [6:19:50<29:55:11,  1.56it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35506/203307 [6:19:54<29:55:25,  1.56it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35506/203307 [6:19:54<29:55:25,  1.56it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35507/203307 [6:19:58<29:55:43,  1.56it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35507/203307 [6:19:58<29:55:43,  1.56it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35508/203307 [6:20:02<29:55:57,  1.56it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35508/203307 [6:20:02<29:55:57,  1.56it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35509/203307 [6:20:06<29:56:14,  1.56it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35509/203307 [6:20:06<29:56:14,  1.56it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35510/203307 [6:20:10<29:56:28,  1.56it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35510/203307 [6:20:10<29:56:28,  1.56it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35511/203307 [6:20:14<29:56:44,  1.56it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35511/203307 [6:20:14<29:56:44,  1.56it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35512/203307 [6:20:18<29:56:58,  1.56it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35512/203307 [6:20:18<29:56:58,  1.56it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35513/203307 [6:20:23<29:57:16,  1.56it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35513/203307 [6:20:23<29:57:16,  1.56it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35514/203307 [6:20:26<29:57:30,  1.56it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35514/203307 [6:20:26<29:57:30,  1.56it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35515/203307 [6:20:31<29:57:47,  1.56it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35515/203307 [6:20:31<29:57:47,  1.56it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35516/203307 [6:20:35<29:58:01,  1.56it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35516/203307 [6:20:35<29:58:01,  1.56it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35517/203307 [6:20:38<29:58:16,  1.56it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35517/203307 [6:20:38<29:58:16,  1.56it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35518/203307 [6:20:43<29:58:33,  1.55it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35518/203307 [6:20:43<29:58:33,  1.55it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35519/203307 [6:20:47<29:58:47,  1.55it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35519/203307 [6:20:47<29:58:47,  1.55it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35520/203307 [6:20:51<29:59:04,  1.55it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35520/203307 [6:20:51<29:59:05,  1.55it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35521/203307 [6:20:56<29:59:22,  1.55it/s, v_num=line, training/loss=0.0902]Epoch 0:  17%|█▋        | 35521/203307 [6:20:56<29:59:22,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35522/203307 [6:20:59<29:59:36,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35522/203307 [6:20:59<29:59:36,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35523/203307 [6:21:03<29:59:50,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35523/203307 [6:21:03<29:59:50,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35524/203307 [6:21:08<30:00:08,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35524/203307 [6:21:08<30:00:08,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35525/203307 [6:21:12<30:00:23,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35525/203307 [6:21:12<30:00:23,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35526/203307 [6:21:15<30:00:37,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35526/203307 [6:21:15<30:00:37,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35527/203307 [6:21:20<30:00:55,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35527/203307 [6:21:20<30:00:55,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35528/203307 [6:21:24<30:01:12,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35528/203307 [6:21:24<30:01:12,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35529/203307 [6:21:29<30:01:29,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35529/203307 [6:21:29<30:01:29,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35530/203307 [6:21:33<30:01:43,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35530/203307 [6:21:33<30:01:43,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35531/203307 [6:21:36<30:01:57,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35531/203307 [6:21:36<30:01:57,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35532/203307 [6:21:40<30:02:11,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35532/203307 [6:21:40<30:02:11,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35533/203307 [6:21:45<30:02:29,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35533/203307 [6:21:45<30:02:29,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35534/203307 [6:21:48<30:02:43,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35534/203307 [6:21:48<30:02:43,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35535/203307 [6:21:53<30:03:00,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35535/203307 [6:21:53<30:03:00,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35536/203307 [6:21:57<30:03:14,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35536/203307 [6:21:57<30:03:15,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35537/203307 [6:22:00<30:03:29,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35537/203307 [6:22:00<30:03:29,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35538/203307 [6:22:05<30:03:46,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35538/203307 [6:22:05<30:03:46,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35539/203307 [6:22:09<30:04:00,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35539/203307 [6:22:09<30:04:01,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35540/203307 [6:22:12<30:04:15,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35540/203307 [6:22:12<30:04:15,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35541/203307 [6:22:17<30:04:32,  1.55it/s, v_num=line, training/loss=0.0899]Epoch 0:  17%|█▋        | 35541/203307 [6:22:17<30:04:32,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35542/203307 [6:22:21<30:04:46,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35542/203307 [6:22:21<30:04:46,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35543/203307 [6:22:24<30:05:00,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35543/203307 [6:22:24<30:05:01,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35544/203307 [6:22:29<30:05:18,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35544/203307 [6:22:29<30:05:18,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35545/203307 [6:22:33<30:05:32,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35545/203307 [6:22:33<30:05:32,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35546/203307 [6:22:37<30:05:49,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35546/203307 [6:22:37<30:05:49,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35547/203307 [6:22:41<30:06:05,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35547/203307 [6:22:41<30:06:05,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35548/203307 [6:22:45<30:06:19,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35548/203307 [6:22:45<30:06:19,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35549/203307 [6:22:49<30:06:33,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35549/203307 [6:22:49<30:06:33,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35550/203307 [6:22:53<30:06:51,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35550/203307 [6:22:53<30:06:51,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35551/203307 [6:22:57<30:07:05,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35551/203307 [6:22:57<30:07:05,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35552/203307 [6:23:01<30:07:19,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35552/203307 [6:23:01<30:07:19,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35553/203307 [6:23:05<30:07:36,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35553/203307 [6:23:05<30:07:36,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35554/203307 [6:23:10<30:07:53,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35554/203307 [6:23:10<30:07:53,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35555/203307 [6:23:14<30:08:10,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35555/203307 [6:23:14<30:08:10,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35556/203307 [6:23:18<30:08:24,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35556/203307 [6:23:18<30:08:24,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35557/203307 [6:23:21<30:08:37,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35557/203307 [6:23:21<30:08:38,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35558/203307 [6:23:25<30:08:52,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35558/203307 [6:23:25<30:08:52,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35559/203307 [6:23:30<30:09:09,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35559/203307 [6:23:30<30:09:09,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35560/203307 [6:23:33<30:09:23,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35560/203307 [6:23:34<30:09:23,  1.55it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35561/203307 [6:23:38<30:09:40,  1.54it/s, v_num=line, training/loss=0.0796]Epoch 0:  17%|█▋        | 35561/203307 [6:23:38<30:09:40,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35562/203307 [6:23:42<30:09:54,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35562/203307 [6:23:42<30:09:54,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35563/203307 [6:23:46<30:10:11,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35563/203307 [6:23:46<30:10:11,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35564/203307 [6:23:50<30:10:25,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35564/203307 [6:23:50<30:10:25,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35565/203307 [6:23:54<30:10:42,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35565/203307 [6:23:54<30:10:42,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35566/203307 [6:23:58<30:10:56,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35566/203307 [6:23:58<30:10:56,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35567/203307 [6:24:02<30:11:14,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35567/203307 [6:24:02<30:11:14,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35568/203307 [6:24:06<30:11:27,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35568/203307 [6:24:06<30:11:27,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35569/203307 [6:24:10<30:11:42,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35569/203307 [6:24:10<30:11:42,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35570/203307 [6:24:14<30:11:59,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35570/203307 [6:24:14<30:11:59,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35571/203307 [6:24:19<30:12:16,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35571/203307 [6:24:19<30:12:16,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35572/203307 [6:24:22<30:12:30,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35572/203307 [6:24:22<30:12:30,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35573/203307 [6:24:26<30:12:44,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35573/203307 [6:24:26<30:12:44,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35574/203307 [6:24:31<30:13:00,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35574/203307 [6:24:31<30:13:00,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35575/203307 [6:24:34<30:13:14,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35575/203307 [6:24:34<30:13:15,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35576/203307 [6:24:39<30:13:32,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35576/203307 [6:24:39<30:13:32,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35577/203307 [6:24:43<30:13:46,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35577/203307 [6:24:43<30:13:46,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35578/203307 [6:24:46<30:14:00,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  17%|█▋        | 35578/203307 [6:24:46<30:14:00,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  18%|█▊        | 35579/203307 [6:24:51<30:14:18,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  18%|█▊        | 35579/203307 [6:24:51<30:14:18,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  18%|█▊        | 35580/203307 [6:24:55<30:14:32,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  18%|█▊        | 35580/203307 [6:24:55<30:14:32,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  18%|█▊        | 35581/203307 [6:24:58<30:14:46,  1.54it/s, v_num=line, training/loss=0.0799]Epoch 0:  18%|█▊        | 35581/203307 [6:24:58<30:14:46,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35582/203307 [6:25:03<30:15:02,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35582/203307 [6:25:03<30:15:02,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35583/203307 [6:25:06<30:15:16,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35583/203307 [6:25:06<30:15:16,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35584/203307 [6:25:10<30:15:30,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35584/203307 [6:25:10<30:15:30,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35585/203307 [6:25:15<30:15:48,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35585/203307 [6:25:15<30:15:48,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35586/203307 [6:25:18<30:16:02,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35586/203307 [6:25:18<30:16:02,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35587/203307 [6:25:23<30:16:19,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35587/203307 [6:25:23<30:16:19,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35588/203307 [6:25:27<30:16:36,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35588/203307 [6:25:27<30:16:36,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35589/203307 [6:25:31<30:16:50,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35589/203307 [6:25:31<30:16:50,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35590/203307 [6:25:35<30:17:04,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35590/203307 [6:25:35<30:17:04,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35591/203307 [6:25:39<30:17:18,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35591/203307 [6:25:39<30:17:18,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35592/203307 [6:25:43<30:17:35,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35592/203307 [6:25:43<30:17:35,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35593/203307 [6:25:47<30:17:52,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35593/203307 [6:25:47<30:17:52,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35594/203307 [6:25:51<30:18:06,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35594/203307 [6:25:51<30:18:06,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35595/203307 [6:25:55<30:18:20,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35595/203307 [6:25:55<30:18:20,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35596/203307 [6:25:59<30:18:37,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35596/203307 [6:25:59<30:18:37,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35597/203307 [6:26:03<30:18:51,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35597/203307 [6:26:03<30:18:51,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35598/203307 [6:26:07<30:19:05,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35598/203307 [6:26:07<30:19:06,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35599/203307 [6:26:11<30:19:20,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35599/203307 [6:26:11<30:19:20,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35600/203307 [6:26:14<30:19:34,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35600/203307 [6:26:14<30:19:34,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35601/203307 [6:26:19<30:19:51,  1.54it/s, v_num=line, training/loss=0.0769]Epoch 0:  18%|█▊        | 35601/203307 [6:26:19<30:19:51,  1.54it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35602/203307 [6:26:23<30:20:09,  1.54it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35602/203307 [6:26:23<30:20:09,  1.54it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35603/203307 [6:26:27<30:20:23,  1.54it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35603/203307 [6:26:27<30:20:23,  1.54it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35604/203307 [6:26:32<30:20:40,  1.54it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35604/203307 [6:26:32<30:20:40,  1.54it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35605/203307 [6:26:36<30:20:57,  1.53it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35605/203307 [6:26:36<30:20:57,  1.53it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35606/203307 [6:26:40<30:21:10,  1.53it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35606/203307 [6:26:40<30:21:10,  1.53it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35607/203307 [6:26:43<30:21:24,  1.53it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35607/203307 [6:26:43<30:21:24,  1.53it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35608/203307 [6:26:47<30:21:39,  1.53it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35608/203307 [6:26:47<30:21:39,  1.53it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35609/203307 [6:26:52<30:21:55,  1.53it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35609/203307 [6:26:52<30:21:55,  1.53it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35610/203307 [6:26:55<30:22:09,  1.53it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35610/203307 [6:26:55<30:22:09,  1.53it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35611/203307 [6:27:00<30:22:26,  1.53it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35611/203307 [6:27:00<30:22:26,  1.53it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35612/203307 [6:27:04<30:22:40,  1.53it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35612/203307 [6:27:04<30:22:40,  1.53it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35613/203307 [6:27:08<30:22:57,  1.53it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35613/203307 [6:27:08<30:22:57,  1.53it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35614/203307 [6:27:12<30:23:11,  1.53it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35614/203307 [6:27:12<30:23:11,  1.53it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35615/203307 [6:27:15<30:23:25,  1.53it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35615/203307 [6:27:15<30:23:25,  1.53it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35616/203307 [6:27:19<30:23:39,  1.53it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35616/203307 [6:27:19<30:23:39,  1.53it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35617/203307 [6:27:23<30:23:53,  1.53it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35617/203307 [6:27:23<30:23:53,  1.53it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35618/203307 [6:27:27<30:24:08,  1.53it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35618/203307 [6:27:27<30:24:08,  1.53it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35619/203307 [6:27:31<30:24:25,  1.53it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35619/203307 [6:27:31<30:24:25,  1.53it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35620/203307 [6:27:35<30:24:39,  1.53it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35620/203307 [6:27:35<30:24:39,  1.53it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35621/203307 [6:27:39<30:24:56,  1.53it/s, v_num=line, training/loss=0.0809]Epoch 0:  18%|█▊        | 35621/203307 [6:27:39<30:24:56,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35622/203307 [6:27:44<30:25:12,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35622/203307 [6:27:44<30:25:12,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35623/203307 [6:27:48<30:25:26,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35623/203307 [6:27:48<30:25:26,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35624/203307 [6:27:52<30:25:42,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35624/203307 [6:27:52<30:25:42,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35625/203307 [6:27:56<30:25:57,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35625/203307 [6:27:56<30:25:57,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35626/203307 [6:27:59<30:26:11,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35626/203307 [6:27:59<30:26:11,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35627/203307 [6:28:03<30:26:25,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35627/203307 [6:28:03<30:26:25,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35628/203307 [6:28:08<30:26:42,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35628/203307 [6:28:08<30:26:43,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35629/203307 [6:28:12<30:26:59,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35629/203307 [6:28:12<30:26:59,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35630/203307 [6:28:16<30:27:14,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35630/203307 [6:28:16<30:27:14,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35631/203307 [6:28:20<30:27:31,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35631/203307 [6:28:20<30:27:31,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35632/203307 [6:28:24<30:27:45,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35632/203307 [6:28:24<30:27:45,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35633/203307 [6:28:28<30:27:59,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35633/203307 [6:28:28<30:27:59,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35634/203307 [6:28:32<30:28:13,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35634/203307 [6:28:32<30:28:13,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35635/203307 [6:28:35<30:28:27,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35635/203307 [6:28:35<30:28:27,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35636/203307 [6:28:40<30:28:43,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35636/203307 [6:28:40<30:28:43,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35637/203307 [6:28:44<30:29:01,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35637/203307 [6:28:44<30:29:01,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35638/203307 [6:28:49<30:29:19,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35638/203307 [6:28:49<30:29:19,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35639/203307 [6:28:53<30:29:36,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35639/203307 [6:28:53<30:29:36,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35640/203307 [6:28:57<30:29:50,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35640/203307 [6:28:57<30:29:50,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35641/203307 [6:29:01<30:30:06,  1.53it/s, v_num=line, training/loss=0.0761]Epoch 0:  18%|█▊        | 35641/203307 [6:29:01<30:30:06,  1.53it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35642/203307 [6:29:05<30:30:20,  1.53it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35642/203307 [6:29:05<30:30:20,  1.53it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35643/203307 [6:29:09<30:30:34,  1.53it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35643/203307 [6:29:09<30:30:34,  1.53it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35644/203307 [6:29:12<30:30:47,  1.53it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35644/203307 [6:29:12<30:30:48,  1.53it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35645/203307 [6:29:17<30:31:05,  1.53it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35645/203307 [6:29:17<30:31:05,  1.53it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35646/203307 [6:29:22<30:31:24,  1.53it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35646/203307 [6:29:22<30:31:24,  1.53it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35647/203307 [6:29:25<30:31:38,  1.53it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35647/203307 [6:29:25<30:31:38,  1.53it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35648/203307 [6:29:30<30:31:55,  1.53it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35648/203307 [6:29:30<30:31:55,  1.53it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35649/203307 [6:29:34<30:32:10,  1.53it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35649/203307 [6:29:34<30:32:10,  1.53it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35650/203307 [6:29:38<30:32:26,  1.52it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35650/203307 [6:29:38<30:32:26,  1.52it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35651/203307 [6:29:42<30:32:39,  1.52it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35651/203307 [6:29:42<30:32:39,  1.52it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35652/203307 [6:29:46<30:32:54,  1.52it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35652/203307 [6:29:46<30:32:54,  1.52it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35653/203307 [6:29:49<30:33:08,  1.52it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35653/203307 [6:29:50<30:33:08,  1.52it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35654/203307 [6:29:54<30:33:27,  1.52it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35654/203307 [6:29:54<30:33:27,  1.52it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35655/203307 [6:29:59<30:33:44,  1.52it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35655/203307 [6:29:59<30:33:44,  1.52it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35656/203307 [6:30:02<30:33:58,  1.52it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35656/203307 [6:30:02<30:33:58,  1.52it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35657/203307 [6:30:07<30:34:15,  1.52it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35657/203307 [6:30:07<30:34:15,  1.52it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35658/203307 [6:30:11<30:34:30,  1.52it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35658/203307 [6:30:11<30:34:30,  1.52it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35659/203307 [6:30:15<30:34:44,  1.52it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35659/203307 [6:30:15<30:34:44,  1.52it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35660/203307 [6:30:19<30:34:59,  1.52it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35660/203307 [6:30:19<30:34:59,  1.52it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35661/203307 [6:30:23<30:35:13,  1.52it/s, v_num=line, training/loss=0.0863]Epoch 0:  18%|█▊        | 35661/203307 [6:30:23<30:35:13,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35662/203307 [6:30:27<30:35:29,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35662/203307 [6:30:27<30:35:29,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35663/203307 [6:30:31<30:35:47,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35663/203307 [6:30:31<30:35:47,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35664/203307 [6:30:35<30:36:01,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35664/203307 [6:30:35<30:36:01,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35665/203307 [6:30:40<30:36:19,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35665/203307 [6:30:40<30:36:19,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35666/203307 [6:30:44<30:36:34,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35666/203307 [6:30:44<30:36:34,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35667/203307 [6:30:47<30:36:48,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35667/203307 [6:30:47<30:36:48,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35668/203307 [6:30:51<30:37:03,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35668/203307 [6:30:51<30:37:03,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35669/203307 [6:30:55<30:37:18,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35669/203307 [6:30:55<30:37:18,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35670/203307 [6:30:59<30:37:33,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35670/203307 [6:30:59<30:37:33,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35671/203307 [6:31:04<30:37:50,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35671/203307 [6:31:04<30:37:50,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35672/203307 [6:31:08<30:38:04,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35672/203307 [6:31:08<30:38:04,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35673/203307 [6:31:12<30:38:21,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35673/203307 [6:31:12<30:38:21,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35674/203307 [6:31:16<30:38:38,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35674/203307 [6:31:16<30:38:38,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35675/203307 [6:31:20<30:38:52,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35675/203307 [6:31:20<30:38:52,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35676/203307 [6:31:24<30:39:07,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35676/203307 [6:31:24<30:39:07,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35677/203307 [6:31:28<30:39:21,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35677/203307 [6:31:28<30:39:21,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35678/203307 [6:31:32<30:39:37,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35678/203307 [6:31:32<30:39:37,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35679/203307 [6:31:36<30:39:53,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35679/203307 [6:31:36<30:39:53,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35680/203307 [6:31:41<30:40:11,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35680/203307 [6:31:41<30:40:11,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35681/203307 [6:31:45<30:40:26,  1.52it/s, v_num=line, training/loss=0.0771]Epoch 0:  18%|█▊        | 35681/203307 [6:31:45<30:40:26,  1.52it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35682/203307 [6:31:49<30:40:43,  1.52it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35682/203307 [6:31:49<30:40:43,  1.52it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35683/203307 [6:31:54<30:41:00,  1.52it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35683/203307 [6:31:54<30:41:00,  1.52it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35684/203307 [6:31:58<30:41:14,  1.52it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35684/203307 [6:31:58<30:41:14,  1.52it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35685/203307 [6:32:02<30:41:29,  1.52it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35685/203307 [6:32:02<30:41:29,  1.52it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35686/203307 [6:32:06<30:41:44,  1.52it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35686/203307 [6:32:06<30:41:44,  1.52it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35687/203307 [6:32:09<30:41:58,  1.52it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35687/203307 [6:32:09<30:41:58,  1.52it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35688/203307 [6:32:14<30:42:15,  1.52it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35688/203307 [6:32:14<30:42:15,  1.52it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35689/203307 [6:32:18<30:42:32,  1.52it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35689/203307 [6:32:18<30:42:32,  1.52it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35690/203307 [6:32:22<30:42:48,  1.52it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35690/203307 [6:32:22<30:42:48,  1.52it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35691/203307 [6:32:27<30:43:04,  1.52it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35691/203307 [6:32:27<30:43:04,  1.52it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35692/203307 [6:32:30<30:43:18,  1.52it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35692/203307 [6:32:30<30:43:18,  1.52it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35693/203307 [6:32:34<30:43:31,  1.52it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35693/203307 [6:32:34<30:43:31,  1.52it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35694/203307 [6:32:38<30:43:46,  1.52it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35694/203307 [6:32:38<30:43:46,  1.52it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35695/203307 [6:32:42<30:44:00,  1.51it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35695/203307 [6:32:42<30:44:00,  1.51it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35696/203307 [6:32:46<30:44:17,  1.51it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35696/203307 [6:32:46<30:44:17,  1.51it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35697/203307 [6:32:51<30:44:34,  1.51it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35697/203307 [6:32:51<30:44:34,  1.51it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35698/203307 [6:32:54<30:44:48,  1.51it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35698/203307 [6:32:54<30:44:48,  1.51it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35699/203307 [6:32:58<30:45:02,  1.51it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35699/203307 [6:32:58<30:45:02,  1.51it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35700/203307 [6:33:03<30:45:19,  1.51it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35700/203307 [6:33:03<30:45:19,  1.51it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35701/203307 [6:33:06<30:45:33,  1.51it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35701/203307 [6:33:06<30:45:33,  1.51it/s, v_num=line, training/loss=0.081] Epoch 0:  18%|█▊        | 35702/203307 [6:33:10<30:45:47,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35702/203307 [6:33:10<30:45:47,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35703/203307 [6:33:14<30:46:00,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35703/203307 [6:33:14<30:46:00,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35704/203307 [6:33:18<30:46:17,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35704/203307 [6:33:18<30:46:17,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35705/203307 [6:33:22<30:46:31,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35705/203307 [6:33:22<30:46:31,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35706/203307 [6:33:26<30:46:48,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35706/203307 [6:33:26<30:46:48,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35707/203307 [6:33:30<30:47:02,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35707/203307 [6:33:30<30:47:02,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35708/203307 [6:33:34<30:47:15,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35708/203307 [6:33:34<30:47:16,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35709/203307 [6:33:38<30:47:33,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35709/203307 [6:33:38<30:47:33,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35710/203307 [6:33:42<30:47:47,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35710/203307 [6:33:42<30:47:47,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35711/203307 [6:33:46<30:48:01,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35711/203307 [6:33:46<30:48:01,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35712/203307 [6:33:50<30:48:15,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35712/203307 [6:33:50<30:48:15,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35713/203307 [6:33:54<30:48:32,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35713/203307 [6:33:54<30:48:32,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35714/203307 [6:33:58<30:48:46,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35714/203307 [6:33:58<30:48:46,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35715/203307 [6:34:03<30:49:04,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35715/203307 [6:34:03<30:49:04,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35716/203307 [6:34:06<30:49:18,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35716/203307 [6:34:06<30:49:18,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35717/203307 [6:34:11<30:49:35,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35717/203307 [6:34:11<30:49:35,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35718/203307 [6:34:15<30:49:49,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35718/203307 [6:34:15<30:49:49,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35719/203307 [6:34:18<30:50:03,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35719/203307 [6:34:18<30:50:03,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35720/203307 [6:34:22<30:50:17,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35720/203307 [6:34:22<30:50:17,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35721/203307 [6:34:27<30:50:34,  1.51it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 35721/203307 [6:34:27<30:50:34,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35722/203307 [6:34:30<30:50:48,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35722/203307 [6:34:30<30:50:48,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35723/203307 [6:34:35<30:51:05,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35723/203307 [6:34:35<30:51:05,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35724/203307 [6:34:39<30:51:19,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35724/203307 [6:34:39<30:51:19,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35725/203307 [6:34:42<30:51:33,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35725/203307 [6:34:42<30:51:33,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35726/203307 [6:34:47<30:51:50,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35726/203307 [6:34:47<30:51:50,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35727/203307 [6:34:51<30:52:06,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35727/203307 [6:34:51<30:52:06,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35728/203307 [6:34:55<30:52:19,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35728/203307 [6:34:55<30:52:19,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35729/203307 [6:34:59<30:52:36,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35729/203307 [6:34:59<30:52:36,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35730/203307 [6:35:03<30:52:50,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35730/203307 [6:35:03<30:52:50,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35731/203307 [6:35:06<30:53:04,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35731/203307 [6:35:06<30:53:04,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35732/203307 [6:35:11<30:53:21,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35732/203307 [6:35:11<30:53:21,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35733/203307 [6:35:15<30:53:35,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35733/203307 [6:35:15<30:53:35,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35734/203307 [6:35:18<30:53:48,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35734/203307 [6:35:18<30:53:48,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35735/203307 [6:35:23<30:54:05,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35735/203307 [6:35:23<30:54:05,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35736/203307 [6:35:27<30:54:22,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35736/203307 [6:35:27<30:54:22,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35737/203307 [6:35:31<30:54:35,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35737/203307 [6:35:31<30:54:35,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35738/203307 [6:35:35<30:54:53,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35738/203307 [6:35:35<30:54:53,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35739/203307 [6:35:39<30:55:06,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35739/203307 [6:35:39<30:55:06,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35740/203307 [6:35:43<30:55:20,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35740/203307 [6:35:43<30:55:20,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35741/203307 [6:35:47<30:55:37,  1.51it/s, v_num=line, training/loss=0.0745]Epoch 0:  18%|█▊        | 35741/203307 [6:35:47<30:55:37,  1.51it/s, v_num=line, training/loss=0.082] Epoch 0:  18%|█▊        | 35742/203307 [6:35:51<30:55:52,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35742/203307 [6:35:51<30:55:52,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35743/203307 [6:35:56<30:56:09,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35743/203307 [6:35:56<30:56:09,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35744/203307 [6:36:00<30:56:25,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35744/203307 [6:36:00<30:56:25,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35745/203307 [6:36:04<30:56:39,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35745/203307 [6:36:04<30:56:39,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35746/203307 [6:36:08<30:56:57,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35746/203307 [6:36:08<30:56:57,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35747/203307 [6:36:12<30:57:10,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35747/203307 [6:36:12<30:57:10,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35748/203307 [6:36:16<30:57:24,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35748/203307 [6:36:16<30:57:24,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35749/203307 [6:36:20<30:57:41,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35749/203307 [6:36:20<30:57:41,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35750/203307 [6:36:24<30:57:56,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35750/203307 [6:36:24<30:57:56,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35751/203307 [6:36:28<30:58:10,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35751/203307 [6:36:28<30:58:10,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35752/203307 [6:36:32<30:58:27,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35752/203307 [6:36:32<30:58:27,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35753/203307 [6:36:36<30:58:40,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35753/203307 [6:36:36<30:58:40,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35754/203307 [6:36:41<30:58:58,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35754/203307 [6:36:41<30:58:58,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35755/203307 [6:36:44<30:59:12,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35755/203307 [6:36:44<30:59:12,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35756/203307 [6:36:48<30:59:26,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35756/203307 [6:36:48<30:59:26,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35757/203307 [6:36:52<30:59:40,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35757/203307 [6:36:52<30:59:40,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35758/203307 [6:36:57<30:59:58,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35758/203307 [6:36:57<30:59:58,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35759/203307 [6:37:00<31:00:12,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35759/203307 [6:37:00<31:00:12,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35760/203307 [6:37:04<31:00:26,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35760/203307 [6:37:04<31:00:26,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35761/203307 [6:37:09<31:00:43,  1.50it/s, v_num=line, training/loss=0.082]Epoch 0:  18%|█▊        | 35761/203307 [6:37:09<31:00:43,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35762/203307 [6:37:13<31:00:58,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35762/203307 [6:37:13<31:00:58,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35763/203307 [6:37:17<31:01:15,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35763/203307 [6:37:17<31:01:15,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35764/203307 [6:37:21<31:01:29,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35764/203307 [6:37:21<31:01:29,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35765/203307 [6:37:25<31:01:42,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35765/203307 [6:37:25<31:01:43,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35766/203307 [6:37:29<31:01:57,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35766/203307 [6:37:29<31:01:57,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35767/203307 [6:37:33<31:02:15,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35767/203307 [6:37:33<31:02:15,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35768/203307 [6:37:37<31:02:29,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35768/203307 [6:37:37<31:02:29,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35769/203307 [6:37:41<31:02:45,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35769/203307 [6:37:41<31:02:45,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35770/203307 [6:37:45<31:03:00,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35770/203307 [6:37:45<31:03:00,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35771/203307 [6:37:50<31:03:17,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35771/203307 [6:37:50<31:03:17,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35772/203307 [6:37:53<31:03:30,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35772/203307 [6:37:53<31:03:30,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35773/203307 [6:37:57<31:03:44,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35773/203307 [6:37:57<31:03:44,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35774/203307 [6:38:01<31:04:00,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35774/203307 [6:38:01<31:04:00,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35775/203307 [6:38:06<31:04:17,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35775/203307 [6:38:06<31:04:17,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35776/203307 [6:38:09<31:04:31,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35776/203307 [6:38:09<31:04:31,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35777/203307 [6:38:13<31:04:44,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35777/203307 [6:38:13<31:04:44,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35778/203307 [6:38:18<31:05:02,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35778/203307 [6:38:18<31:05:02,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35779/203307 [6:38:22<31:05:19,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35779/203307 [6:38:22<31:05:19,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35780/203307 [6:38:26<31:05:33,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35780/203307 [6:38:26<31:05:33,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35781/203307 [6:38:30<31:05:49,  1.50it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 35781/203307 [6:38:30<31:05:49,  1.50it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35782/203307 [6:38:34<31:06:04,  1.50it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35782/203307 [6:38:34<31:06:04,  1.50it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35783/203307 [6:38:38<31:06:18,  1.50it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35783/203307 [6:38:38<31:06:18,  1.50it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35784/203307 [6:38:43<31:06:35,  1.50it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35784/203307 [6:38:43<31:06:35,  1.50it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35785/203307 [6:38:46<31:06:49,  1.50it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35785/203307 [6:38:46<31:06:49,  1.50it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35786/203307 [6:38:50<31:07:04,  1.50it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35786/203307 [6:38:50<31:07:04,  1.50it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35787/203307 [6:38:55<31:07:21,  1.50it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35787/203307 [6:38:55<31:07:21,  1.50it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35788/203307 [6:38:59<31:07:37,  1.49it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35788/203307 [6:38:59<31:07:37,  1.49it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35789/203307 [6:39:03<31:07:51,  1.49it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35789/203307 [6:39:03<31:07:52,  1.49it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35790/203307 [6:39:07<31:08:08,  1.49it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35790/203307 [6:39:07<31:08:08,  1.49it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35791/203307 [6:39:11<31:08:22,  1.49it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35791/203307 [6:39:11<31:08:22,  1.49it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35792/203307 [6:39:15<31:08:36,  1.49it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35792/203307 [6:39:15<31:08:36,  1.49it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35793/203307 [6:39:19<31:08:53,  1.49it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35793/203307 [6:39:19<31:08:54,  1.49it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35794/203307 [6:39:23<31:09:08,  1.49it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35794/203307 [6:39:23<31:09:09,  1.49it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35795/203307 [6:39:28<31:09:25,  1.49it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35795/203307 [6:39:28<31:09:25,  1.49it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35796/203307 [6:39:32<31:09:42,  1.49it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35796/203307 [6:39:32<31:09:42,  1.49it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35797/203307 [6:39:36<31:09:56,  1.49it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35797/203307 [6:39:36<31:09:56,  1.49it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35798/203307 [6:39:40<31:10:12,  1.49it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35798/203307 [6:39:40<31:10:12,  1.49it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35799/203307 [6:39:44<31:10:26,  1.49it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35799/203307 [6:39:44<31:10:26,  1.49it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35800/203307 [6:39:48<31:10:40,  1.49it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35800/203307 [6:39:48<31:10:40,  1.49it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35801/203307 [6:39:52<31:10:58,  1.49it/s, v_num=line, training/loss=0.0811]Epoch 0:  18%|█▊        | 35801/203307 [6:39:52<31:10:58,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35802/203307 [6:39:56<31:11:13,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35802/203307 [6:39:56<31:11:13,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35803/203307 [6:40:00<31:11:26,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35803/203307 [6:40:00<31:11:26,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35804/203307 [6:40:05<31:11:43,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35804/203307 [6:40:05<31:11:43,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35805/203307 [6:40:08<31:11:57,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35805/203307 [6:40:08<31:11:57,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35806/203307 [6:40:12<31:12:12,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35806/203307 [6:40:12<31:12:12,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35807/203307 [6:40:16<31:12:26,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35807/203307 [6:40:16<31:12:26,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35808/203307 [6:40:21<31:12:43,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35808/203307 [6:40:21<31:12:43,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35809/203307 [6:40:24<31:12:56,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35809/203307 [6:40:24<31:12:57,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35810/203307 [6:40:29<31:13:15,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35810/203307 [6:40:29<31:13:15,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35811/203307 [6:40:33<31:13:28,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35811/203307 [6:40:33<31:13:28,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35812/203307 [6:40:36<31:13:42,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35812/203307 [6:40:36<31:13:42,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35813/203307 [6:40:41<31:13:59,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35813/203307 [6:40:41<31:13:59,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35814/203307 [6:40:45<31:14:14,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35814/203307 [6:40:45<31:14:14,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35815/203307 [6:40:49<31:14:27,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35815/203307 [6:40:49<31:14:27,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35816/203307 [6:40:52<31:14:42,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35816/203307 [6:40:52<31:14:42,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35817/203307 [6:40:57<31:14:58,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35817/203307 [6:40:57<31:14:58,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35818/203307 [6:41:01<31:15:13,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35818/203307 [6:41:01<31:15:13,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35819/203307 [6:41:05<31:15:30,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35819/203307 [6:41:05<31:15:30,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35820/203307 [6:41:09<31:15:44,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35820/203307 [6:41:09<31:15:44,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35821/203307 [6:41:13<31:16:01,  1.49it/s, v_num=line, training/loss=0.0823]Epoch 0:  18%|█▊        | 35821/203307 [6:41:13<31:16:01,  1.49it/s, v_num=line, training/loss=0.078] Epoch 0:  18%|█▊        | 35822/203307 [6:41:17<31:16:15,  1.49it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35822/203307 [6:41:17<31:16:15,  1.49it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35823/203307 [6:41:21<31:16:29,  1.49it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35823/203307 [6:41:21<31:16:30,  1.49it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35824/203307 [6:41:25<31:16:43,  1.49it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35824/203307 [6:41:25<31:16:43,  1.49it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35825/203307 [6:41:29<31:17:00,  1.49it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35825/203307 [6:41:29<31:17:00,  1.49it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35826/203307 [6:41:33<31:17:15,  1.49it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35826/203307 [6:41:33<31:17:15,  1.49it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35827/203307 [6:41:38<31:17:32,  1.49it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35827/203307 [6:41:38<31:17:32,  1.49it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35828/203307 [6:41:42<31:17:46,  1.49it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35828/203307 [6:41:42<31:17:46,  1.49it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35829/203307 [6:41:46<31:18:02,  1.49it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35829/203307 [6:41:46<31:18:02,  1.49it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35830/203307 [6:41:51<31:18:20,  1.49it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35830/203307 [6:41:51<31:18:20,  1.49it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35831/203307 [6:41:54<31:18:33,  1.49it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35831/203307 [6:41:54<31:18:33,  1.49it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35832/203307 [6:41:58<31:18:47,  1.49it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35832/203307 [6:41:58<31:18:47,  1.49it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35833/203307 [6:42:02<31:19:01,  1.49it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35833/203307 [6:42:02<31:19:01,  1.49it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35834/203307 [6:42:06<31:19:16,  1.49it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35834/203307 [6:42:06<31:19:16,  1.49it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35835/203307 [6:42:10<31:19:33,  1.49it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35835/203307 [6:42:10<31:19:33,  1.49it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35836/203307 [6:42:15<31:19:50,  1.48it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35836/203307 [6:42:15<31:19:50,  1.48it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35837/203307 [6:42:19<31:20:04,  1.48it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35837/203307 [6:42:19<31:20:04,  1.48it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35838/203307 [6:42:23<31:20:22,  1.48it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35838/203307 [6:42:23<31:20:22,  1.48it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35839/203307 [6:42:28<31:20:38,  1.48it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35839/203307 [6:42:28<31:20:38,  1.48it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35840/203307 [6:42:31<31:20:52,  1.48it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35840/203307 [6:42:31<31:20:52,  1.48it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35841/203307 [6:42:35<31:21:06,  1.48it/s, v_num=line, training/loss=0.078]Epoch 0:  18%|█▊        | 35841/203307 [6:42:35<31:21:06,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35842/203307 [6:42:39<31:21:21,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35842/203307 [6:42:39<31:21:21,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35843/203307 [6:42:43<31:21:35,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35843/203307 [6:42:43<31:21:35,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35844/203307 [6:42:47<31:21:52,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35844/203307 [6:42:47<31:21:52,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35845/203307 [6:42:52<31:22:08,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35845/203307 [6:42:52<31:22:08,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35846/203307 [6:42:56<31:22:26,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35846/203307 [6:42:56<31:22:26,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35847/203307 [6:43:01<31:22:43,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35847/203307 [6:43:01<31:22:43,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35848/203307 [6:43:05<31:22:57,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35848/203307 [6:43:05<31:22:57,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35849/203307 [6:43:08<31:23:10,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35849/203307 [6:43:08<31:23:10,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35850/203307 [6:43:12<31:23:25,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35850/203307 [6:43:12<31:23:25,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35851/203307 [6:43:16<31:23:39,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35851/203307 [6:43:16<31:23:39,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35852/203307 [6:43:20<31:23:55,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35852/203307 [6:43:20<31:23:55,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35853/203307 [6:43:25<31:24:12,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35853/203307 [6:43:25<31:24:12,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35854/203307 [6:43:29<31:24:30,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35854/203307 [6:43:29<31:24:30,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35855/203307 [6:43:33<31:24:44,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35855/203307 [6:43:33<31:24:44,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35856/203307 [6:43:38<31:25:00,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35856/203307 [6:43:38<31:25:00,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35857/203307 [6:43:41<31:25:14,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35857/203307 [6:43:41<31:25:14,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35858/203307 [6:43:45<31:25:29,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35858/203307 [6:43:45<31:25:29,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35859/203307 [6:43:49<31:25:42,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35859/203307 [6:43:49<31:25:42,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35860/203307 [6:43:53<31:25:56,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35860/203307 [6:43:53<31:25:56,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35861/203307 [6:43:57<31:26:10,  1.48it/s, v_num=line, training/loss=0.0791]Epoch 0:  18%|█▊        | 35861/203307 [6:43:57<31:26:11,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35862/203307 [6:44:02<31:26:29,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35862/203307 [6:44:02<31:26:29,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35863/203307 [6:44:06<31:26:46,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35863/203307 [6:44:06<31:26:46,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35864/203307 [6:44:10<31:27:00,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35864/203307 [6:44:10<31:27:00,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35865/203307 [6:44:14<31:27:17,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35865/203307 [6:44:14<31:27:17,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35866/203307 [6:44:18<31:27:31,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35866/203307 [6:44:18<31:27:31,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35867/203307 [6:44:22<31:27:45,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35867/203307 [6:44:22<31:27:45,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35868/203307 [6:44:26<31:27:59,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35868/203307 [6:44:26<31:27:59,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35869/203307 [6:44:29<31:28:13,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35869/203307 [6:44:30<31:28:13,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35870/203307 [6:44:33<31:28:28,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35870/203307 [6:44:33<31:28:28,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35871/203307 [6:44:38<31:28:45,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35871/203307 [6:44:38<31:28:45,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35872/203307 [6:44:42<31:28:59,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35872/203307 [6:44:42<31:28:59,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35873/203307 [6:44:46<31:29:15,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35873/203307 [6:44:46<31:29:15,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35874/203307 [6:44:50<31:29:30,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35874/203307 [6:44:50<31:29:30,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35875/203307 [6:44:54<31:29:44,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35875/203307 [6:44:54<31:29:44,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35876/203307 [6:44:58<31:29:58,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35876/203307 [6:44:58<31:29:58,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35877/203307 [6:45:02<31:30:12,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35877/203307 [6:45:02<31:30:12,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35878/203307 [6:45:06<31:30:27,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35878/203307 [6:45:06<31:30:27,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35879/203307 [6:45:10<31:30:44,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35879/203307 [6:45:10<31:30:44,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35880/203307 [6:45:14<31:30:58,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35880/203307 [6:45:14<31:30:58,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35881/203307 [6:45:18<31:31:13,  1.48it/s, v_num=line, training/loss=0.0831]Epoch 0:  18%|█▊        | 35881/203307 [6:45:18<31:31:13,  1.48it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35882/203307 [6:45:23<31:31:31,  1.48it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35882/203307 [6:45:23<31:31:31,  1.48it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35883/203307 [6:45:26<31:31:45,  1.48it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35883/203307 [6:45:26<31:31:45,  1.48it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35884/203307 [6:45:30<31:31:58,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35884/203307 [6:45:30<31:31:58,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35885/203307 [6:45:34<31:32:12,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35885/203307 [6:45:34<31:32:12,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35886/203307 [6:45:38<31:32:27,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35886/203307 [6:45:38<31:32:27,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35887/203307 [6:45:42<31:32:41,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35887/203307 [6:45:42<31:32:41,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35888/203307 [6:45:46<31:32:58,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35888/203307 [6:45:46<31:32:58,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35889/203307 [6:45:51<31:33:15,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35889/203307 [6:45:51<31:33:15,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35890/203307 [6:45:55<31:33:29,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35890/203307 [6:45:55<31:33:29,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35891/203307 [6:45:59<31:33:46,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35891/203307 [6:45:59<31:33:46,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35892/203307 [6:46:03<31:34:00,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35892/203307 [6:46:03<31:34:00,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35893/203307 [6:46:07<31:34:13,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35893/203307 [6:46:07<31:34:13,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35894/203307 [6:46:11<31:34:28,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35894/203307 [6:46:11<31:34:28,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35895/203307 [6:46:14<31:34:42,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35895/203307 [6:46:14<31:34:42,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35896/203307 [6:46:19<31:34:58,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35896/203307 [6:46:19<31:34:58,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35897/203307 [6:46:23<31:35:15,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35897/203307 [6:46:23<31:35:15,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35898/203307 [6:46:27<31:35:32,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35898/203307 [6:46:27<31:35:32,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35899/203307 [6:46:32<31:35:48,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35899/203307 [6:46:32<31:35:48,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35900/203307 [6:46:36<31:36:02,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35900/203307 [6:46:36<31:36:02,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35901/203307 [6:46:39<31:36:16,  1.47it/s, v_num=line, training/loss=0.0839]Epoch 0:  18%|█▊        | 35901/203307 [6:46:39<31:36:16,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35902/203307 [6:46:43<31:36:30,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35902/203307 [6:46:43<31:36:30,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35903/203307 [6:46:47<31:36:44,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35903/203307 [6:46:47<31:36:44,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35904/203307 [6:46:51<31:37:01,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35904/203307 [6:46:51<31:37:01,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35905/203307 [6:46:56<31:37:18,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35905/203307 [6:46:56<31:37:18,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35906/203307 [6:47:00<31:37:34,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35906/203307 [6:47:00<31:37:34,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35907/203307 [6:47:04<31:37:48,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35907/203307 [6:47:04<31:37:48,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35908/203307 [6:47:09<31:38:05,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35908/203307 [6:47:09<31:38:05,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35909/203307 [6:47:12<31:38:19,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35909/203307 [6:47:12<31:38:19,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35910/203307 [6:47:16<31:38:34,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35910/203307 [6:47:16<31:38:34,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35911/203307 [6:47:20<31:38:47,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35911/203307 [6:47:20<31:38:47,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35912/203307 [6:47:24<31:39:01,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35912/203307 [6:47:24<31:39:01,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35913/203307 [6:47:28<31:39:18,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35913/203307 [6:47:28<31:39:18,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35914/203307 [6:47:33<31:39:36,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35914/203307 [6:47:33<31:39:36,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35915/203307 [6:47:37<31:39:50,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35915/203307 [6:47:37<31:39:50,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35916/203307 [6:47:41<31:40:06,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35916/203307 [6:47:41<31:40:06,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35917/203307 [6:47:45<31:40:22,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35917/203307 [6:47:45<31:40:22,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35918/203307 [6:47:49<31:40:37,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35918/203307 [6:47:49<31:40:37,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35919/203307 [6:47:53<31:40:51,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35919/203307 [6:47:53<31:40:51,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35920/203307 [6:47:57<31:41:05,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35920/203307 [6:47:57<31:41:05,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35921/203307 [6:48:01<31:41:21,  1.47it/s, v_num=line, training/loss=0.0789]Epoch 0:  18%|█▊        | 35921/203307 [6:48:01<31:41:21,  1.47it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35922/203307 [6:48:05<31:41:36,  1.47it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35922/203307 [6:48:05<31:41:36,  1.47it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35923/203307 [6:48:10<31:41:53,  1.47it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35923/203307 [6:48:10<31:41:53,  1.47it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35924/203307 [6:48:14<31:42:07,  1.47it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35924/203307 [6:48:14<31:42:07,  1.47it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35925/203307 [6:48:18<31:42:24,  1.47it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35925/203307 [6:48:18<31:42:24,  1.47it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35926/203307 [6:48:22<31:42:39,  1.47it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35926/203307 [6:48:22<31:42:39,  1.47it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35927/203307 [6:48:26<31:42:52,  1.47it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35927/203307 [6:48:26<31:42:52,  1.47it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35928/203307 [6:48:30<31:43:06,  1.47it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35928/203307 [6:48:30<31:43:06,  1.47it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35929/203307 [6:48:34<31:43:22,  1.47it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35929/203307 [6:48:34<31:43:23,  1.47it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35930/203307 [6:48:38<31:43:37,  1.47it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35930/203307 [6:48:38<31:43:37,  1.47it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35931/203307 [6:48:42<31:43:54,  1.47it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35931/203307 [6:48:42<31:43:54,  1.47it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35932/203307 [6:48:46<31:44:08,  1.47it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35932/203307 [6:48:46<31:44:08,  1.47it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35933/203307 [6:48:51<31:44:24,  1.46it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35933/203307 [6:48:51<31:44:24,  1.46it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35934/203307 [6:48:55<31:44:41,  1.46it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35934/203307 [6:48:55<31:44:41,  1.46it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35935/203307 [6:48:59<31:44:55,  1.46it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35935/203307 [6:48:59<31:44:55,  1.46it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35936/203307 [6:49:03<31:45:09,  1.46it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35936/203307 [6:49:03<31:45:09,  1.46it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35937/203307 [6:49:07<31:45:23,  1.46it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35937/203307 [6:49:07<31:45:23,  1.46it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35938/203307 [6:49:11<31:45:40,  1.46it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35938/203307 [6:49:11<31:45:40,  1.46it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35939/203307 [6:49:15<31:45:54,  1.46it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35939/203307 [6:49:15<31:45:54,  1.46it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35940/203307 [6:49:19<31:46:11,  1.46it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35940/203307 [6:49:19<31:46:11,  1.46it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35941/203307 [6:49:23<31:46:24,  1.46it/s, v_num=line, training/loss=0.0847]Epoch 0:  18%|█▊        | 35941/203307 [6:49:23<31:46:24,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35942/203307 [6:49:27<31:46:39,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35942/203307 [6:49:27<31:46:39,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35943/203307 [6:49:31<31:46:55,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35943/203307 [6:49:31<31:46:55,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35944/203307 [6:49:35<31:47:09,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35944/203307 [6:49:35<31:47:09,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35945/203307 [6:49:39<31:47:23,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35945/203307 [6:49:39<31:47:23,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35946/203307 [6:49:44<31:47:41,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35946/203307 [6:49:44<31:47:41,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35947/203307 [6:49:47<31:47:54,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35947/203307 [6:49:47<31:47:54,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35948/203307 [6:49:51<31:48:08,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35948/203307 [6:49:51<31:48:08,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35949/203307 [6:49:56<31:48:26,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35949/203307 [6:49:56<31:48:26,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35950/203307 [6:50:00<31:48:40,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35950/203307 [6:50:00<31:48:40,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35951/203307 [6:50:04<31:48:56,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35951/203307 [6:50:04<31:48:57,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35952/203307 [6:50:08<31:49:13,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35952/203307 [6:50:08<31:49:13,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35953/203307 [6:50:12<31:49:26,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35953/203307 [6:50:12<31:49:26,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35954/203307 [6:50:17<31:49:43,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35954/203307 [6:50:17<31:49:44,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35955/203307 [6:50:20<31:49:57,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35955/203307 [6:50:20<31:49:57,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35956/203307 [6:50:24<31:50:11,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35956/203307 [6:50:24<31:50:11,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35957/203307 [6:50:29<31:50:28,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35957/203307 [6:50:29<31:50:28,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35958/203307 [6:50:33<31:50:42,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35958/203307 [6:50:33<31:50:42,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35959/203307 [6:50:36<31:50:55,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35959/203307 [6:50:36<31:50:55,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35960/203307 [6:50:41<31:51:12,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35960/203307 [6:50:41<31:51:12,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35961/203307 [6:50:44<31:51:25,  1.46it/s, v_num=line, training/loss=0.0845]Epoch 0:  18%|█▊        | 35961/203307 [6:50:44<31:51:25,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35962/203307 [6:50:48<31:51:40,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35962/203307 [6:50:48<31:51:40,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35963/203307 [6:50:53<31:51:57,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35963/203307 [6:50:53<31:51:57,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35964/203307 [6:50:57<31:52:11,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35964/203307 [6:50:57<31:52:11,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35965/203307 [6:51:00<31:52:24,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35965/203307 [6:51:00<31:52:24,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35966/203307 [6:51:05<31:52:42,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35966/203307 [6:51:05<31:52:42,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35967/203307 [6:51:09<31:52:56,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35967/203307 [6:51:09<31:52:56,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35968/203307 [6:51:12<31:53:09,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35968/203307 [6:51:12<31:53:09,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35969/203307 [6:51:17<31:53:26,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35969/203307 [6:51:17<31:53:26,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35970/203307 [6:51:21<31:53:42,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35970/203307 [6:51:21<31:53:42,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35971/203307 [6:51:26<31:53:58,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35971/203307 [6:51:26<31:53:58,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35972/203307 [6:51:29<31:54:12,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35972/203307 [6:51:29<31:54:12,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35973/203307 [6:51:33<31:54:25,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35973/203307 [6:51:33<31:54:25,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35974/203307 [6:51:37<31:54:40,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35974/203307 [6:51:37<31:54:40,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35975/203307 [6:51:41<31:54:57,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35975/203307 [6:51:41<31:54:57,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35976/203307 [6:51:45<31:55:10,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35976/203307 [6:51:45<31:55:10,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35977/203307 [6:51:50<31:55:27,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35977/203307 [6:51:50<31:55:27,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35978/203307 [6:51:54<31:55:42,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35978/203307 [6:51:54<31:55:42,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35979/203307 [6:51:58<31:55:58,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35979/203307 [6:51:58<31:55:58,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35980/203307 [6:52:02<31:56:12,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35980/203307 [6:52:02<31:56:12,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35981/203307 [6:52:06<31:56:26,  1.46it/s, v_num=line, training/loss=0.0864]Epoch 0:  18%|█▊        | 35981/203307 [6:52:06<31:56:26,  1.46it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35982/203307 [6:52:10<31:56:41,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35982/203307 [6:52:10<31:56:41,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35983/203307 [6:52:14<31:56:58,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35983/203307 [6:52:14<31:56:58,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35984/203307 [6:52:18<31:57:12,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35984/203307 [6:52:18<31:57:12,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35985/203307 [6:52:22<31:57:26,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35985/203307 [6:52:22<31:57:26,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35986/203307 [6:52:27<31:57:44,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35986/203307 [6:52:27<31:57:44,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35987/203307 [6:52:31<31:58:00,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35987/203307 [6:52:31<31:58:00,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35988/203307 [6:52:35<31:58:17,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35988/203307 [6:52:35<31:58:17,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35989/203307 [6:52:39<31:58:30,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35989/203307 [6:52:39<31:58:31,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35990/203307 [6:52:43<31:58:45,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35990/203307 [6:52:43<31:58:45,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35991/203307 [6:52:47<31:58:59,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35991/203307 [6:52:47<31:58:59,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35992/203307 [6:52:51<31:59:16,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35992/203307 [6:52:51<31:59:16,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35993/203307 [6:52:55<31:59:30,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35993/203307 [6:52:55<31:59:30,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35994/203307 [6:52:59<31:59:45,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35994/203307 [6:52:59<31:59:45,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35995/203307 [6:53:04<32:00:01,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35995/203307 [6:53:04<32:00:01,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35996/203307 [6:53:08<32:00:18,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35996/203307 [6:53:08<32:00:18,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35997/203307 [6:53:12<32:00:34,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35997/203307 [6:53:12<32:00:34,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35998/203307 [6:53:16<32:00:49,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35998/203307 [6:53:16<32:00:49,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35999/203307 [6:53:20<32:01:02,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 35999/203307 [6:53:20<32:01:02,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 36000/203307 [6:53:24<32:01:16,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 36000/203307 [6:53:24<32:01:16,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 36001/203307 [6:53:29<32:01:34,  1.45it/s, v_num=line, training/loss=0.0876]Epoch 0:  18%|█▊        | 36001/203307 [6:53:29<32:01:34,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36002/203307 [6:53:33<32:01:48,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36002/203307 [6:53:33<32:01:48,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36003/203307 [6:53:37<32:02:05,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36003/203307 [6:53:37<32:02:05,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36004/203307 [6:53:41<32:02:22,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36004/203307 [6:53:41<32:02:22,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36005/203307 [6:53:45<32:02:36,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36005/203307 [6:53:45<32:02:36,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36006/203307 [6:53:50<32:02:52,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36006/203307 [6:53:50<32:02:52,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36007/203307 [6:53:53<32:03:06,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36007/203307 [6:53:53<32:03:06,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36008/203307 [6:53:57<32:03:20,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36008/203307 [6:53:57<32:03:20,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36009/203307 [6:54:02<32:03:38,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36009/203307 [6:54:02<32:03:38,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36010/203307 [6:54:06<32:03:52,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36010/203307 [6:54:06<32:03:53,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36011/203307 [6:54:10<32:04:06,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36011/203307 [6:54:10<32:04:06,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36012/203307 [6:54:14<32:04:22,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36012/203307 [6:54:14<32:04:22,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36013/203307 [6:54:18<32:04:38,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36013/203307 [6:54:18<32:04:38,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36014/203307 [6:54:23<32:04:55,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36014/203307 [6:54:23<32:04:55,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36015/203307 [6:54:26<32:05:08,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36015/203307 [6:54:26<32:05:08,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36016/203307 [6:54:30<32:05:21,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36016/203307 [6:54:30<32:05:21,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36017/203307 [6:54:34<32:05:35,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36017/203307 [6:54:34<32:05:35,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36018/203307 [6:54:39<32:05:53,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36018/203307 [6:54:39<32:05:53,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36019/203307 [6:54:42<32:06:07,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36019/203307 [6:54:42<32:06:07,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36020/203307 [6:54:46<32:06:20,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36020/203307 [6:54:46<32:06:20,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36021/203307 [6:54:50<32:06:36,  1.45it/s, v_num=line, training/loss=0.0778]Epoch 0:  18%|█▊        | 36021/203307 [6:54:51<32:06:36,  1.45it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36022/203307 [6:54:54<32:06:51,  1.45it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36022/203307 [6:54:54<32:06:51,  1.45it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36023/203307 [6:54:58<32:07:04,  1.45it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36023/203307 [6:54:58<32:07:05,  1.45it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36024/203307 [6:55:03<32:07:21,  1.45it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36024/203307 [6:55:03<32:07:21,  1.45it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36025/203307 [6:55:06<32:07:34,  1.45it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36025/203307 [6:55:06<32:07:34,  1.45it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36026/203307 [6:55:10<32:07:49,  1.45it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36026/203307 [6:55:10<32:07:49,  1.45it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36027/203307 [6:55:15<32:08:05,  1.45it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36027/203307 [6:55:15<32:08:05,  1.45it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36028/203307 [6:55:18<32:08:19,  1.45it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36028/203307 [6:55:18<32:08:19,  1.45it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36029/203307 [6:55:23<32:08:35,  1.45it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36029/203307 [6:55:23<32:08:35,  1.45it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36030/203307 [6:55:27<32:08:50,  1.45it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36030/203307 [6:55:27<32:08:50,  1.45it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36031/203307 [6:55:30<32:09:03,  1.45it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36031/203307 [6:55:30<32:09:03,  1.45it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36032/203307 [6:55:34<32:09:16,  1.45it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36032/203307 [6:55:34<32:09:16,  1.45it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36033/203307 [6:55:39<32:09:33,  1.44it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36033/203307 [6:55:39<32:09:33,  1.44it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36034/203307 [6:55:43<32:09:47,  1.44it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36034/203307 [6:55:43<32:09:47,  1.44it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36035/203307 [6:55:47<32:10:04,  1.44it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36035/203307 [6:55:47<32:10:04,  1.44it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36036/203307 [6:55:51<32:10:17,  1.44it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36036/203307 [6:55:51<32:10:17,  1.44it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36037/203307 [6:55:54<32:10:31,  1.44it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36037/203307 [6:55:54<32:10:31,  1.44it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36038/203307 [6:55:59<32:10:48,  1.44it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36038/203307 [6:55:59<32:10:48,  1.44it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36039/203307 [6:56:03<32:11:02,  1.44it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36039/203307 [6:56:03<32:11:02,  1.44it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36040/203307 [6:56:06<32:11:15,  1.44it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36040/203307 [6:56:06<32:11:15,  1.44it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36041/203307 [6:56:11<32:11:31,  1.44it/s, v_num=line, training/loss=0.0848]Epoch 0:  18%|█▊        | 36041/203307 [6:56:11<32:11:31,  1.44it/s, v_num=line, training/loss=0.093] Epoch 0:  18%|█▊        | 36042/203307 [6:56:15<32:11:45,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36042/203307 [6:56:15<32:11:45,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36043/203307 [6:56:18<32:11:58,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36043/203307 [6:56:18<32:11:58,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36044/203307 [6:56:23<32:12:16,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36044/203307 [6:56:23<32:12:16,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36045/203307 [6:56:27<32:12:28,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36045/203307 [6:56:27<32:12:28,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36046/203307 [6:56:31<32:12:45,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36046/203307 [6:56:31<32:12:46,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36047/203307 [6:56:35<32:13:01,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36047/203307 [6:56:35<32:13:01,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36048/203307 [6:56:39<32:13:15,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36048/203307 [6:56:39<32:13:15,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36049/203307 [6:56:43<32:13:28,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36049/203307 [6:56:43<32:13:28,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36050/203307 [6:56:47<32:13:43,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36050/203307 [6:56:47<32:13:43,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36051/203307 [6:56:51<32:13:59,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36051/203307 [6:56:51<32:13:59,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36052/203307 [6:56:55<32:14:13,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36052/203307 [6:56:55<32:14:13,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36053/203307 [6:56:59<32:14:30,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36053/203307 [6:56:59<32:14:30,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36054/203307 [6:57:04<32:14:47,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36054/203307 [6:57:04<32:14:47,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36055/203307 [6:57:08<32:15:04,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36055/203307 [6:57:08<32:15:04,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36056/203307 [6:57:12<32:15:18,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36056/203307 [6:57:12<32:15:18,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36057/203307 [6:57:16<32:15:31,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36057/203307 [6:57:16<32:15:31,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36058/203307 [6:57:20<32:15:46,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36058/203307 [6:57:20<32:15:46,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36059/203307 [6:57:24<32:15:59,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36059/203307 [6:57:24<32:15:59,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36060/203307 [6:57:28<32:16:16,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36060/203307 [6:57:28<32:16:16,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36061/203307 [6:57:33<32:16:32,  1.44it/s, v_num=line, training/loss=0.093]Epoch 0:  18%|█▊        | 36061/203307 [6:57:33<32:16:32,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36062/203307 [6:57:37<32:16:47,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36062/203307 [6:57:37<32:16:47,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36063/203307 [6:57:41<32:17:03,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36063/203307 [6:57:41<32:17:03,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36064/203307 [6:57:45<32:17:20,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36064/203307 [6:57:45<32:17:20,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36065/203307 [6:57:49<32:17:33,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36065/203307 [6:57:49<32:17:33,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36066/203307 [6:57:53<32:17:48,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36066/203307 [6:57:53<32:17:48,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36067/203307 [6:57:57<32:18:01,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36067/203307 [6:57:57<32:18:01,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36068/203307 [6:58:01<32:18:16,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36068/203307 [6:58:01<32:18:16,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36069/203307 [6:58:05<32:18:30,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36069/203307 [6:58:05<32:18:30,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36070/203307 [6:58:09<32:18:48,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36070/203307 [6:58:09<32:18:48,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36071/203307 [6:58:14<32:19:04,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36071/203307 [6:58:14<32:19:04,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36072/203307 [6:58:17<32:19:17,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36072/203307 [6:58:17<32:19:17,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36073/203307 [6:58:22<32:19:34,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36073/203307 [6:58:22<32:19:34,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36074/203307 [6:58:26<32:19:47,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36074/203307 [6:58:26<32:19:48,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36075/203307 [6:58:29<32:20:01,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36075/203307 [6:58:29<32:20:01,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36076/203307 [6:58:33<32:20:15,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36076/203307 [6:58:33<32:20:15,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36077/203307 [6:58:37<32:20:28,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36077/203307 [6:58:37<32:20:28,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36078/203307 [6:58:41<32:20:43,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36078/203307 [6:58:41<32:20:44,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36079/203307 [6:58:46<32:21:00,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36079/203307 [6:58:46<32:21:00,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36080/203307 [6:58:49<32:21:14,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36080/203307 [6:58:49<32:21:14,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36081/203307 [6:58:54<32:21:30,  1.44it/s, v_num=line, training/loss=0.0924]Epoch 0:  18%|█▊        | 36081/203307 [6:58:54<32:21:30,  1.44it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36082/203307 [6:58:58<32:21:45,  1.44it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36082/203307 [6:58:58<32:21:45,  1.44it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36083/203307 [6:59:01<32:21:58,  1.44it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36083/203307 [6:59:01<32:21:58,  1.44it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36084/203307 [6:59:05<32:22:12,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36084/203307 [6:59:05<32:22:12,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36085/203307 [6:59:09<32:22:25,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36085/203307 [6:59:09<32:22:25,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36086/203307 [6:59:13<32:22:40,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36086/203307 [6:59:13<32:22:40,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36087/203307 [6:59:18<32:22:57,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36087/203307 [6:59:18<32:22:57,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36088/203307 [6:59:22<32:23:13,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36088/203307 [6:59:22<32:23:13,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36089/203307 [6:59:26<32:23:26,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36089/203307 [6:59:26<32:23:26,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36090/203307 [6:59:30<32:23:44,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36090/203307 [6:59:30<32:23:44,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36091/203307 [6:59:34<32:23:57,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36091/203307 [6:59:34<32:23:57,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36092/203307 [6:59:38<32:24:10,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36092/203307 [6:59:38<32:24:10,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36093/203307 [6:59:41<32:24:24,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36093/203307 [6:59:41<32:24:24,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36094/203307 [6:59:45<32:24:39,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36094/203307 [6:59:45<32:24:39,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36095/203307 [6:59:50<32:24:54,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36095/203307 [6:59:50<32:24:54,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36096/203307 [6:59:54<32:25:11,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36096/203307 [6:59:54<32:25:11,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36097/203307 [6:59:58<32:25:25,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36097/203307 [6:59:58<32:25:25,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36098/203307 [7:00:02<32:25:39,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36098/203307 [7:00:02<32:25:39,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36099/203307 [7:00:06<32:25:55,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36099/203307 [7:00:06<32:25:55,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36100/203307 [7:00:10<32:26:09,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36100/203307 [7:00:10<32:26:09,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36101/203307 [7:00:14<32:26:22,  1.43it/s, v_num=line, training/loss=0.0794]Epoch 0:  18%|█▊        | 36101/203307 [7:00:14<32:26:22,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36102/203307 [7:00:18<32:26:37,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36102/203307 [7:00:18<32:26:37,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36103/203307 [7:00:21<32:26:50,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36103/203307 [7:00:21<32:26:50,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36104/203307 [7:00:26<32:27:07,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36104/203307 [7:00:26<32:27:07,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36105/203307 [7:00:30<32:27:23,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36105/203307 [7:00:30<32:27:24,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36106/203307 [7:00:34<32:27:38,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36106/203307 [7:00:34<32:27:38,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36107/203307 [7:00:39<32:27:54,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36107/203307 [7:00:39<32:27:54,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36108/203307 [7:00:42<32:28:08,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36108/203307 [7:00:42<32:28:08,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36109/203307 [7:00:46<32:28:21,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36109/203307 [7:00:46<32:28:21,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36110/203307 [7:00:50<32:28:36,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36110/203307 [7:00:50<32:28:36,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36111/203307 [7:00:54<32:28:50,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36111/203307 [7:00:54<32:28:50,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36112/203307 [7:00:58<32:29:03,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36112/203307 [7:00:58<32:29:03,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36113/203307 [7:01:02<32:29:20,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36113/203307 [7:01:02<32:29:21,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36114/203307 [7:01:07<32:29:37,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36114/203307 [7:01:07<32:29:37,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36115/203307 [7:01:11<32:29:51,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36115/203307 [7:01:11<32:29:51,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36116/203307 [7:01:15<32:30:08,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36116/203307 [7:01:15<32:30:08,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36117/203307 [7:01:19<32:30:22,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36117/203307 [7:01:19<32:30:22,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36118/203307 [7:01:23<32:30:36,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36118/203307 [7:01:23<32:30:36,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36119/203307 [7:01:27<32:30:50,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36119/203307 [7:01:27<32:30:50,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36120/203307 [7:01:31<32:31:04,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36120/203307 [7:01:31<32:31:04,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36121/203307 [7:01:35<32:31:20,  1.43it/s, v_num=line, training/loss=0.0764]Epoch 0:  18%|█▊        | 36121/203307 [7:01:35<32:31:20,  1.43it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36122/203307 [7:01:40<32:31:38,  1.43it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36122/203307 [7:01:40<32:31:38,  1.43it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36123/203307 [7:01:44<32:31:52,  1.43it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36123/203307 [7:01:44<32:31:52,  1.43it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36124/203307 [7:01:47<32:32:06,  1.43it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36124/203307 [7:01:47<32:32:06,  1.43it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36125/203307 [7:01:52<32:32:22,  1.43it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36125/203307 [7:01:52<32:32:22,  1.43it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36126/203307 [7:01:56<32:32:37,  1.43it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36126/203307 [7:01:56<32:32:37,  1.43it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36127/203307 [7:02:00<32:32:50,  1.43it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36127/203307 [7:02:00<32:32:50,  1.43it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36128/203307 [7:02:03<32:33:04,  1.43it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36128/203307 [7:02:03<32:33:04,  1.43it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36129/203307 [7:02:08<32:33:21,  1.43it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36129/203307 [7:02:08<32:33:21,  1.43it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36130/203307 [7:02:12<32:33:35,  1.43it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36130/203307 [7:02:12<32:33:35,  1.43it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36131/203307 [7:02:17<32:33:52,  1.43it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36131/203307 [7:02:17<32:33:52,  1.43it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36132/203307 [7:02:21<32:34:09,  1.43it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36132/203307 [7:02:21<32:34:09,  1.43it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36133/203307 [7:02:25<32:34:25,  1.43it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36133/203307 [7:02:25<32:34:25,  1.43it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36134/203307 [7:02:29<32:34:39,  1.43it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36134/203307 [7:02:29<32:34:39,  1.43it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36135/203307 [7:02:33<32:34:53,  1.43it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36135/203307 [7:02:33<32:34:53,  1.43it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36136/203307 [7:02:37<32:35:06,  1.43it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36136/203307 [7:02:37<32:35:06,  1.43it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36137/203307 [7:02:41<32:35:20,  1.42it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36137/203307 [7:02:41<32:35:20,  1.42it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36138/203307 [7:02:45<32:35:38,  1.42it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36138/203307 [7:02:45<32:35:38,  1.42it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36139/203307 [7:02:50<32:35:54,  1.42it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36139/203307 [7:02:50<32:35:54,  1.42it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36140/203307 [7:02:53<32:36:08,  1.42it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36140/203307 [7:02:53<32:36:08,  1.42it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36141/203307 [7:02:58<32:36:24,  1.42it/s, v_num=line, training/loss=0.0821]Epoch 0:  18%|█▊        | 36141/203307 [7:02:58<32:36:24,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36142/203307 [7:03:02<32:36:41,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36142/203307 [7:03:02<32:36:41,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36143/203307 [7:03:06<32:36:54,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36143/203307 [7:03:06<32:36:54,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36144/203307 [7:03:10<32:37:08,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36144/203307 [7:03:10<32:37:08,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36145/203307 [7:03:14<32:37:22,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36145/203307 [7:03:14<32:37:22,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36146/203307 [7:03:18<32:37:39,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36146/203307 [7:03:18<32:37:39,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36147/203307 [7:03:22<32:37:53,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36147/203307 [7:03:22<32:37:53,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36148/203307 [7:03:27<32:38:10,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36148/203307 [7:03:27<32:38:10,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36149/203307 [7:03:31<32:38:26,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36149/203307 [7:03:31<32:38:26,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36150/203307 [7:03:35<32:38:41,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36150/203307 [7:03:35<32:38:41,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36151/203307 [7:03:40<32:38:58,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36151/203307 [7:03:40<32:38:58,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36152/203307 [7:03:44<32:39:12,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36152/203307 [7:03:44<32:39:12,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36153/203307 [7:03:47<32:39:25,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36153/203307 [7:03:47<32:39:26,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36154/203307 [7:03:52<32:39:43,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36154/203307 [7:03:52<32:39:43,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36155/203307 [7:03:56<32:39:57,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36155/203307 [7:03:56<32:39:57,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36156/203307 [7:04:00<32:40:10,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36156/203307 [7:04:00<32:40:10,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36157/203307 [7:04:04<32:40:28,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36157/203307 [7:04:04<32:40:28,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36158/203307 [7:04:08<32:40:43,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36158/203307 [7:04:08<32:40:43,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36159/203307 [7:04:13<32:40:59,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36159/203307 [7:04:13<32:40:59,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36160/203307 [7:04:17<32:41:13,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36160/203307 [7:04:17<32:41:13,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36161/203307 [7:04:20<32:41:27,  1.42it/s, v_num=line, training/loss=0.0879]Epoch 0:  18%|█▊        | 36161/203307 [7:04:20<32:41:27,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36162/203307 [7:04:24<32:41:42,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36162/203307 [7:04:24<32:41:42,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36163/203307 [7:04:29<32:41:58,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36163/203307 [7:04:29<32:41:59,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36164/203307 [7:04:33<32:42:12,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36164/203307 [7:04:33<32:42:12,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36165/203307 [7:04:37<32:42:29,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36165/203307 [7:04:37<32:42:29,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36166/203307 [7:04:41<32:42:43,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36166/203307 [7:04:41<32:42:43,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36167/203307 [7:04:45<32:42:57,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36167/203307 [7:04:45<32:42:57,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36168/203307 [7:04:49<32:43:13,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36168/203307 [7:04:49<32:43:13,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36169/203307 [7:04:53<32:43:27,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36169/203307 [7:04:53<32:43:27,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36170/203307 [7:04:57<32:43:41,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36170/203307 [7:04:57<32:43:41,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36171/203307 [7:05:02<32:43:57,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36171/203307 [7:05:02<32:43:57,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36172/203307 [7:05:05<32:44:11,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36172/203307 [7:05:05<32:44:11,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36173/203307 [7:05:09<32:44:24,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36173/203307 [7:05:09<32:44:24,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36174/203307 [7:05:14<32:44:43,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36174/203307 [7:05:14<32:44:43,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36175/203307 [7:05:18<32:44:56,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36175/203307 [7:05:18<32:44:56,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36176/203307 [7:05:22<32:45:11,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36176/203307 [7:05:22<32:45:11,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36177/203307 [7:05:26<32:45:27,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36177/203307 [7:05:26<32:45:28,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36178/203307 [7:05:30<32:45:42,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36178/203307 [7:05:30<32:45:42,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36179/203307 [7:05:35<32:45:58,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36179/203307 [7:05:35<32:45:58,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36180/203307 [7:05:38<32:46:11,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36180/203307 [7:05:38<32:46:11,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36181/203307 [7:05:42<32:46:25,  1.42it/s, v_num=line, training/loss=0.0936]Epoch 0:  18%|█▊        | 36181/203307 [7:05:42<32:46:25,  1.42it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36182/203307 [7:05:46<32:46:40,  1.42it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36182/203307 [7:05:46<32:46:40,  1.42it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36183/203307 [7:05:51<32:46:57,  1.42it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36183/203307 [7:05:51<32:46:57,  1.42it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36184/203307 [7:05:55<32:47:10,  1.42it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36184/203307 [7:05:55<32:47:10,  1.42it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36185/203307 [7:05:59<32:47:27,  1.42it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36185/203307 [7:05:59<32:47:27,  1.42it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36186/203307 [7:06:03<32:47:43,  1.42it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36186/203307 [7:06:03<32:47:43,  1.42it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36187/203307 [7:06:07<32:47:56,  1.42it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36187/203307 [7:06:07<32:47:56,  1.42it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36188/203307 [7:06:11<32:48:13,  1.42it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36188/203307 [7:06:11<32:48:13,  1.42it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36189/203307 [7:06:15<32:48:26,  1.41it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36189/203307 [7:06:15<32:48:26,  1.41it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36190/203307 [7:06:19<32:48:41,  1.41it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36190/203307 [7:06:19<32:48:41,  1.41it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36191/203307 [7:06:24<32:48:58,  1.41it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36191/203307 [7:06:24<32:48:58,  1.41it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36192/203307 [7:06:27<32:49:11,  1.41it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36192/203307 [7:06:27<32:49:11,  1.41it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36193/203307 [7:06:31<32:49:24,  1.41it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36193/203307 [7:06:31<32:49:24,  1.41it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36194/203307 [7:06:36<32:49:42,  1.41it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36194/203307 [7:06:36<32:49:42,  1.41it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36195/203307 [7:06:40<32:49:58,  1.41it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36195/203307 [7:06:40<32:49:58,  1.41it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36196/203307 [7:06:44<32:50:13,  1.41it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36196/203307 [7:06:44<32:50:14,  1.41it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36197/203307 [7:06:48<32:50:27,  1.41it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36197/203307 [7:06:48<32:50:27,  1.41it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36198/203307 [7:06:52<32:50:42,  1.41it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36198/203307 [7:06:52<32:50:42,  1.41it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36199/203307 [7:06:56<32:50:55,  1.41it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36199/203307 [7:06:56<32:50:55,  1.41it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36200/203307 [7:07:01<32:51:12,  1.41it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36200/203307 [7:07:01<32:51:12,  1.41it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36201/203307 [7:07:04<32:51:26,  1.41it/s, v_num=line, training/loss=0.0887]Epoch 0:  18%|█▊        | 36201/203307 [7:07:04<32:51:26,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36202/203307 [7:07:08<32:51:40,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36202/203307 [7:07:08<32:51:40,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36203/203307 [7:07:13<32:51:58,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36203/203307 [7:07:13<32:51:58,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36204/203307 [7:07:18<32:52:15,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36204/203307 [7:07:18<32:52:15,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36205/203307 [7:07:21<32:52:28,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36205/203307 [7:07:21<32:52:28,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36206/203307 [7:07:25<32:52:43,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36206/203307 [7:07:25<32:52:43,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36207/203307 [7:07:29<32:52:56,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36207/203307 [7:07:29<32:52:56,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36208/203307 [7:07:33<32:53:10,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36208/203307 [7:07:33<32:53:10,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36209/203307 [7:07:38<32:53:27,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36209/203307 [7:07:38<32:53:27,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36210/203307 [7:07:41<32:53:41,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36210/203307 [7:07:42<32:53:41,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36211/203307 [7:07:46<32:53:57,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36211/203307 [7:07:46<32:53:57,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36212/203307 [7:07:50<32:54:10,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36212/203307 [7:07:50<32:54:11,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36213/203307 [7:07:54<32:54:27,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36213/203307 [7:07:54<32:54:27,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36214/203307 [7:07:58<32:54:42,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36214/203307 [7:07:58<32:54:42,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36215/203307 [7:08:02<32:54:55,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36215/203307 [7:08:02<32:54:55,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36216/203307 [7:08:06<32:55:08,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36216/203307 [7:08:06<32:55:08,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36217/203307 [7:08:10<32:55:25,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36217/203307 [7:08:10<32:55:25,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36218/203307 [7:08:14<32:55:40,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36218/203307 [7:08:14<32:55:40,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36219/203307 [7:08:18<32:55:53,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36219/203307 [7:08:18<32:55:53,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36220/203307 [7:08:22<32:56:09,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36220/203307 [7:08:22<32:56:09,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36221/203307 [7:08:27<32:56:25,  1.41it/s, v_num=line, training/loss=0.0832]Epoch 0:  18%|█▊        | 36221/203307 [7:08:27<32:56:25,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36222/203307 [7:08:31<32:56:41,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36222/203307 [7:08:31<32:56:41,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36223/203307 [7:08:35<32:56:54,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36223/203307 [7:08:35<32:56:54,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36224/203307 [7:08:38<32:57:07,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36224/203307 [7:08:38<32:57:07,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36225/203307 [7:08:42<32:57:20,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36225/203307 [7:08:42<32:57:21,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36226/203307 [7:08:47<32:57:38,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36226/203307 [7:08:47<32:57:38,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36227/203307 [7:08:50<32:57:51,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36227/203307 [7:08:50<32:57:52,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36228/203307 [7:08:54<32:58:05,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36228/203307 [7:08:54<32:58:05,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36229/203307 [7:08:59<32:58:21,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36229/203307 [7:08:59<32:58:21,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36230/203307 [7:09:03<32:58:37,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36230/203307 [7:09:03<32:58:37,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36231/203307 [7:09:07<32:58:50,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36231/203307 [7:09:07<32:58:50,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36232/203307 [7:09:10<32:59:04,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36232/203307 [7:09:10<32:59:04,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36233/203307 [7:09:14<32:59:17,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36233/203307 [7:09:14<32:59:17,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36234/203307 [7:09:18<32:59:32,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36234/203307 [7:09:18<32:59:32,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36235/203307 [7:09:23<32:59:48,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36235/203307 [7:09:23<32:59:48,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36236/203307 [7:09:26<33:00:02,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36236/203307 [7:09:27<33:00:02,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36237/203307 [7:09:31<33:00:18,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36237/203307 [7:09:31<33:00:18,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36238/203307 [7:09:36<33:00:36,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36238/203307 [7:09:36<33:00:36,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36239/203307 [7:09:39<33:00:49,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36239/203307 [7:09:39<33:00:49,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36240/203307 [7:09:44<33:01:05,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36240/203307 [7:09:44<33:01:05,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36241/203307 [7:09:47<33:01:18,  1.41it/s, v_num=line, training/loss=0.0777]Epoch 0:  18%|█▊        | 36241/203307 [7:09:47<33:01:18,  1.41it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36242/203307 [7:09:51<33:01:32,  1.41it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36242/203307 [7:09:51<33:01:33,  1.41it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36243/203307 [7:09:56<33:01:50,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36243/203307 [7:09:56<33:01:50,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36244/203307 [7:10:00<33:02:04,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36244/203307 [7:10:00<33:02:04,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36245/203307 [7:10:04<33:02:17,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36245/203307 [7:10:04<33:02:17,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36246/203307 [7:10:08<33:02:35,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36246/203307 [7:10:08<33:02:35,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36247/203307 [7:10:12<33:02:49,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36247/203307 [7:10:12<33:02:49,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36248/203307 [7:10:16<33:03:02,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36248/203307 [7:10:16<33:03:02,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36249/203307 [7:10:20<33:03:18,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36249/203307 [7:10:20<33:03:18,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36250/203307 [7:10:24<33:03:33,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36250/203307 [7:10:24<33:03:33,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36251/203307 [7:10:28<33:03:46,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36251/203307 [7:10:28<33:03:46,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36252/203307 [7:10:33<33:04:03,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36252/203307 [7:10:33<33:04:03,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36253/203307 [7:10:36<33:04:16,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36253/203307 [7:10:36<33:04:16,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36254/203307 [7:10:41<33:04:34,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36254/203307 [7:10:41<33:04:34,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36255/203307 [7:10:45<33:04:50,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36255/203307 [7:10:45<33:04:50,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36256/203307 [7:10:49<33:05:03,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36256/203307 [7:10:49<33:05:03,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36257/203307 [7:10:54<33:05:19,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36257/203307 [7:10:54<33:05:19,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36258/203307 [7:10:57<33:05:33,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36258/203307 [7:10:57<33:05:33,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36259/203307 [7:11:01<33:05:46,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36259/203307 [7:11:01<33:05:47,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36260/203307 [7:11:05<33:06:00,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36260/203307 [7:11:05<33:06:00,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36261/203307 [7:11:10<33:06:17,  1.40it/s, v_num=line, training/loss=0.0759]Epoch 0:  18%|█▊        | 36261/203307 [7:11:10<33:06:17,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36262/203307 [7:11:13<33:06:31,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36262/203307 [7:11:13<33:06:31,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36263/203307 [7:11:18<33:06:47,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36263/203307 [7:11:18<33:06:47,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36264/203307 [7:11:22<33:07:01,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36264/203307 [7:11:22<33:07:01,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36265/203307 [7:11:26<33:07:14,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36265/203307 [7:11:26<33:07:14,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36266/203307 [7:11:30<33:07:29,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36266/203307 [7:11:30<33:07:29,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36267/203307 [7:11:34<33:07:45,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36267/203307 [7:11:34<33:07:45,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36268/203307 [7:11:38<33:07:58,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36268/203307 [7:11:38<33:07:58,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36269/203307 [7:11:42<33:08:15,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36269/203307 [7:11:42<33:08:15,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36270/203307 [7:11:46<33:08:30,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36270/203307 [7:11:46<33:08:30,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36271/203307 [7:11:51<33:08:46,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36271/203307 [7:11:51<33:08:46,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36272/203307 [7:11:55<33:09:03,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36272/203307 [7:11:55<33:09:03,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36273/203307 [7:11:59<33:09:16,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36273/203307 [7:11:59<33:09:16,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36274/203307 [7:12:03<33:09:31,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36274/203307 [7:12:03<33:09:31,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36275/203307 [7:12:07<33:09:44,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36275/203307 [7:12:07<33:09:44,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36276/203307 [7:12:11<33:10:00,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36276/203307 [7:12:11<33:10:00,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36277/203307 [7:12:15<33:10:14,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36277/203307 [7:12:15<33:10:14,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36278/203307 [7:12:20<33:10:32,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36278/203307 [7:12:20<33:10:32,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36279/203307 [7:12:24<33:10:48,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36279/203307 [7:12:24<33:10:48,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36280/203307 [7:12:28<33:11:02,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36280/203307 [7:12:28<33:11:02,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36281/203307 [7:12:32<33:11:18,  1.40it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36281/203307 [7:12:32<33:11:18,  1.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36282/203307 [7:12:36<33:11:33,  1.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36282/203307 [7:12:36<33:11:33,  1.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36283/203307 [7:12:40<33:11:46,  1.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36283/203307 [7:12:40<33:11:46,  1.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36284/203307 [7:12:45<33:12:02,  1.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36284/203307 [7:12:45<33:12:02,  1.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36285/203307 [7:12:48<33:12:16,  1.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36285/203307 [7:12:48<33:12:16,  1.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36286/203307 [7:12:52<33:12:30,  1.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36286/203307 [7:12:52<33:12:30,  1.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36287/203307 [7:12:57<33:12:48,  1.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36287/203307 [7:12:57<33:12:48,  1.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36288/203307 [7:13:02<33:13:04,  1.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36288/203307 [7:13:02<33:13:04,  1.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36289/203307 [7:13:06<33:13:21,  1.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36289/203307 [7:13:06<33:13:21,  1.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36290/203307 [7:13:10<33:13:35,  1.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36290/203307 [7:13:10<33:13:35,  1.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36291/203307 [7:13:14<33:13:49,  1.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36291/203307 [7:13:14<33:13:49,  1.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36292/203307 [7:13:18<33:14:02,  1.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36292/203307 [7:13:18<33:14:02,  1.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36293/203307 [7:13:22<33:14:16,  1.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36293/203307 [7:13:22<33:14:17,  1.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36294/203307 [7:13:26<33:14:33,  1.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36294/203307 [7:13:26<33:14:33,  1.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36295/203307 [7:13:31<33:14:50,  1.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36295/203307 [7:13:31<33:14:50,  1.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36296/203307 [7:13:35<33:15:06,  1.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36296/203307 [7:13:35<33:15:06,  1.40it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36297/203307 [7:13:39<33:15:20,  1.39it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36297/203307 [7:13:39<33:15:20,  1.39it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36298/203307 [7:13:44<33:15:37,  1.39it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36298/203307 [7:13:44<33:15:38,  1.39it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36299/203307 [7:13:47<33:15:51,  1.39it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36299/203307 [7:13:47<33:15:51,  1.39it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36300/203307 [7:13:51<33:16:05,  1.39it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36300/203307 [7:13:51<33:16:05,  1.39it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36301/203307 [7:13:55<33:16:18,  1.39it/s, v_num=line, training/loss=0.0857]Epoch 0:  18%|█▊        | 36301/203307 [7:13:55<33:16:18,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36302/203307 [7:13:59<33:16:32,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36302/203307 [7:13:59<33:16:32,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36303/203307 [7:14:03<33:16:48,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36303/203307 [7:14:03<33:16:48,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36304/203307 [7:14:08<33:17:06,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36304/203307 [7:14:08<33:17:06,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36305/203307 [7:14:12<33:17:19,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36305/203307 [7:14:12<33:17:19,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36306/203307 [7:14:16<33:17:34,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36306/203307 [7:14:16<33:17:34,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36307/203307 [7:14:20<33:17:50,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36307/203307 [7:14:20<33:17:50,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36308/203307 [7:14:24<33:18:04,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36308/203307 [7:14:24<33:18:04,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36309/203307 [7:14:28<33:18:17,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36309/203307 [7:14:28<33:18:17,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36310/203307 [7:14:32<33:18:31,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36310/203307 [7:14:32<33:18:32,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36311/203307 [7:14:36<33:18:48,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36311/203307 [7:14:36<33:18:48,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36312/203307 [7:14:40<33:19:01,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36312/203307 [7:14:40<33:19:01,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36313/203307 [7:14:45<33:19:18,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36313/203307 [7:14:45<33:19:18,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36314/203307 [7:14:49<33:19:33,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36314/203307 [7:14:49<33:19:33,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36315/203307 [7:14:53<33:19:49,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36315/203307 [7:14:53<33:19:49,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36316/203307 [7:14:57<33:20:03,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36316/203307 [7:14:57<33:20:03,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36317/203307 [7:15:01<33:20:16,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36317/203307 [7:15:01<33:20:16,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36318/203307 [7:15:05<33:20:31,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36318/203307 [7:15:05<33:20:31,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36319/203307 [7:15:09<33:20:44,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36319/203307 [7:15:09<33:20:45,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36320/203307 [7:15:12<33:20:58,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36320/203307 [7:15:12<33:20:58,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36321/203307 [7:15:17<33:21:15,  1.39it/s, v_num=line, training/loss=0.0816]Epoch 0:  18%|█▊        | 36321/203307 [7:15:17<33:21:15,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36322/203307 [7:15:21<33:21:30,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36322/203307 [7:15:21<33:21:30,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36323/203307 [7:15:25<33:21:43,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36323/203307 [7:15:25<33:21:43,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36324/203307 [7:15:30<33:22:01,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36324/203307 [7:15:30<33:22:01,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36325/203307 [7:15:33<33:22:14,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36325/203307 [7:15:33<33:22:14,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36326/203307 [7:15:37<33:22:28,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36326/203307 [7:15:37<33:22:28,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36327/203307 [7:15:41<33:22:42,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36327/203307 [7:15:41<33:22:42,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36328/203307 [7:15:45<33:22:55,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36328/203307 [7:15:45<33:22:55,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36329/203307 [7:15:49<33:23:11,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36329/203307 [7:15:49<33:23:11,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36330/203307 [7:15:54<33:23:29,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36330/203307 [7:15:54<33:23:29,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36331/203307 [7:15:58<33:23:42,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36331/203307 [7:15:58<33:23:42,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36332/203307 [7:16:02<33:23:56,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36332/203307 [7:16:02<33:23:56,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36333/203307 [7:16:06<33:24:13,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36333/203307 [7:16:06<33:24:13,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36334/203307 [7:16:10<33:24:27,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36334/203307 [7:16:10<33:24:27,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36335/203307 [7:16:14<33:24:40,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36335/203307 [7:16:14<33:24:40,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36336/203307 [7:16:18<33:24:54,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36336/203307 [7:16:18<33:24:54,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36337/203307 [7:16:22<33:25:07,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36337/203307 [7:16:22<33:25:07,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36338/203307 [7:16:26<33:25:24,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36338/203307 [7:16:26<33:25:24,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36339/203307 [7:16:31<33:25:41,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36339/203307 [7:16:31<33:25:41,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36340/203307 [7:16:34<33:25:54,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36340/203307 [7:16:34<33:25:54,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36341/203307 [7:16:39<33:26:11,  1.39it/s, v_num=line, training/loss=0.0852]Epoch 0:  18%|█▊        | 36341/203307 [7:16:39<33:26:11,  1.39it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36342/203307 [7:16:43<33:26:25,  1.39it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36342/203307 [7:16:43<33:26:25,  1.39it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36343/203307 [7:16:47<33:26:39,  1.39it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36343/203307 [7:16:47<33:26:39,  1.39it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36344/203307 [7:16:51<33:26:52,  1.39it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36344/203307 [7:16:51<33:26:52,  1.39it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36345/203307 [7:16:54<33:27:06,  1.39it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36345/203307 [7:16:55<33:27:06,  1.39it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36346/203307 [7:16:59<33:27:23,  1.39it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36346/203307 [7:16:59<33:27:23,  1.39it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36347/203307 [7:17:04<33:27:40,  1.39it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36347/203307 [7:17:04<33:27:40,  1.39it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36348/203307 [7:17:08<33:27:55,  1.39it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36348/203307 [7:17:08<33:27:55,  1.39it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36349/203307 [7:17:12<33:28:09,  1.39it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36349/203307 [7:17:12<33:28:09,  1.39it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36350/203307 [7:17:16<33:28:26,  1.39it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36350/203307 [7:17:16<33:28:26,  1.39it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36351/203307 [7:17:20<33:28:39,  1.39it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36351/203307 [7:17:20<33:28:39,  1.39it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36352/203307 [7:17:24<33:28:52,  1.39it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36352/203307 [7:17:24<33:28:53,  1.39it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36353/203307 [7:17:28<33:29:06,  1.38it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36353/203307 [7:17:28<33:29:06,  1.38it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36354/203307 [7:17:32<33:29:23,  1.38it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36354/203307 [7:17:32<33:29:23,  1.38it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36355/203307 [7:17:36<33:29:37,  1.38it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36355/203307 [7:17:36<33:29:37,  1.38it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36356/203307 [7:17:41<33:29:53,  1.38it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36356/203307 [7:17:41<33:29:53,  1.38it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36357/203307 [7:17:45<33:30:09,  1.38it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36357/203307 [7:17:45<33:30:09,  1.38it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36358/203307 [7:17:49<33:30:23,  1.38it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36358/203307 [7:17:49<33:30:23,  1.38it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36359/203307 [7:17:53<33:30:39,  1.38it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36359/203307 [7:17:53<33:30:39,  1.38it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36360/203307 [7:17:57<33:30:53,  1.38it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36360/203307 [7:17:57<33:30:53,  1.38it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36361/203307 [7:18:01<33:31:06,  1.38it/s, v_num=line, training/loss=0.0785]Epoch 0:  18%|█▊        | 36361/203307 [7:18:01<33:31:06,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36362/203307 [7:18:05<33:31:21,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36362/203307 [7:18:05<33:31:21,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36363/203307 [7:18:09<33:31:38,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36363/203307 [7:18:09<33:31:38,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36364/203307 [7:18:13<33:31:51,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36364/203307 [7:18:13<33:31:51,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36365/203307 [7:18:18<33:32:08,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36365/203307 [7:18:18<33:32:08,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36366/203307 [7:18:22<33:32:23,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36366/203307 [7:18:22<33:32:23,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36367/203307 [7:18:26<33:32:39,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36367/203307 [7:18:26<33:32:39,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36368/203307 [7:18:30<33:32:53,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36368/203307 [7:18:30<33:32:53,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36369/203307 [7:18:34<33:33:06,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36369/203307 [7:18:34<33:33:06,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36370/203307 [7:18:38<33:33:21,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36370/203307 [7:18:38<33:33:21,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36371/203307 [7:18:43<33:33:37,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36371/203307 [7:18:43<33:33:37,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36372/203307 [7:18:46<33:33:51,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36372/203307 [7:18:46<33:33:51,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36373/203307 [7:18:51<33:34:08,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36373/203307 [7:18:51<33:34:08,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36374/203307 [7:18:55<33:34:22,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36374/203307 [7:18:55<33:34:22,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36375/203307 [7:18:59<33:34:38,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36375/203307 [7:18:59<33:34:38,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36376/203307 [7:19:04<33:34:54,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36376/203307 [7:19:04<33:34:54,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36377/203307 [7:19:07<33:35:07,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36377/203307 [7:19:07<33:35:07,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36378/203307 [7:19:11<33:35:22,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36378/203307 [7:19:11<33:35:22,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36379/203307 [7:19:16<33:35:38,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36379/203307 [7:19:16<33:35:38,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36380/203307 [7:19:20<33:35:52,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36380/203307 [7:19:20<33:35:52,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36381/203307 [7:19:24<33:36:05,  1.38it/s, v_num=line, training/loss=0.0894]Epoch 0:  18%|█▊        | 36381/203307 [7:19:24<33:36:05,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36382/203307 [7:19:28<33:36:23,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36382/203307 [7:19:28<33:36:23,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36383/203307 [7:19:32<33:36:36,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36383/203307 [7:19:32<33:36:36,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36384/203307 [7:19:37<33:36:52,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36384/203307 [7:19:37<33:36:52,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36385/203307 [7:19:41<33:37:08,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36385/203307 [7:19:41<33:37:08,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36386/203307 [7:19:45<33:37:23,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36386/203307 [7:19:45<33:37:23,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36387/203307 [7:19:49<33:37:36,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36387/203307 [7:19:49<33:37:36,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36388/203307 [7:19:53<33:37:53,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36388/203307 [7:19:53<33:37:53,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36389/203307 [7:19:57<33:38:06,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36389/203307 [7:19:57<33:38:06,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36390/203307 [7:20:01<33:38:20,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36390/203307 [7:20:01<33:38:20,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36391/203307 [7:20:06<33:38:37,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36391/203307 [7:20:06<33:38:37,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36392/203307 [7:20:10<33:38:53,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36392/203307 [7:20:10<33:38:53,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36393/203307 [7:20:14<33:39:09,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36393/203307 [7:20:14<33:39:09,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36394/203307 [7:20:18<33:39:24,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36394/203307 [7:20:18<33:39:24,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36395/203307 [7:20:22<33:39:37,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36395/203307 [7:20:22<33:39:37,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36396/203307 [7:20:27<33:39:53,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36396/203307 [7:20:27<33:39:53,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36397/203307 [7:20:30<33:40:07,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36397/203307 [7:20:30<33:40:07,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36398/203307 [7:20:34<33:40:21,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36398/203307 [7:20:34<33:40:21,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36399/203307 [7:20:39<33:40:37,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36399/203307 [7:20:39<33:40:37,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36400/203307 [7:20:43<33:40:51,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36400/203307 [7:20:43<33:40:51,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36401/203307 [7:20:47<33:41:05,  1.38it/s, v_num=line, training/loss=0.0882]Epoch 0:  18%|█▊        | 36401/203307 [7:20:47<33:41:05,  1.38it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36402/203307 [7:20:51<33:41:22,  1.38it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36402/203307 [7:20:51<33:41:22,  1.38it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36403/203307 [7:20:55<33:41:35,  1.38it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36403/203307 [7:20:55<33:41:35,  1.38it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36404/203307 [7:20:59<33:41:51,  1.38it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36404/203307 [7:20:59<33:41:51,  1.38it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36405/203307 [7:21:03<33:42:05,  1.38it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36405/203307 [7:21:03<33:42:05,  1.38it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36406/203307 [7:21:07<33:42:19,  1.38it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36406/203307 [7:21:07<33:42:19,  1.38it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36407/203307 [7:21:11<33:42:32,  1.38it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36407/203307 [7:21:11<33:42:32,  1.38it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36408/203307 [7:21:16<33:42:49,  1.38it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36408/203307 [7:21:16<33:42:49,  1.38it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36409/203307 [7:21:19<33:43:03,  1.37it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36409/203307 [7:21:19<33:43:03,  1.37it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36410/203307 [7:21:23<33:43:17,  1.37it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36410/203307 [7:21:23<33:43:17,  1.37it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36411/203307 [7:21:28<33:43:33,  1.37it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36411/203307 [7:21:28<33:43:33,  1.37it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36412/203307 [7:21:32<33:43:47,  1.37it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36412/203307 [7:21:32<33:43:47,  1.37it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36413/203307 [7:21:36<33:44:03,  1.37it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36413/203307 [7:21:36<33:44:03,  1.37it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36414/203307 [7:21:40<33:44:17,  1.37it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36414/203307 [7:21:40<33:44:17,  1.37it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36415/203307 [7:21:44<33:44:30,  1.37it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36415/203307 [7:21:44<33:44:30,  1.37it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36416/203307 [7:21:48<33:44:43,  1.37it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36416/203307 [7:21:48<33:44:43,  1.37it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36417/203307 [7:21:52<33:45:00,  1.37it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36417/203307 [7:21:52<33:45:00,  1.37it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36418/203307 [7:21:56<33:45:14,  1.37it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36418/203307 [7:21:56<33:45:14,  1.37it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36419/203307 [7:22:00<33:45:30,  1.37it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36419/203307 [7:22:00<33:45:30,  1.37it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36420/203307 [7:22:04<33:45:44,  1.37it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36420/203307 [7:22:04<33:45:44,  1.37it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36421/203307 [7:22:09<33:46:00,  1.37it/s, v_num=line, training/loss=0.0755]Epoch 0:  18%|█▊        | 36421/203307 [7:22:09<33:46:00,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36422/203307 [7:22:13<33:46:14,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36422/203307 [7:22:13<33:46:14,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36423/203307 [7:22:16<33:46:27,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36423/203307 [7:22:16<33:46:27,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36424/203307 [7:22:20<33:46:41,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36424/203307 [7:22:20<33:46:41,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36425/203307 [7:22:25<33:46:58,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36425/203307 [7:22:25<33:46:58,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36426/203307 [7:22:29<33:47:12,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36426/203307 [7:22:29<33:47:12,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36427/203307 [7:22:33<33:47:25,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36427/203307 [7:22:33<33:47:25,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36428/203307 [7:22:37<33:47:41,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36428/203307 [7:22:37<33:47:41,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36429/203307 [7:22:41<33:47:57,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36429/203307 [7:22:41<33:47:57,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36430/203307 [7:22:45<33:48:11,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36430/203307 [7:22:45<33:48:11,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36431/203307 [7:22:49<33:48:25,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36431/203307 [7:22:49<33:48:25,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36432/203307 [7:22:53<33:48:38,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36432/203307 [7:22:53<33:48:38,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36433/203307 [7:22:57<33:48:52,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36433/203307 [7:22:57<33:48:52,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36434/203307 [7:23:02<33:49:10,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36434/203307 [7:23:02<33:49:10,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36435/203307 [7:23:05<33:49:23,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36435/203307 [7:23:05<33:49:23,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36436/203307 [7:23:09<33:49:36,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36436/203307 [7:23:09<33:49:36,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36437/203307 [7:23:14<33:49:53,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36437/203307 [7:23:14<33:49:53,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36438/203307 [7:23:18<33:50:10,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36438/203307 [7:23:18<33:50:10,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36439/203307 [7:23:22<33:50:23,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36439/203307 [7:23:22<33:50:23,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36440/203307 [7:23:26<33:50:37,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36440/203307 [7:23:26<33:50:37,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36441/203307 [7:23:30<33:50:50,  1.37it/s, v_num=line, training/loss=0.0921]Epoch 0:  18%|█▊        | 36441/203307 [7:23:30<33:50:50,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36442/203307 [7:23:34<33:51:04,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36442/203307 [7:23:34<33:51:05,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36443/203307 [7:23:39<33:51:22,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36443/203307 [7:23:39<33:51:22,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36444/203307 [7:23:42<33:51:35,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36444/203307 [7:23:42<33:51:35,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36445/203307 [7:23:47<33:51:50,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36445/203307 [7:23:47<33:51:50,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36446/203307 [7:23:51<33:52:08,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36446/203307 [7:23:51<33:52:08,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36447/203307 [7:23:55<33:52:21,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36447/203307 [7:23:55<33:52:21,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36448/203307 [7:23:59<33:52:34,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36448/203307 [7:23:59<33:52:34,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36449/203307 [7:24:03<33:52:48,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36449/203307 [7:24:03<33:52:48,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36450/203307 [7:24:07<33:53:02,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36450/203307 [7:24:07<33:53:02,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36451/203307 [7:24:11<33:53:19,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36451/203307 [7:24:11<33:53:19,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36452/203307 [7:24:15<33:53:32,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36452/203307 [7:24:15<33:53:32,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36453/203307 [7:24:19<33:53:45,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36453/203307 [7:24:19<33:53:45,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36454/203307 [7:24:23<33:54:03,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36454/203307 [7:24:23<33:54:03,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36455/203307 [7:24:27<33:54:16,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36455/203307 [7:24:27<33:54:16,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36456/203307 [7:24:32<33:54:32,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36456/203307 [7:24:32<33:54:32,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36457/203307 [7:24:35<33:54:45,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36457/203307 [7:24:35<33:54:45,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36458/203307 [7:24:39<33:55:00,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36458/203307 [7:24:39<33:55:00,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36459/203307 [7:24:43<33:55:13,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36459/203307 [7:24:43<33:55:13,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36460/203307 [7:24:48<33:55:30,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36460/203307 [7:24:48<33:55:30,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36461/203307 [7:24:52<33:55:43,  1.37it/s, v_num=line, training/loss=0.0886]Epoch 0:  18%|█▊        | 36461/203307 [7:24:52<33:55:43,  1.37it/s, v_num=line, training/loss=0.081] Epoch 0:  18%|█▊        | 36462/203307 [7:24:56<33:55:57,  1.37it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36462/203307 [7:24:56<33:55:57,  1.37it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36463/203307 [7:25:00<33:56:14,  1.37it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36463/203307 [7:25:00<33:56:14,  1.37it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36464/203307 [7:25:04<33:56:27,  1.37it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36464/203307 [7:25:04<33:56:27,  1.37it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36465/203307 [7:25:08<33:56:43,  1.37it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36465/203307 [7:25:08<33:56:43,  1.37it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36466/203307 [7:25:12<33:56:58,  1.37it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36466/203307 [7:25:12<33:56:58,  1.37it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36467/203307 [7:25:16<33:57:10,  1.36it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36467/203307 [7:25:16<33:57:10,  1.36it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36468/203307 [7:25:20<33:57:23,  1.36it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36468/203307 [7:25:20<33:57:24,  1.36it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36469/203307 [7:25:24<33:57:40,  1.36it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36469/203307 [7:25:24<33:57:40,  1.36it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36470/203307 [7:25:28<33:57:55,  1.36it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36470/203307 [7:25:28<33:57:55,  1.36it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36471/203307 [7:25:33<33:58:11,  1.36it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36471/203307 [7:25:33<33:58:11,  1.36it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36472/203307 [7:25:37<33:58:25,  1.36it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36472/203307 [7:25:37<33:58:25,  1.36it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36473/203307 [7:25:41<33:58:40,  1.36it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36473/203307 [7:25:41<33:58:40,  1.36it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36474/203307 [7:25:45<33:58:55,  1.36it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36474/203307 [7:25:45<33:58:55,  1.36it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36475/203307 [7:25:49<33:59:08,  1.36it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36475/203307 [7:25:49<33:59:08,  1.36it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36476/203307 [7:25:53<33:59:21,  1.36it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36476/203307 [7:25:53<33:59:21,  1.36it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36477/203307 [7:25:57<33:59:38,  1.36it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36477/203307 [7:25:57<33:59:39,  1.36it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36478/203307 [7:26:01<33:59:53,  1.36it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36478/203307 [7:26:01<33:59:53,  1.36it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36479/203307 [7:26:06<34:00:09,  1.36it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36479/203307 [7:26:06<34:00:09,  1.36it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36480/203307 [7:26:10<34:00:25,  1.36it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36480/203307 [7:26:10<34:00:25,  1.36it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36481/203307 [7:26:14<34:00:39,  1.36it/s, v_num=line, training/loss=0.081]Epoch 0:  18%|█▊        | 36481/203307 [7:26:14<34:00:39,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36482/203307 [7:26:18<34:00:53,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36482/203307 [7:26:18<34:00:53,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36483/203307 [7:26:23<34:01:09,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36483/203307 [7:26:23<34:01:09,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36484/203307 [7:26:26<34:01:22,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36484/203307 [7:26:26<34:01:22,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36485/203307 [7:26:30<34:01:35,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36485/203307 [7:26:30<34:01:35,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36486/203307 [7:26:35<34:01:53,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36486/203307 [7:26:35<34:01:53,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36487/203307 [7:26:39<34:02:06,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36487/203307 [7:26:39<34:02:06,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36488/203307 [7:26:43<34:02:22,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36488/203307 [7:26:43<34:02:22,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36489/203307 [7:26:47<34:02:38,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36489/203307 [7:26:47<34:02:38,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36490/203307 [7:26:51<34:02:53,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36490/203307 [7:26:51<34:02:53,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36491/203307 [7:26:55<34:03:06,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36491/203307 [7:26:55<34:03:06,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36492/203307 [7:27:00<34:03:22,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36492/203307 [7:27:00<34:03:22,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36493/203307 [7:27:04<34:03:35,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36493/203307 [7:27:04<34:03:35,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36494/203307 [7:27:08<34:03:50,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36494/203307 [7:27:08<34:03:50,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36495/203307 [7:27:12<34:04:06,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36495/203307 [7:27:12<34:04:06,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36496/203307 [7:27:16<34:04:22,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36496/203307 [7:27:16<34:04:22,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36497/203307 [7:27:21<34:04:39,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36497/203307 [7:27:21<34:04:39,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36498/203307 [7:27:25<34:04:53,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36498/203307 [7:27:25<34:04:53,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36499/203307 [7:27:29<34:05:07,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36499/203307 [7:27:29<34:05:07,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36500/203307 [7:27:33<34:05:23,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36500/203307 [7:27:33<34:05:23,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36501/203307 [7:27:37<34:05:36,  1.36it/s, v_num=line, training/loss=0.0827]Epoch 0:  18%|█▊        | 36501/203307 [7:27:37<34:05:36,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36502/203307 [7:27:41<34:05:50,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36502/203307 [7:27:41<34:05:50,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36503/203307 [7:27:45<34:06:06,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36503/203307 [7:27:45<34:06:06,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36504/203307 [7:27:50<34:06:22,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36504/203307 [7:27:50<34:06:22,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36505/203307 [7:27:54<34:06:36,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36505/203307 [7:27:54<34:06:36,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36506/203307 [7:27:58<34:06:53,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36506/203307 [7:27:58<34:06:53,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36507/203307 [7:28:02<34:07:06,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36507/203307 [7:28:02<34:07:06,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36508/203307 [7:28:06<34:07:19,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36508/203307 [7:28:06<34:07:19,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36509/203307 [7:28:10<34:07:32,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36509/203307 [7:28:10<34:07:32,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36510/203307 [7:28:14<34:07:48,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36510/203307 [7:28:14<34:07:48,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36511/203307 [7:28:18<34:08:01,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36511/203307 [7:28:18<34:08:01,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36512/203307 [7:28:22<34:08:18,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36512/203307 [7:28:22<34:08:18,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36513/203307 [7:28:27<34:08:34,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36513/203307 [7:28:27<34:08:34,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36514/203307 [7:28:31<34:08:48,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36514/203307 [7:28:31<34:08:48,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36515/203307 [7:28:35<34:09:04,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36515/203307 [7:28:35<34:09:04,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36516/203307 [7:28:39<34:09:17,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36516/203307 [7:28:39<34:09:17,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36517/203307 [7:28:43<34:09:29,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36517/203307 [7:28:43<34:09:29,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36518/203307 [7:28:47<34:09:44,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36518/203307 [7:28:47<34:09:44,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36519/203307 [7:28:51<34:09:59,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36519/203307 [7:28:51<34:09:59,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36520/203307 [7:28:55<34:10:12,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36520/203307 [7:28:55<34:10:12,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36521/203307 [7:28:59<34:10:28,  1.36it/s, v_num=line, training/loss=0.0909]Epoch 0:  18%|█▊        | 36521/203307 [7:28:59<34:10:29,  1.36it/s, v_num=line, training/loss=0.088] Epoch 0:  18%|█▊        | 36522/203307 [7:29:03<34:10:43,  1.36it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36522/203307 [7:29:03<34:10:43,  1.36it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36523/203307 [7:29:07<34:10:58,  1.36it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36523/203307 [7:29:07<34:10:58,  1.36it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36524/203307 [7:29:11<34:11:11,  1.36it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36524/203307 [7:29:11<34:11:11,  1.36it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36525/203307 [7:29:15<34:11:24,  1.36it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36525/203307 [7:29:15<34:11:24,  1.36it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36526/203307 [7:29:19<34:11:38,  1.35it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36526/203307 [7:29:19<34:11:38,  1.35it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36527/203307 [7:29:23<34:11:53,  1.35it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36527/203307 [7:29:23<34:11:53,  1.35it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36528/203307 [7:29:27<34:12:06,  1.35it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36528/203307 [7:29:27<34:12:06,  1.35it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36529/203307 [7:29:31<34:12:22,  1.35it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36529/203307 [7:29:31<34:12:22,  1.35it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36530/203307 [7:29:35<34:12:36,  1.35it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36530/203307 [7:29:35<34:12:36,  1.35it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36531/203307 [7:29:39<34:12:50,  1.35it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36531/203307 [7:29:39<34:12:50,  1.35it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36532/203307 [7:29:43<34:13:05,  1.35it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36532/203307 [7:29:43<34:13:06,  1.35it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36533/203307 [7:29:47<34:13:18,  1.35it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36533/203307 [7:29:47<34:13:18,  1.35it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36534/203307 [7:29:51<34:13:32,  1.35it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36534/203307 [7:29:51<34:13:32,  1.35it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36535/203307 [7:29:55<34:13:45,  1.35it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36535/203307 [7:29:55<34:13:45,  1.35it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36536/203307 [7:29:58<34:13:57,  1.35it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36536/203307 [7:29:58<34:13:57,  1.35it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36537/203307 [7:30:03<34:14:13,  1.35it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36537/203307 [7:30:03<34:14:13,  1.35it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36538/203307 [7:30:07<34:14:30,  1.35it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36538/203307 [7:30:07<34:14:30,  1.35it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36539/203307 [7:30:11<34:14:42,  1.35it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36539/203307 [7:30:11<34:14:42,  1.35it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36540/203307 [7:30:15<34:14:55,  1.35it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36540/203307 [7:30:15<34:14:55,  1.35it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36541/203307 [7:30:19<34:15:11,  1.35it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36541/203307 [7:30:19<34:15:11,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36542/203307 [7:30:23<34:15:25,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36542/203307 [7:30:23<34:15:25,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36543/203307 [7:30:27<34:15:38,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36543/203307 [7:30:27<34:15:38,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36544/203307 [7:30:30<34:15:51,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36544/203307 [7:30:30<34:15:51,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36545/203307 [7:30:34<34:16:03,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36545/203307 [7:30:34<34:16:03,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36546/203307 [7:30:38<34:16:20,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36546/203307 [7:30:39<34:16:20,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36547/203307 [7:30:43<34:16:36,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36547/203307 [7:30:43<34:16:36,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36548/203307 [7:30:47<34:16:49,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36548/203307 [7:30:47<34:16:49,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36549/203307 [7:30:51<34:17:05,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36549/203307 [7:30:51<34:17:05,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36550/203307 [7:30:55<34:17:18,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36550/203307 [7:30:55<34:17:18,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36551/203307 [7:30:59<34:17:31,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36551/203307 [7:30:59<34:17:31,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36552/203307 [7:31:03<34:17:44,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36552/203307 [7:31:03<34:17:45,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36553/203307 [7:31:06<34:17:58,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36553/203307 [7:31:06<34:17:58,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36554/203307 [7:31:11<34:18:14,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36554/203307 [7:31:11<34:18:14,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36555/203307 [7:31:15<34:18:30,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36555/203307 [7:31:15<34:18:30,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36556/203307 [7:31:19<34:18:43,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36556/203307 [7:31:19<34:18:43,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36557/203307 [7:31:23<34:18:56,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36557/203307 [7:31:23<34:18:56,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36558/203307 [7:31:27<34:19:12,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36558/203307 [7:31:27<34:19:12,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36559/203307 [7:31:31<34:19:25,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36559/203307 [7:31:31<34:19:25,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36560/203307 [7:31:35<34:19:39,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36560/203307 [7:31:35<34:19:39,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36561/203307 [7:31:39<34:19:52,  1.35it/s, v_num=line, training/loss=0.0907]Epoch 0:  18%|█▊        | 36561/203307 [7:31:39<34:19:52,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36562/203307 [7:31:42<34:20:05,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36562/203307 [7:31:42<34:20:05,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36563/203307 [7:31:47<34:20:21,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36563/203307 [7:31:47<34:20:21,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36564/203307 [7:31:51<34:20:37,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36564/203307 [7:31:51<34:20:37,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36565/203307 [7:31:55<34:20:49,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36565/203307 [7:31:55<34:20:50,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36566/203307 [7:31:59<34:21:03,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36566/203307 [7:31:59<34:21:03,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36567/203307 [7:32:03<34:21:19,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36567/203307 [7:32:03<34:21:19,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36568/203307 [7:32:07<34:21:32,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36568/203307 [7:32:07<34:21:32,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36569/203307 [7:32:11<34:21:45,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36569/203307 [7:32:11<34:21:45,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36570/203307 [7:32:14<34:21:58,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36570/203307 [7:32:14<34:21:58,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36571/203307 [7:32:19<34:22:14,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36571/203307 [7:32:19<34:22:14,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36572/203307 [7:32:23<34:22:28,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36572/203307 [7:32:23<34:22:28,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36573/203307 [7:32:27<34:22:44,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36573/203307 [7:32:27<34:22:44,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36574/203307 [7:32:31<34:22:57,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36574/203307 [7:32:31<34:22:57,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36575/203307 [7:32:35<34:23:13,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36575/203307 [7:32:35<34:23:13,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36576/203307 [7:32:39<34:23:26,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36576/203307 [7:32:39<34:23:26,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36577/203307 [7:32:43<34:23:39,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36577/203307 [7:32:43<34:23:39,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36578/203307 [7:32:47<34:23:52,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36578/203307 [7:32:47<34:23:52,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36579/203307 [7:32:51<34:24:08,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36579/203307 [7:32:51<34:24:08,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36580/203307 [7:32:55<34:24:21,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36580/203307 [7:32:55<34:24:21,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36581/203307 [7:32:59<34:24:38,  1.35it/s, v_num=line, training/loss=0.0877]Epoch 0:  18%|█▊        | 36581/203307 [7:32:59<34:24:38,  1.35it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36582/203307 [7:33:03<34:24:51,  1.35it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36582/203307 [7:33:03<34:24:51,  1.35it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36583/203307 [7:33:07<34:25:04,  1.35it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36583/203307 [7:33:07<34:25:04,  1.35it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36584/203307 [7:33:11<34:25:20,  1.35it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36584/203307 [7:33:11<34:25:20,  1.35it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36585/203307 [7:33:15<34:25:33,  1.35it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36585/203307 [7:33:15<34:25:33,  1.35it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36586/203307 [7:33:19<34:25:46,  1.35it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36586/203307 [7:33:19<34:25:46,  1.35it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36587/203307 [7:33:23<34:25:59,  1.34it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36587/203307 [7:33:23<34:26:00,  1.34it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36588/203307 [7:33:27<34:26:16,  1.34it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36588/203307 [7:33:27<34:26:16,  1.34it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36589/203307 [7:33:31<34:26:29,  1.34it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36589/203307 [7:33:31<34:26:29,  1.34it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36590/203307 [7:33:36<34:26:45,  1.34it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36590/203307 [7:33:36<34:26:45,  1.34it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36591/203307 [7:33:40<34:27:01,  1.34it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36591/203307 [7:33:40<34:27:01,  1.34it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36592/203307 [7:33:44<34:27:14,  1.34it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36592/203307 [7:33:44<34:27:15,  1.34it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36593/203307 [7:33:48<34:27:31,  1.34it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36593/203307 [7:33:48<34:27:31,  1.34it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36594/203307 [7:33:52<34:27:44,  1.34it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36594/203307 [7:33:52<34:27:44,  1.34it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36595/203307 [7:33:56<34:27:57,  1.34it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36595/203307 [7:33:56<34:27:57,  1.34it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36596/203307 [7:34:00<34:28:14,  1.34it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36596/203307 [7:34:00<34:28:14,  1.34it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36597/203307 [7:34:04<34:28:27,  1.34it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36597/203307 [7:34:04<34:28:27,  1.34it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36598/203307 [7:34:08<34:28:40,  1.34it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36598/203307 [7:34:08<34:28:40,  1.34it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36599/203307 [7:34:13<34:28:57,  1.34it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36599/203307 [7:34:13<34:28:57,  1.34it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36600/203307 [7:34:17<34:29:12,  1.34it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36600/203307 [7:34:17<34:29:12,  1.34it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36601/203307 [7:34:21<34:29:28,  1.34it/s, v_num=line, training/loss=0.0749]Epoch 0:  18%|█▊        | 36601/203307 [7:34:21<34:29:28,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36602/203307 [7:34:25<34:29:42,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36602/203307 [7:34:25<34:29:42,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36603/203307 [7:34:29<34:29:55,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36603/203307 [7:34:29<34:29:55,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36604/203307 [7:34:33<34:30:11,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36604/203307 [7:34:33<34:30:11,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36605/203307 [7:34:37<34:30:24,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36605/203307 [7:34:37<34:30:24,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36606/203307 [7:34:41<34:30:37,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36606/203307 [7:34:41<34:30:37,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36607/203307 [7:34:45<34:30:53,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36607/203307 [7:34:45<34:30:53,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36608/203307 [7:34:50<34:31:09,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36608/203307 [7:34:50<34:31:09,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36609/203307 [7:34:53<34:31:22,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36609/203307 [7:34:53<34:31:22,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36610/203307 [7:34:58<34:31:38,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36610/203307 [7:34:58<34:31:38,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36611/203307 [7:35:02<34:31:51,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36611/203307 [7:35:02<34:31:51,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36612/203307 [7:35:05<34:32:04,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36612/203307 [7:35:05<34:32:04,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36613/203307 [7:35:10<34:32:20,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36613/203307 [7:35:10<34:32:20,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36614/203307 [7:35:14<34:32:33,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36614/203307 [7:35:14<34:32:33,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36615/203307 [7:35:17<34:32:46,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36615/203307 [7:35:17<34:32:46,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36616/203307 [7:35:22<34:33:02,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36616/203307 [7:35:22<34:33:03,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36617/203307 [7:35:26<34:33:15,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36617/203307 [7:35:26<34:33:16,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36618/203307 [7:35:30<34:33:32,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36618/203307 [7:35:30<34:33:32,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36619/203307 [7:35:35<34:33:48,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36619/203307 [7:35:35<34:33:48,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36620/203307 [7:35:38<34:34:01,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36620/203307 [7:35:38<34:34:01,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36621/203307 [7:35:43<34:34:17,  1.34it/s, v_num=line, training/loss=0.0793]Epoch 0:  18%|█▊        | 36621/203307 [7:35:43<34:34:17,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36622/203307 [7:35:47<34:34:30,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36622/203307 [7:35:47<34:34:30,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36623/203307 [7:35:51<34:34:44,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36623/203307 [7:35:51<34:34:44,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36624/203307 [7:35:54<34:34:57,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36624/203307 [7:35:54<34:34:57,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36625/203307 [7:35:59<34:35:14,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36625/203307 [7:35:59<34:35:14,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36626/203307 [7:36:03<34:35:27,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36626/203307 [7:36:03<34:35:27,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36627/203307 [7:36:07<34:35:43,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36627/203307 [7:36:07<34:35:43,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36628/203307 [7:36:11<34:35:56,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36628/203307 [7:36:11<34:35:56,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36629/203307 [7:36:15<34:36:12,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36629/203307 [7:36:15<34:36:12,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36630/203307 [7:36:19<34:36:25,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36630/203307 [7:36:19<34:36:25,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36631/203307 [7:36:23<34:36:38,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36631/203307 [7:36:23<34:36:38,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36632/203307 [7:36:27<34:36:51,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36632/203307 [7:36:27<34:36:51,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36633/203307 [7:36:31<34:37:08,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36633/203307 [7:36:31<34:37:08,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36634/203307 [7:36:35<34:37:21,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36634/203307 [7:36:35<34:37:21,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36635/203307 [7:36:40<34:37:37,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36635/203307 [7:36:40<34:37:37,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36636/203307 [7:36:44<34:37:53,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36636/203307 [7:36:44<34:37:53,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36637/203307 [7:36:48<34:38:06,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36637/203307 [7:36:48<34:38:06,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36638/203307 [7:36:52<34:38:22,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36638/203307 [7:36:52<34:38:22,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36639/203307 [7:36:56<34:38:36,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36639/203307 [7:36:56<34:38:36,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36640/203307 [7:37:00<34:38:49,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36640/203307 [7:37:00<34:38:49,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36641/203307 [7:37:04<34:39:02,  1.34it/s, v_num=line, training/loss=0.0751]Epoch 0:  18%|█▊        | 36641/203307 [7:37:04<34:39:02,  1.34it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36642/203307 [7:37:08<34:39:19,  1.34it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36642/203307 [7:37:08<34:39:19,  1.34it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36643/203307 [7:37:12<34:39:32,  1.34it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36643/203307 [7:37:12<34:39:32,  1.34it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36644/203307 [7:37:16<34:39:45,  1.34it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36644/203307 [7:37:16<34:39:45,  1.34it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36645/203307 [7:37:20<34:40:01,  1.34it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36645/203307 [7:37:20<34:40:01,  1.34it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36646/203307 [7:37:25<34:40:17,  1.34it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36646/203307 [7:37:25<34:40:17,  1.34it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36647/203307 [7:37:29<34:40:31,  1.34it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36647/203307 [7:37:29<34:40:31,  1.34it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36648/203307 [7:37:33<34:40:44,  1.33it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36648/203307 [7:37:33<34:40:44,  1.33it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36649/203307 [7:37:36<34:40:57,  1.33it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36649/203307 [7:37:36<34:40:57,  1.33it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36650/203307 [7:37:40<34:41:10,  1.33it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36650/203307 [7:37:40<34:41:10,  1.33it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36651/203307 [7:37:45<34:41:27,  1.33it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36651/203307 [7:37:45<34:41:27,  1.33it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36652/203307 [7:37:49<34:41:40,  1.33it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36652/203307 [7:37:49<34:41:40,  1.33it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36653/203307 [7:37:53<34:41:57,  1.33it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36653/203307 [7:37:53<34:41:57,  1.33it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36654/203307 [7:37:57<34:42:12,  1.33it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36654/203307 [7:37:57<34:42:12,  1.33it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36655/203307 [7:38:01<34:42:25,  1.33it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36655/203307 [7:38:01<34:42:25,  1.33it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36656/203307 [7:38:05<34:42:38,  1.33it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36656/203307 [7:38:05<34:42:38,  1.33it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36657/203307 [7:38:09<34:42:51,  1.33it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36657/203307 [7:38:09<34:42:51,  1.33it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36658/203307 [7:38:13<34:43:04,  1.33it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36658/203307 [7:38:13<34:43:04,  1.33it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36659/203307 [7:38:17<34:43:21,  1.33it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36659/203307 [7:38:17<34:43:21,  1.33it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36660/203307 [7:38:21<34:43:34,  1.33it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36660/203307 [7:38:21<34:43:34,  1.33it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36661/203307 [7:38:25<34:43:47,  1.33it/s, v_num=line, training/loss=0.0802]Epoch 0:  18%|█▊        | 36661/203307 [7:38:25<34:43:47,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36662/203307 [7:38:29<34:44:03,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36662/203307 [7:38:29<34:44:03,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36663/203307 [7:38:33<34:44:19,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36663/203307 [7:38:34<34:44:19,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36664/203307 [7:38:37<34:44:32,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36664/203307 [7:38:37<34:44:32,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36665/203307 [7:38:41<34:44:45,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36665/203307 [7:38:41<34:44:45,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36666/203307 [7:38:45<34:44:58,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36666/203307 [7:38:45<34:44:58,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36667/203307 [7:38:49<34:45:11,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36667/203307 [7:38:49<34:45:11,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36668/203307 [7:38:53<34:45:27,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36668/203307 [7:38:53<34:45:28,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36669/203307 [7:38:57<34:45:40,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36669/203307 [7:38:57<34:45:40,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36670/203307 [7:39:01<34:45:53,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36670/203307 [7:39:01<34:45:53,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36671/203307 [7:39:05<34:46:09,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36671/203307 [7:39:05<34:46:09,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36672/203307 [7:39:09<34:46:24,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36672/203307 [7:39:09<34:46:25,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36673/203307 [7:39:13<34:46:37,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36673/203307 [7:39:13<34:46:37,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36674/203307 [7:39:17<34:46:50,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36674/203307 [7:39:17<34:46:50,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36675/203307 [7:39:21<34:47:03,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36675/203307 [7:39:21<34:47:03,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36676/203307 [7:39:24<34:47:16,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36676/203307 [7:39:24<34:47:16,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36677/203307 [7:39:29<34:47:33,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36677/203307 [7:39:29<34:47:33,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36678/203307 [7:39:33<34:47:45,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36678/203307 [7:39:33<34:47:45,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36679/203307 [7:39:37<34:48:01,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36679/203307 [7:39:37<34:48:01,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36680/203307 [7:39:41<34:48:14,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36680/203307 [7:39:41<34:48:14,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36681/203307 [7:39:45<34:48:30,  1.33it/s, v_num=line, training/loss=0.0797]Epoch 0:  18%|█▊        | 36681/203307 [7:39:45<34:48:30,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36682/203307 [7:39:49<34:48:43,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36682/203307 [7:39:49<34:48:43,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36683/203307 [7:39:53<34:48:56,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36683/203307 [7:39:53<34:48:56,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36684/203307 [7:39:57<34:49:09,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36684/203307 [7:39:57<34:49:09,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36685/203307 [7:40:01<34:49:25,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36685/203307 [7:40:01<34:49:25,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36686/203307 [7:40:05<34:49:38,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36686/203307 [7:40:05<34:49:38,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36687/203307 [7:40:09<34:49:51,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36687/203307 [7:40:09<34:49:51,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36688/203307 [7:40:13<34:50:07,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36688/203307 [7:40:13<34:50:07,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36689/203307 [7:40:17<34:50:22,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36689/203307 [7:40:17<34:50:22,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36690/203307 [7:40:21<34:50:35,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36690/203307 [7:40:21<34:50:35,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36691/203307 [7:40:25<34:50:48,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36691/203307 [7:40:25<34:50:48,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36692/203307 [7:40:29<34:51:00,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36692/203307 [7:40:29<34:51:00,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36693/203307 [7:40:32<34:51:13,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36693/203307 [7:40:32<34:51:13,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36694/203307 [7:40:37<34:51:30,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36694/203307 [7:40:37<34:51:30,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36695/203307 [7:40:41<34:51:43,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36695/203307 [7:40:41<34:51:43,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36696/203307 [7:40:45<34:51:59,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36696/203307 [7:40:45<34:51:59,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36697/203307 [7:40:50<34:52:15,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36697/203307 [7:40:50<34:52:15,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36698/203307 [7:40:53<34:52:28,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36698/203307 [7:40:53<34:52:29,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36699/203307 [7:40:58<34:52:44,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36699/203307 [7:40:58<34:52:44,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36700/203307 [7:41:02<34:52:57,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36700/203307 [7:41:02<34:52:57,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36701/203307 [7:41:05<34:53:10,  1.33it/s, v_num=line, training/loss=0.0763]Epoch 0:  18%|█▊        | 36701/203307 [7:41:05<34:53:10,  1.33it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36702/203307 [7:41:09<34:53:23,  1.33it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36702/203307 [7:41:09<34:53:23,  1.33it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36703/203307 [7:41:14<34:53:39,  1.33it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36703/203307 [7:41:14<34:53:39,  1.33it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36704/203307 [7:41:18<34:53:55,  1.33it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36704/203307 [7:41:18<34:53:55,  1.33it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36705/203307 [7:41:22<34:54:11,  1.33it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36705/203307 [7:41:22<34:54:11,  1.33it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36706/203307 [7:41:26<34:54:24,  1.33it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36706/203307 [7:41:26<34:54:24,  1.33it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36707/203307 [7:41:30<34:54:37,  1.33it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36707/203307 [7:41:30<34:54:37,  1.33it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36708/203307 [7:41:34<34:54:52,  1.33it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36708/203307 [7:41:34<34:54:53,  1.33it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36709/203307 [7:41:38<34:55:05,  1.33it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36709/203307 [7:41:38<34:55:05,  1.33it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36710/203307 [7:41:42<34:55:19,  1.33it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36710/203307 [7:41:42<34:55:19,  1.33it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36711/203307 [7:41:46<34:55:35,  1.32it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36711/203307 [7:41:46<34:55:35,  1.32it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36712/203307 [7:41:50<34:55:48,  1.32it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36712/203307 [7:41:50<34:55:48,  1.32it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36713/203307 [7:41:55<34:56:04,  1.32it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36713/203307 [7:41:55<34:56:04,  1.32it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36714/203307 [7:41:59<34:56:20,  1.32it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36714/203307 [7:41:59<34:56:20,  1.32it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36715/203307 [7:42:03<34:56:33,  1.32it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36715/203307 [7:42:03<34:56:33,  1.32it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36716/203307 [7:42:07<34:56:48,  1.32it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36716/203307 [7:42:07<34:56:48,  1.32it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36717/203307 [7:42:11<34:57:01,  1.32it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36717/203307 [7:42:11<34:57:01,  1.32it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36718/203307 [7:42:15<34:57:14,  1.32it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36718/203307 [7:42:15<34:57:14,  1.32it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36719/203307 [7:42:19<34:57:27,  1.32it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36719/203307 [7:42:19<34:57:27,  1.32it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36720/203307 [7:42:23<34:57:44,  1.32it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36720/203307 [7:42:23<34:57:44,  1.32it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36721/203307 [7:42:28<34:57:59,  1.32it/s, v_num=line, training/loss=0.0856]Epoch 0:  18%|█▊        | 36721/203307 [7:42:28<34:57:59,  1.32it/s, v_num=line, training/loss=0.079] Epoch 0:  18%|█▊        | 36722/203307 [7:42:31<34:58:12,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36722/203307 [7:42:31<34:58:12,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36723/203307 [7:42:36<34:58:28,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36723/203307 [7:42:36<34:58:28,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36724/203307 [7:42:39<34:58:41,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36724/203307 [7:42:39<34:58:41,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36725/203307 [7:42:43<34:58:54,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36725/203307 [7:42:43<34:58:54,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36726/203307 [7:42:48<34:59:10,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36726/203307 [7:42:48<34:59:10,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36727/203307 [7:42:52<34:59:23,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36727/203307 [7:42:52<34:59:23,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36728/203307 [7:42:55<34:59:36,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36728/203307 [7:42:55<34:59:36,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36729/203307 [7:43:00<34:59:52,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36729/203307 [7:43:00<34:59:52,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36730/203307 [7:43:04<35:00:05,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36730/203307 [7:43:04<35:00:05,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36731/203307 [7:43:08<35:00:21,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36731/203307 [7:43:08<35:00:21,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36732/203307 [7:43:12<35:00:34,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36732/203307 [7:43:12<35:00:34,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36733/203307 [7:43:16<35:00:47,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36733/203307 [7:43:16<35:00:47,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36734/203307 [7:43:19<35:00:59,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36734/203307 [7:43:19<35:01:00,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36735/203307 [7:43:24<35:01:15,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36735/203307 [7:43:24<35:01:15,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36736/203307 [7:43:27<35:01:28,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36736/203307 [7:43:27<35:01:28,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36737/203307 [7:43:32<35:01:44,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36737/203307 [7:43:32<35:01:44,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36738/203307 [7:43:36<35:02:00,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36738/203307 [7:43:36<35:02:00,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36739/203307 [7:43:40<35:02:13,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36739/203307 [7:43:40<35:02:13,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36740/203307 [7:43:45<35:02:29,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36740/203307 [7:43:45<35:02:29,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36741/203307 [7:43:48<35:02:42,  1.32it/s, v_num=line, training/loss=0.079]Epoch 0:  18%|█▊        | 36741/203307 [7:43:48<35:02:42,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36742/203307 [7:43:52<35:02:55,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36742/203307 [7:43:52<35:02:55,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36743/203307 [7:43:56<35:03:10,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36743/203307 [7:43:56<35:03:10,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36744/203307 [7:44:00<35:03:23,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36744/203307 [7:44:00<35:03:23,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36745/203307 [7:44:04<35:03:36,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36745/203307 [7:44:04<35:03:36,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36746/203307 [7:44:09<35:03:53,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36746/203307 [7:44:09<35:03:53,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36747/203307 [7:44:12<35:04:06,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36747/203307 [7:44:12<35:04:06,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36748/203307 [7:44:16<35:04:19,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36748/203307 [7:44:16<35:04:19,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36749/203307 [7:44:21<35:04:35,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36749/203307 [7:44:21<35:04:35,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36750/203307 [7:44:24<35:04:48,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36750/203307 [7:44:24<35:04:48,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36751/203307 [7:44:28<35:05:01,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36751/203307 [7:44:28<35:05:01,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36752/203307 [7:44:32<35:05:14,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36752/203307 [7:44:32<35:05:14,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36753/203307 [7:44:36<35:05:30,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36753/203307 [7:44:36<35:05:30,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36754/203307 [7:44:41<35:05:46,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36754/203307 [7:44:41<35:05:46,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36755/203307 [7:44:45<35:06:02,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36755/203307 [7:44:45<35:06:02,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36756/203307 [7:44:49<35:06:15,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36756/203307 [7:44:49<35:06:15,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36757/203307 [7:44:54<35:06:30,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36757/203307 [7:44:54<35:06:30,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36758/203307 [7:44:57<35:06:43,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36758/203307 [7:44:57<35:06:44,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36759/203307 [7:45:01<35:06:57,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36759/203307 [7:45:01<35:06:57,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36760/203307 [7:45:05<35:07:09,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36760/203307 [7:45:05<35:07:10,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36761/203307 [7:45:09<35:07:22,  1.32it/s, v_num=line, training/loss=0.077]Epoch 0:  18%|█▊        | 36761/203307 [7:45:09<35:07:22,  1.32it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36762/203307 [7:45:13<35:07:38,  1.32it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36762/203307 [7:45:13<35:07:38,  1.32it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36763/203307 [7:45:18<35:07:54,  1.32it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36763/203307 [7:45:18<35:07:54,  1.32it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36764/203307 [7:45:21<35:08:07,  1.32it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36764/203307 [7:45:21<35:08:07,  1.32it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36765/203307 [7:45:25<35:08:19,  1.32it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36765/203307 [7:45:25<35:08:19,  1.32it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36766/203307 [7:45:29<35:08:35,  1.32it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36766/203307 [7:45:29<35:08:35,  1.32it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36767/203307 [7:45:33<35:08:48,  1.32it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36767/203307 [7:45:33<35:08:48,  1.32it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36768/203307 [7:45:37<35:09:00,  1.32it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36768/203307 [7:45:37<35:09:01,  1.32it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36769/203307 [7:45:41<35:09:13,  1.32it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36769/203307 [7:45:41<35:09:14,  1.32it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36770/203307 [7:45:45<35:09:29,  1.32it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36770/203307 [7:45:45<35:09:29,  1.32it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36771/203307 [7:45:50<35:09:45,  1.32it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36771/203307 [7:45:50<35:09:45,  1.32it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36772/203307 [7:45:54<35:10:02,  1.32it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36772/203307 [7:45:54<35:10:02,  1.32it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36773/203307 [7:45:58<35:10:14,  1.32it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36773/203307 [7:45:58<35:10:14,  1.32it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36774/203307 [7:46:02<35:10:27,  1.32it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36774/203307 [7:46:02<35:10:27,  1.32it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36775/203307 [7:46:06<35:10:43,  1.31it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36775/203307 [7:46:06<35:10:43,  1.31it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36776/203307 [7:46:10<35:10:56,  1.31it/s, v_num=line, training/loss=0.088]Epoch 0:  18%|█▊        | 36776/203307 [7:46:10srun: Job step aborted: Waiting up to 32 seconds for job step to finish.
[2026-04-22T05:58:13.012] error: *** STEP 14495.1 ON node113 CANCELLED AT 2026-04-22T05:58:13 DUE TO TIME LIMIT ***
[2026-04-22T05:58:13.013] error: *** JOB 14495 ON node113 CANCELLED AT 2026-04-22T05:58:13 DUE TO TIME LIMIT ***