ruby-dev (Japanese) list archive (unofficial mirror)
 help / color / mirror / Atom feed
* [ruby-dev:50575] [Ruby trunk Bug#14847] `clone` can generate strange objects
       [not found] <redmine.issue-14847.20180614011424@ruby-lang.org>
@ 2018-06-14  1:14 ` ko1
  2018-06-14  4:07 ` [ruby-dev:50576] " matz
  1 sibling, 0 replies; 2+ messages in thread
From: ko1 @ 2018-06-14  1:14 UTC (permalink / raw)
  To: ruby-dev

Issue #14847 has been reported by ko1 (Koichi Sasada).

----------------------------------------
Bug #14847: `clone` can generate strange objects
https://bugs.ruby-lang.org/issues/14847

* Author: ko1 (Koichi Sasada)
* Status: Open
* Priority: Normal
* Assignee: matz (Yukihiro Matsumoto)
* Target version: 2.6
* ruby -v: 2.6
* Backport: 2.3: UNKNOWN, 2.4: UNKNOWN, 2.5: UNKNOWN
----------------------------------------
`Object#clone(obj)` を呼び出すと、

* (1) `rb_obj_alloc(rb_obj_class(obj));` で空の `obj` を作り、
* (2) `RBasic(orig)->flags` を(できるだけ)引き継ぎ
* (3) 特異クラス情報を引き継ぎ
* (4) インスタンス変数を引き継ぎ
* (5) taint 情報を引き継ぎ
* (6) `initialize_copy` を呼んで初期化

という感じで処理をするのですが、(2) の箇所で `FL_USER*` がそのまま引き継がれます。

そして、`initialize_copy` が呼ばれたとき、適切に初期化をしないと、`FL_USER*` がおかしなことになります。

下記はどれも遠藤さんが見つけてくれた例です。

```
class Array; def initialize_copy(*); end; end # 何もしない
x = [1,2,3].clone; p x #=> [false, false, false]
```

EMBED_LEN だけがコピーされ、配列の中身はコピーされない(0 初期化のまま)なので false が充填された配列になる。

```
class Array; def initialize_copy(*); end; end
x = [1,2,3,4,5,6,7][1..-2].clone
x.push(1,1,1,1,1)
#=> [BUG] Segmentation fault
```

ELTS_SHARED がコピーされるが、shared root への参照がコピーされないので SEGV する

```
class Hash; def initialize_copy(*); end; end
h = {}; h.default_proc = proc { }
h = h.clone
h[1] #=> undefined method `default_proc=' for {}:Hash (NoMethodError)
```

HASH_PROC_DEFAULT (== FL_USER2) だけがコピーされ、default_proc は nil のまま。

`initialize_copy` が責務を果たしていない、というのはその通りですが、そもそも `FL_USER*` をここでコピーするのは必要なんでしょうか。
`initialize_copy` 側で、`FL_USER*` を適切に設定するべきではないでしょうか。

少なくとも、SEGV は回避しなければいけないかと思います。

歴史的経緯を知らないので、要るんだって話かもしれませんが、とりあえず現状はなんかやばそうな気がします。




-- 
https://bugs.ruby-lang.org/

^ permalink raw reply	[flat|nested] 2+ messages in thread

* [ruby-dev:50576] [Ruby trunk Bug#14847] `clone` can generate strange objects
       [not found] <redmine.issue-14847.20180614011424@ruby-lang.org>
  2018-06-14  1:14 ` [ruby-dev:50575] [Ruby trunk Bug#14847] `clone` can generate strange objects ko1
@ 2018-06-14  4:07 ` matz
  1 sibling, 0 replies; 2+ messages in thread
From: matz @ 2018-06-14  4:07 UTC (permalink / raw)
  To: ruby-dev

Issue #14847 has been updated by matz (Yukihiro Matsumoto).


まつもと ゆきひろです

おそらくは FL_FREEZE などいくつかのフラグだけ特別にコピーするべきなんだと思います。
最近 mruby でも同様のレポートが来て、あちらでは FREEZE だけコピーすることにしました。
CRuby ではもうちょっとコピーする必要がありそうです。

----------------------------------------
Bug #14847: `clone` can generate strange objects
https://bugs.ruby-lang.org/issues/14847#change-72489

* Author: ko1 (Koichi Sasada)
* Status: Open
* Priority: Normal
* Assignee: matz (Yukihiro Matsumoto)
* Target version: 2.6
* ruby -v: 2.6
* Backport: 2.3: UNKNOWN, 2.4: UNKNOWN, 2.5: UNKNOWN
----------------------------------------
`Object#clone(obj)` を呼び出すと、

* (1) `rb_obj_alloc(rb_obj_class(obj));` で空の `obj` を作り、
* (2) `RBasic(orig)->flags` を(できるだけ)引き継ぎ
* (3) 特異クラス情報を引き継ぎ
* (4) インスタンス変数を引き継ぎ
* (5) taint 情報を引き継ぎ
* (6) `initialize_copy` を呼んで初期化

という感じで処理をするのですが、(2) の箇所で `FL_USER*` がそのまま引き継がれます。

そして、`initialize_copy` が呼ばれたとき、適切に初期化をしないと、`FL_USER*` がおかしなことになります。

下記はどれも遠藤さんが見つけてくれた例です。

```
class Array; def initialize_copy(*); end; end # 何もしない
x = [1,2,3].clone; p x #=> [false, false, false]
```

EMBED_LEN だけがコピーされ、配列の中身はコピーされない(0 初期化のまま)なので false が充填された配列になる。

```
class Array; def initialize_copy(*); end; end
x = [1,2,3,4,5,6,7][1..-2].clone
x.push(1,1,1,1,1)
#=> [BUG] Segmentation fault
```

ELTS_SHARED がコピーされるが、shared root への参照がコピーされないので SEGV する

```
class Hash; def initialize_copy(*); end; end
h = {}; h.default_proc = proc { }
h = h.clone
h[1] #=> undefined method `default_proc=' for {}:Hash (NoMethodError)
```

HASH_PROC_DEFAULT (== FL_USER2) だけがコピーされ、default_proc は nil のまま。

`initialize_copy` が責務を果たしていない、というのはその通りですが、そもそも `FL_USER*` をここでコピーするのは必要なんでしょうか。
`initialize_copy` 側で、`FL_USER*` を適切に設定するべきではないでしょうか。

少なくとも、SEGV は回避しなければいけないかと思います。

歴史的経緯を知らないので、要るんだって話かもしれませんが、とりあえず現状はなんかやばそうな気がします。




-- 
https://bugs.ruby-lang.org/

^ permalink raw reply	[flat|nested] 2+ messages in thread

end of thread, other threads:[~2018-06-14  4:07 UTC | newest]

Thread overview: 2+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
     [not found] <redmine.issue-14847.20180614011424@ruby-lang.org>
2018-06-14  1:14 ` [ruby-dev:50575] [Ruby trunk Bug#14847] `clone` can generate strange objects ko1
2018-06-14  4:07 ` [ruby-dev:50576] " matz

This is a public inbox, see mirroring instructions
for how to clone and mirror all data and code used for this inbox;
as well as URLs for read-only IMAP folder(s) and NNTP newsgroup(s).